从MCInsts获取“实际”寄存器（x86）-Java 学习之路

我正在使用llvm-mc，目的是制作一个相对聪明的反汇编程序（识别和跟踪本地人，轻松跟踪分支等），其中一部分是创建反汇编指令的字符串表示 .

当我开始这个时，我希望我能够相对容易地识别 MCInst 使用的寄存器和值，然后用我可以轻松处理的另一个表示法 . 然而，经过一些调查，我意识到用指令的文本表示显示的操作数与实际存在于 MCInst 对象中的操作数之间的相关性相当低 . 以下是一些示例（英特尔语法）：

将11587作为32位立即移动到 eax 将使用 MOV32ri 操作码完成 . 文字表示将是 mov eax, 11587 . 相应的 MCInst 将有两个操作数，一个寄存器和一个立即数 . 这适合我 . 这很棒 .
将 11587 添加到 eax 将使用 ADD32ri 操作码完成 . 文字表示将是 add eax, 11587 . 但是，这次，相应的 MCInst 有三个操作数： eax 有两次，而最后是立即数 . 这不是很好 . 我可以假设这是降级过程的一个工件， eax 的第一个实例是目标寄存器，第二个实例是源（即使x86不区分两者），我可以破解在那附近 .
使用 MOV32ao32 操作码将32位 eip -relative值移动到 eax . 文字表示将是 mov eax, dword ptr [11587] . 在这种情况下， MCInst 甚至没有 eax 的操作数，它只能从操作码名称中的操作数类型推断出来 . 我也可以解决这个问题，但事情越来越少，我只测试了x86支持的1300个不同的指令 .

显然，为了显示文本，我可以用 MCInstPrinter 获得文本表示，但是那里显示的内容和 MCInst 之间的映射仍然很混乱 .

是否有一种直接的方法来判断哪些操作数出现在指令的文本表示中？

2 回答