我对汇编很新,但是我试图学习如何编写将作为引导加载程序代码运行的汇编代码;所以独立于任何其他操作系统,如Linux或Windows . 在阅读this page和其他一些x86指令集列表之后,我想出了一些汇编代码,它应该在屏幕上打印10个A然后是1个B.
BITS 16
start:
mov ax, 07C0h ; Set up 4K stack space after this bootloader
add ax, 288 ; (4096 + 512) / 16 bytes per paragraph
mov ss, ax
mov sp, 4096
mov ax, 07C0h ; Set data segment to where we're loaded
mov ds, ax
mov cl, 10 ; Use this register as our loop counter
mov ah, 0Eh ; This register holds our BIOS instruction
.repeat:
mov al, 41h ; Put ASCII 'A' into this register
int 10h ; Execute our BIOS print instruction
cmp cl, 0 ; Find out if we've reached the end of our loop
dec cl ; Decrement our loop counter
jnz .repeat ; Jump back to the beginning of our loop
jmp .done ; Finish the program when our loop is done
.done:
mov al, 42h ; Put ASCII 'B' into this register
int 10h ; Execute BIOS print instruction
ret
times 510-($-$$) db 0 ; Pad remainder of boot sector with 0s
dw 0xAA55
所以输出应该如下所示:
AAAAAAAAAAB
我使用在Windows 10 Ubuntu Bash程序上运行的nasm汇编程序汇编代码 . 在生成.bin文件之后,我使用十六进制编辑器打开它 . 我使用相同的十六进制编辑器将该.bin文件的内容复制到闪存驱动器的前512个字节中 . 将程序写入闪存驱动器后,我将其断开并将其插入装有Intel Core i3-7100的计算机 . 在启动时,我选择了我的USB闪存驱动器作为启动设备,只是为了得到以下输出:
A
在改变程序中的各种东西之后,我终于感到沮丧,并在另一台计算机上尝试了该程序 . 另一台电脑是i5-2520m的笔记本电脑 . 我遵循了前面提到的相同过程 . 果然,它给了我预期的输出:
AAAAAAAAAAB
我立即在i3的原始计算机上尝试过它,但它仍然没有用 .
所以我的问题是:为什么我的程序使用一个x86处理器而不是另一个?它们都支持x86指令集 . 是什么赋予了?
Solution:
好的,我在下面的回答中,你会找到一个解决方案来解决我的问题,以及BIOS寻找BPB的另一个问题 .
这是我的代码的问题:我正在将程序写入我的闪存驱动器的第一个字节 . 这些字节被加载到内存中,但是一些BIOS中断正在使用这些字节 . 所以我的程序被BIOS覆盖了 . 为防止这种情况,您可以添加BPB描述,如下所示 . 如果你的BIOS工作方式与我的相同,它只会覆盖内存中的BPB,而不会覆盖你的程序 . 或者,您可以将以下代码添加到程序的顶部:
jmp start
resb 0x50
start:
;enter code here
此代码(由Ross Ridge提供)将您的程序推送到内存位置0x50(偏离0x7c00),以防止它在执行期间被BIOS覆盖 .
还要记住,每当调用任何子例程时,您使用的寄存器的值都可能被覆盖 . 确保在调用子例程之前使用 push
, pop
或将值保存到内存中 . 请看Martin Rosenau在下面的回答,了解更多相关信息 .
感谢所有回复我问题的人 . 我现在对这种低级别的东西如何运作有了更好的理解 .
2 回答
这可能会成为关于这个主题的规范答案 .
真正的硬件/ USB /笔记本电脑问题
如果您尝试使用USB在真实硬件上启动,那么即使您在BOCHS和QEMU中工作,也可能会遇到另一个问题 . 如果您的BIOS设置为进行USB FDD仿真(而不是USB HDD或其他),则可能需要在引导加载程序的开头添加BIOS Parameter Block(BPB) . 你可以像这样创建一个假的:
如果您只需要默认的0x0000,请将
ORG
指令调整为您需要的或省略它 .如果您要修改代码以使Unix / Linux上的布局
file
命令可能能够转储它认为构成磁盘映像中MBR的BPB数据 . 运行命令file disk.img
,您可能会得到此输出:如何修改本课程中的代码
在这个OP原始代码的情况下,它可能已被修改为如下所示:
其他建议
正如已经指出的那样 - 你不能
ret
结束引导加载程序 . 您可以将其置于无限循环中,或使用cli
后跟hlt
暂停处理器 .如果您在堆栈上分配大量数据或开始写入引导加载程序的512字节以外的数据,则应将自己的堆栈指针(SS:SP)设置为不会干扰您自己的代码的内存区域 . 此问题中的原始代码确实设置了堆栈指针 . 这是对阅读此Q / A的其他人的一般观察 . 我有更多的信息在我的Stackoverflow答案中包含General Bootloader Tips .
测试代码以查看您的BIOS是否覆盖了BPB
如果您想知道BIOS是否可能覆盖BPB中的数据并确定它写入了什么值,您可以使用此引导加载程序代码来转储BPB,因为引导程序在控制转移到它之后会看到它 . 在正常情况下,前3个字节应为
EB 3C 90
,后跟一系列AA
. 任何非AA
的值都可能被BIOS覆盖 . 此代码在NASM中,可以使用nasm -f bin boot.asm -o boot.bin
组装到引导加载程序中对于在将控制权转移到引导加载程序代码之前未更新BPB的任何BIOS,输出应如下所示:
它不是处理器而是BIOS:
int
指令实际上是call
指令的特殊变体 . 该指令调用一些子例程(通常用汇编语言编写) .(您甚至可以用自己的子例程替换该子例程 - 例如,实际上由MS-DOS完成 . )
在两台计算机上,您有两个不同的BIOS版本(甚至是供应商),这意味着
int 10h
指令调用的子程序已由不同的程序员编写,因此并不完全相同 .我怀疑这里的问题是第一台计算机上的
int 10h
调用的子程序在第二台计算机上的例程没有保存寄存器值 .换一种说法:
在第一台计算机上,
int 10h
调用的例程可能如下所示:...所以在
int 10h
调用之后ah
寄存器不再包含值0Eh
,甚至可能是cl
寄存器被修改(这将以无限循环结束) .为了避免这个问题,你可以使用
push
保存cl
寄存器(你必须保存整个cx
寄存器)并在int
指令后恢复它 . 您还必须在每次调用int 10h
子例程之前设置ah
寄存器的值,因为从那时起您无法确定它是否未被修改:请考虑一下Peter Cordes的评论:
ret
指令如何工作以及它与sp
和ss
寄存器有什么关系?这里的
ret
指令肯定不会达到您的预期!在软盘上,引导扇区通常包含以下代码:
int 19h
完全符合您对ret
指令的期望 .但是,BIOS将再次启动计算机,这意味着它将从USB记忆棒加载代码并再次执行 .
你会得到以下结果:
因此插入了
int 16h
指令 . 当ax
寄存器的值为0之前,这将等待用户按下键盘上的键,然后再调用int 16h
子例程 .或者,您可以简单地添加无限循环:
当这两个指令之间发生中断时:
...
sp
和ss
寄存器的组合不代表值的"valid"表示 .如果你运气不好,中断会将数据写入某个你不想要的内存 . 它甚至可能会覆盖你的程序!
因此,通常在修改
ss
寄存器时锁定中断: