LDR指令和LDR伪指令详解
ARM32位指令的构成
ARM是RISC结构,数据从内存到CPU之间的移动只能通过LDR/STR指令来完成。 32bit = 指令码 + 数据。所以32bit的一条指令不可能表示再带一个32bit的数据,实际只有其中的12bit来表示立即数,其中4bit表示移位的位数(循环右移,且数值x2),8bit用来表示要移位的一个基数。这就产生了非法立即数和合法立即数的问题,经过移位操作,不为零的部分不能用8bit表示的数就是非法立即数。ldr伪指令就是用来解决非法立即数问题的。
ldr指令和ldr伪指令的使用区别:
ldr r0, =0xFFF0 @伪指令
ldr r0, 0xFFFF @指令
直观的区别就是ldr伪指令使用时,后面的数据前会有"=",实际使用时,大部分都使用伪指令,这样就不用考虑合法和非法立即数的问题。在编译的时候,编译器会将ldr伪指令进行替换,用文字池的方式来解决非法立即数的问题。文字池就是划分出一段地址空间用来存放常量或者地址,需要时用基址+变址的方式去取数据,这样就不用受到合法立即数的限制,可以表示32bit的数据。例如:
汇编源代码:
_start:
ldr r0, =0x11111111
经过反汇编:
00000000 <_start>:
0: e59f009c ldr r0, [pc, #156] ; a4 <delay_loop+0x10>
·
·
·
98: e1520003 cmp r2, r3
9c: 1afffffc bne 94 <delay_loop>
a0: e1a0f00e mov pc, lr
a4: 11111111 tstne r1, r1, lsl r1
分析:
通过反汇编可以看到,ldr伪指令被一条寄存器基址变址指令给替代了。其中以pc为基址,偏移156个字节(16进制是0x9c)。这条指令的作用是将内存地址"pc + 156"开头的4个字节读取到r0中,此时pc的值等于当前执行指令的地址+8(因为流水线的原因),因此pc + 156 = 0xa4,而0xa4地址处存的值刚好是0x11111111。这样就完成了将0x11111111加载到r0。
补充1:
RAM处理器存在流水线,目前已经有十几级流水线,但是ARM为了兼容,无论Soc有多少级流水线,PC的值都是等于当前指令地址 + 8。PC = 当前指令地址 + 8, 记住就行。
补充2:
汇编语言ldr伪指令
伪指令是用来自动拆分代码值的,会把一条语句拆分成多条语句。
示例:
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
|
/* 汇编点亮一个 LED 灯 */
.text
.global _start
_start:
ldr r1, =0x56000050
ldr r0, =0x100 /* 相当于 mov r0, #0x100 */
str r0, [r1]
ldr r1, =0x56000054
ldr r0, =0 /* mov r0, #0 */
str r0, [r1]
halt:
b halt
|
ldr r1, =0x56000054就是一条伪指令,假设我们想把56000054值给r1寄存器,可以用 mov r1, #56000050 ,
但是长度超出了mov 能接收的长度,就要分为高低字节去发送,但是在某些时候我们还要去看开放文档,才能知道
或者没有开发文档,那就让伪指令自己去判断。
|