在ARM体系结构中,ARM指令集中的指令是32位指令,其执行效率很高。对于存储系统数据总线为16位的应用系统,ARM体系提供了Thumb指令集。Thumb指令集是ARM指令集的一个子集,它比ARM指令集有更高的代码密度(一个可执行的程序在内存中所占的空间)。在存储系统受限的嵌入式系统中,比如移动电话、PDA等,代码密度是非常重要的,同时,成本压力也会限制存储器的大小、数据宽度和速度。在ARM体系的T变种(T variable)的版本中,同时支持ARM指令集和Thumb指令集,而且遵循一定的调用规则时,Thumb子程序和ARM子程序可以相互调用。
11.1 Thumb指令的特点及实现
Thumb指令集把32位ARM指令集的一个子集编码为一个16位的指令集。在16位外部数据总线宽度下,ARM处理器上使用Thumb指令的性能要比使用ARM指令的性能更好;而在32位外部数据总线宽度下,使用Thumb指令的性能要比使用ARM指令的性能差。因此,Thumb指令多用于存储器受限的一些系统中。Thumb指令集并没有改变ARM系统底层的程序设计模型,只是在该模型上增加了一些限制条件。Thumb指令集中的数据处理指令的操作数仍然是32位,指令寻址地址也是32位的。
代码密度是Thumb指令集的一个主要优势。平均而言,对于同一个程序,使用Thumb指令实现所需的存储空间,要比等效的ARM指令实现少30%左右。下面的例子代码,使用ARM指令和Thumb指令实现相同的除法操作。从例子中可以看出,虽然Thumb指令的实现使用了更多的指令,但是它占用的总的存储空间却比较小。
【例11.1】使用ARM指令实现除法运算
MOV r3,#0
loop
SUB r0,r0,r1
ADDGE r3,r3,#1
BGE loop
ADD r2,r0,r1
【例11.1】中r0为被除数,r1存放除数,r2和r3分别存放余数和商。完成整个除法运算使用了5条指令,每一条指令所占的字节数为4,所以实现一个除法运算,ARM指令所占有的字节数为20。
【例11.2】使用Thumb指令实现除法运算
MOV r3,#0
loop
ADD r3,#1
SUB r0,r1
BGE loop
SUB r3,#1
ADD r2,r0,r1
【例11.2】使用Thumb指令完成了和【例11.1】完全相同的功能。Thumb指令虽然使用了6条指令,但其每条指令占用2个字节,所以总的字节数为6×2=12,小于ARM指令所占用的20个字节。
Thumb指令是ARM指令的一个受限子集,在Thumb状态下,不能直接访问所有的处理器寄存器,只有r0~r7是可以被任意访问的,在Thumb状态下使用该8个寄存器和在ARM状态下使用没有区别。寄存器r8~r12只能通过MOV、ADD或CMP指令访问。CMP指令和所有操作r0~r7的数据处理指令都会影响CPSR中的条件标志位。一些Thumb指令还使用到了程序计数器PC(r15),链接地址寄存器LR(r14)和堆栈指针寄存器SP(r13)。在Thumb状态下,读取r15寄存器时,bit[0]值为0,bit [31∶1]包含了PC的值。当对r15进行写入时,bit[0]被忽略,bit[31∶1]被设置成当前程序计数器的值。
表11.1列出了Thumb状态下,各寄存器的使用情况。
表11.1 Thumb寄存器的使用
寄 存 器 |
访 问 |
r0~r7 |
完全访问 |
r8~r12 |
只能通过MOV、ADD及CMP访问 |
r13 |
限制访问 |
r14 |
限制访问 |
r15 |
限制访问 |
CPSR |
间接访问 |
SPSR |
不能访问 |
从表11.1可以看出,Thumb状态下不能直接访问CPSR和SPSR。也就是没有和MSR和MRS等价的指令。为了改变CPSR和SPSR的值,必须使处理器状态切换到ARM状态,再使用指令MSR和MRS来实现。同样,在Thumb状态下也没有协处理器访问指令,要访问协处理器寄存器来配置cache和进行内存管理,也必须使处理器切换到ARM状态。
注意 |
Thumb状态下,对CPSR的条件标准位控制由算术和逻辑操作设置并控制条件转移。 |