11.10 ARM和Thumb的混合编程
11.10.1 互交工作基础
Thumb以其较高的代码密度和在窄存储器上的性能,使得它在很多系统中得到广泛应用。但在很多情况下,还是不得不使用ARM指令,这是因为:
① ARM代码比Thumb代码有更快的执行速度;
② ARM处理器的一些特定功能必须由ARM指令实现,其中包括PSR指令、协处理器指令;
③ 异常发生时,处理器自动进入ARM状态,如果异常处理程序需要使用Thumb指令也必须通用一个ARM程序头(ARM assembler header)。
基于以上原因,即使程序需要由Thumb代码实现,也必须通过ARM-Thumb互交(ARM-Thumb interworking)进入Thumb状态。
ARM-Thumb互交是指对汇编语言和C/C++语言的ARM和Thumb代码进行连接的方法,它进行两种状态(ARM和Thumb状态)间的切换。在进行这种切换时,有时需使用额外的代码,这些代码被称为Veneer。AAPCS定义了ARM和Thumb过程调用的标准。
从一个ARM例程调用一个Thumb例程,内核必须进行状态切换。状态的变化由CPSR的T位来显示。在跳转到一个例程时BX指令可用于ARM和Thumb状态切换,具体用法如下。
在Thumb状态调用ARM例程时,采用:
BX Rn;
在ARM状态调用Thumb例程时,采用:
BX{cond} Rn;
其中,Rn可以是r0~r15中的任意寄存器。
这种带状态切换的跳转指令BX,将寄存器Rn的内容拷贝到程序计数器寄存器PC,因此可以实现4G空间的跳转。指令根据寄存器Rn的bit[0]来决定处理器是否进行状态切换,详细内容参见ARM指令一节。
下面是一段ARM程序,该程序调用虚拟的SWI_writeC子程序从存储器的固定地址取出字符串“hello world”并输出。
AREA Hello,CODE,READONLY
SWI_WriteC EQU &0 ;软中断调用参数
SWI_Exit EQU &11 ;程序退出软中断调用参数
ENTRY
START ADR r1,TEXT ;取字符串地址
LOOP LDRB r0,[r1],#1 ;取下一字节内容
CMP r0,#0 ;判断是否为字符串尾
SWINE SWI_WriteC ;软中断调用打印字符
BEN LOOP ;循环
SWI SWI_Exit ;软中断调用退出程序执行
TEXT = “Hello World”,&0a,&0d,0
END
下面的代码将上面的ARM代码转换成等价的Thumb代码。
AREA HelloW_Thumb,CODE,READONLY
SWI_WriteC EQU &0 ;软中断调用参数
SWI_Exit EQU &11 ;程序退出软中断调用参数
ENTRY ;程序入口点
CODE32 进入ARM状态
ADR r0, START+1 ;取得Thumb代码入口地址
BX r0 ;进入Thumb代码
CODE16 ;Thumb代码入口点
START ADR r1, TEXT ;r1 -> "Hello World"
LOOP LDRB r0, [r1] ;取下一字节内容
ADD r1, r1, #1 ;地址指针加1 **T
CMP r0, #0 ;判断是否为字符串尾
BEQ DONE ;完成? **T
SWI SWI_WriteC ;如果不是字符串尾
B LOOP ;继续循环
DONE SWI SWI_Exit ;程序退出
ALIGN ;字对齐
TEXT DATA
"Hello World",&0a,&0d,&00
END
上例中,ARM代码到Thumb代码转换过程中新增加的指令用“**T”标注。
在实现ARM代码和Thumb代码转换时,大部分的ARM指令有等价的Thumb指令,只有少数指令没有。如加载字节指令(LDR)不支持自动变址,软中断指令不能条件执行。
在编写Thumb代码时要注意以下几点。
① 汇编器需要知道什么时候产生ARM代码、什么时候产生Thumb代码,程序中使用CODE32和CODE16伪操作提供给编译器这些信息。
② 由于处理器上电执行是在ARM状态下完成的,所以要使用Thumb指令必须由ARM指令调用Thumb指令,这一过程是通过“BX LR”指令来实现的。需要注意的是,在使用“BX LR”指令前,要对寄存器LR做正确的初始化。
③ 在ARM和Thumb混合编程时,常使用ALIGN伪操作保证内存地址对齐。
11.10.2 互交子程序
编写ARM/Thumb互交代码时,下面两点需要注意。
① 对于C/C++子程序而言,只要在编译时指定--apcs/interwork选项,汇编器会生成合适的返回代码,使得程序返回到和调用程序相同的状态。
② 在汇编语言子程序中,用户必须自己编写相应的返回代码,使得程序返回到和调用程序相同的状态。
如果目标代码包含以下内容,应该在编译或汇编时使用--apcs/interwork选项使处理器能够在ARM和Thumb代码间进行正确的切换,这种情况包含以下4种。
① 需要返回到ARM状态的Thumb子程序。
② 需要返回到Thumb状态的ARM子程序。
③ 间接调用ARM子程序的Thumb子程序。
④ 间接调用Thumb子程序的ARM子程序。
如果在程序连接阶段,连接器发现ARM子程序和Thumb子程序间存在相互调用,而源文件在编译时没有使用--apcs/interwork选项,则连接器将报告以下错误。
Error: L6239E: Cannot call ARM symbol 'arm_function' in non-interworking object
armsub.o from THUMB code in thumbmain.o(.text)
其中,“arm_function”为需要进行状态切换的子程序名。
在这种情况下,用户必须使用--apcs/interwork选项重新对源文件进行编译。
但在下面两种情况下,不必指定--apcs/interwork选项。
① 在Thumb状态下,发生异常中断时,处理器自动切换到ARM状态,这时不需要添加状态切换代码。
② 当异常发生在Thumb状态时,从异常返回不需要添加状态切换的Veneer代码。
1.使用汇编语言实现互交
对于汇编程序来说,可以有两种方法来实现程序状态的切换。第一种方法是利用连接器提供的交互子程序Veneer来实现程序状态的切换,这时用户可以使用指令BL来调用子程序;另一种方法是用户自己编写状态切换的程序。
在ARMv4版本及其以前的版本中,可以使用BX指令实现程序状态的切换。
从ARMv5版本开始,下面的指令也可以用来实现程序的状态切换。
· BX(Branch and eXchange)
· BLX、LDR、LDM和POP
下面的两个伪操作用来区分源程序中的ARM代码和Thumb代码。
· CODE16
· CODE32
下面简单介绍用于状态切换的指令和伪操作,更详细的信息请分别参见相关章节。
(1)BX指令
ARM状态下的BX指令,使程序跳转到指令中指定的参数Rm指定的地址执行程序,Rm的第0位拷贝到CPSR中T位,位[31∶1]移入PC。若Rm的bit[0]为1,则跳转时自动将CPSR中的标志位T置位,即把目标地址的代码解释为Thumb代码;若Rm的位bit[0]为0,则跳转时自动将CPSR中的标志位T复位,即把目标地址代码解释为ARM代码。指令的语法格式如下。
BX{<cond>} <Rm>
① <cond>
为指令编码中的条件域。它指示指令在什么条件下执行。当<cond>忽略时,指令为无条件执行(cond=AL(Alway))。
② <Rm>
包含跳转指令的目标地址。如果Rm的bit[0]=0,目标地址处指令为ARM指令;如果Rm的bit[0]=1,目标地址处指令为Thumb指令。
指令操作的伪代码。
指令操作的伪代码如下面程序段所示。
If conditionPassed{cond} then
T Flag=Rm[0]
PC = Rm AND 0xfffffffe
Thumb状态下的BX指令,用于ARM和Thumb代码间的相互调用。
指令的语法格式。
BX <Rm>
其中<Rm>为目标地址寄存器,包含程序的跳转地址。BX指令的目标地址寄存器可以是r0~r15中的任意寄存器。
注意 |
如果Rm[1:0]=0b10,不满足ARM指令的内存对齐方式。指令的执行结果不可预知。如果该指令使用r15作为目标寄存器,其操作方式和使用其他寄存器相同。 |
指令操作的伪代码如下所示。
T Flag=Rm[0]
PC=Rm[31:1]<<1
ARM指令集中的BX指令和Thumb指令集中的BX指令相差较大,它们分别为不同方向的跳转。当r15作为目的寄存器使用时,要特别注意该指令在两个指令集中的区别。
(2)BLX指令
ARM状态下的BLX指令使用一个寄存器中的绝对地址或标号,用于使程序跳转到Thumb状态或从Thumb状态返回,该指令用分支寄存器的最低位来更新CPSR中的T位,并将返回地址写入到连接寄存器LR中。
指令的语法格式如下所示:
① BLX <target_addr>
② BLX{<cond>} <Rm>
第一种格式中,转移目标按下述方法计算。将指令中指定的24位偏移量进行符号扩展,左移两位形成字偏移量,然后将其累加进程序计数器PC中。这时,程序计数器的内容为BX指令地址加8字节。位H(bit[24])也加到结果地址的第一位(bit[1]),使目标地址为半字地址,以执行接下来的Thumb指令。计算偏移量的工作一般由ARM汇编器来完成。这种形式的跳转指令只能实现±32MB空间的跳转。
第二种格式中,寄存器Rm指定转移目标,Rm的第0位拷贝到CPSR中的T位,bit[31:0]移入PC。
· 如果Rm的bit[0]=1,则跳转时自动将CPSR中的标志位T置位,即把目标地址的代码解释为Thumb代码。
· 如果Rm的bit[0]=0,则跳转时自动将CPSR中的标志位T复位,即把目标地址的代码解释为ARM代码。
指令操作的伪代码如下面程序段所示。
第一种格式BLX指令。
LR=address of the instruction after the BLX instruction
T Flag=1
PC=PC + PC = PC + (SignExtend(signed_immed_24)<<2) + (H<<1)
第二种格式BLX指令。
If ConditionPass{cond} then
LR = address of the instruction after the branch instruftion
T Flag=Rm[0]
PC=Rm AND 0xfffffffe
Thumb状态下带返回链接的跳转指令BLX(1)提供了一种在Thumb状态下无条件调用ARM子程序的方法,当从子程序返回时,通常使用下面的方式之一:
· BX LR
· 加载PC的LDR或LDM指令。
BLX指令不可条件执行,可以实现在大约±4MB的地址空间范围内跳转,实现方法是将一条BLX指令编译成两条16位的Thumb指令,从而实现上述跳转。对编译后的两条指令说明如下。
① H=10的跳转指令。该跳转包含跳转偏移量的高位部分。
② H=01的跳转指令。该跳转包含跳转偏移量的低位部分。
指令的语法格式
BL <target_address>
<target_address>
指定程序跳转的目标地址。指令通过下面的方法计算目标地址。
· 将H=10的BL指令的offset_11域左移12位。
· 将结果符号扩展为32位。
· 将得到的值加到PC寄存器中。
· 与H=11的BL指令的offset_11域相加。
因此BL指令可以实现在大约±4MB的地址空间范围内跳转。
指令操作的伪代码为:
if H==10 then
LR=PC+(SignExtend(offset_11)<<12)
Else if H==11 then
PC=LR+(offset_11<<11)
LR=(address of next instruction)|1
Else if H==01 then
PC=(LR+(offset_11<<1)) AND 0xFFFFFFFC
LR=(address of next instruction)|1
Else if H==01 then
PC=(LR+(offset_11<<1)) AND 0Xfffffffc
LR=(address of next instruction)|1
T Flag=0
另外Thumb状态下包含另一种格式的BLX指令,该BLX(2)指令用于ARM和Thumb子程序间的相互调用。程序状态字的T标志位根据目的寄存器的bit[0]位而改变。
指令的语法格式为:
BLX <Rm>
其中<Rm>为目标地址寄存器,r0~r14寄存器均可以作为目标地址寄存器。
注意 |
如果在此指令中使用r15作为目的寄存器,指令的执行结果不可预知。 |
此指令只在ARMv5版本以上指令集中被支持。
指令操作的伪代码为:
LR = (address of the instruction after this BLX)|1
T Flag = Rm[0]
PC = Rm[31:1]<<1
(3)汇编伪指令
汇编编译器可以产生ARM代码也可以产生Thumb代码。使用--thumb或--16选项指示编译器产生Thumb代码。由于所有支持Thumb代码的ARM处理器都从ARM状态开始执行,所以必须人为地使用BX或BLX指令,使处理器状态切换到Thumb状态并使用下面的伪操作使编译器产生Thumb代码。
· CODE16
· CODE32
CODE32伪操作指示汇编器后面的指令为32位的ARM指令。
ARM和CODE32伪操作的意义相同。
当汇编器对源程序进行编译时,如果需要,将会在程序中插入空指令,以保证内存单元字对齐。
语法格式如下。
ARM
CODE32
使用在同时包含ARM指令和Thumb指令的源文件中。当需要从ARM指令序列切换到Thumb指令序列时,使用伪操作ARM(或CODE32);当需要从Thumb指令序列切换到ARM指令序列时使用Thumb伪操作。ARM(或CODE32)伪操作只是指示汇编器后面的指令类型是ARM指令。该伪操作本身并不进行程序状态的切换,要进行状态切换,可以使用BX指令操作。
CODE16伪指令通知编译器,其后的指令序列为16位的Thumb指令。
语法格式如下。
CODE16
若在汇编源程序中同时包含ARM指令和Thumb指令时,可用CODE16伪指令通知编译器其后的指令序列为16位的Thumb指令。
(4)编程实例
PRESERVE8
AREA AddReg,CODE,READONLY ;段名为AddReg,属性为READONLY
ENTRY ;程序入口
; SECTION 1
main
ADR r0, ThumbProg + 1 ;确定跳转地址
;并将bit[0]置1
;使程序切换到thumb状态
BX r0 ;程序跳转并执行状态切换
; SECTION 2
CODE16 ;Thumb代码指示伪操作
ThumbProg
MOV r2, #2 ;r2 = 2
MOV r3, #3 ;r2 = 3
ADD r2, r2, r3 ;r2 = r2 + r3
ADR r0, ARMProg
BX r0 ;程序跳转并执行状态切换
; SECTION 3
CODE32 ;ARM代码指示伪操作
ARMProg
MOV r4, #4
MOV r5, #5
ADD r4, r4, r5
; SECTION 4
stop MOV r0, #0x18 ;设置semihosting软中断号
LDR r1, =0x20026 ;ADP_Stopped_ApplicationExit
SWI 0x123456 ;ARM semihosting SWI软中断调用
END ;文件结束
上面的例子分为4部分,通过下面的步骤编译和运行。
① 使用文本编辑器,如notepad,输入上面的代码,并保存成文件addreg.s;
② 在命令行中键入汇编命令 armasm –g addreg.s;
③ 在命令行中键入链接命令 armlink addreg.o -o addreg;
④ 使用调试器(Debugger)(如,RealView Debuggeror AXD)运行映像文件。可以使用单步执行,观察代码在Thumb状态下的执行。
注意 |
Thumb代码的地址标号如果用伪操作export声明为“外部的”,则连接器会自动调整该地址标号使其bit[0]等于1;如果该地址标号没有被声明为“外部的”,则使用者必须手动地对标号进行调整,如上例中的ThumProg+1。 |
(5)ARMv5架构下的状态切换
在ARMv5体系结构的指令集中,增加了下面两条指令用于ARM和Thumb代码互交。
· BLX address
该指令跳转到指令中指定的地址处执行程序并进行程序状态切换,该地址是“PC相关的”,地址范围为±32MB(ARM状态)或±4MB(Thumb状态)。
· BLX register
在该中格式的跳转指令中寄存器Rm指定转移目标,Rm的第0位拷贝到CPSR中的T位,bit[31:0]移入PC。
使用上面两条指令,在执行程序跳转之前,处理器自动将返回连接寄存器LR的bit[0]位更新为CPSR寄存器的T位,所以无论处理器状态是否发生变化,程序都能正确返回。
当使用LDR、LDM及POP指令向PC寄存器中赋值时,寄存器CPSR中的Thumb位将被设置成PC寄存器的bit[0],这时就实现了程序状态的切换。这种方法在子程序的返回时非常有效,同样的指令可以根据需要返回到ARM状态或Thumb状态。
连接器在对目标代码进行连续时,将代码中的地址标号分为3类。
· ARM指令地址标号。
· Thumb指令地址标号。
· 数据(Data)地址标号。
当连接器重定位Thumb代码中的地址标号时,地址标号的bit[0]位将被自动设置为1。这就意味着跳转指令(这些指令包括BX、BLX和LDR)可以根据目标地址正确的进行状态切换。
注意 |
上面提到的连接器自动设置目的地址的行为,只有在ARMv5及其以上版本中支持。 |
2.使用C和C++语言实现互交
对于不同的C和C++源程序,可以有些程序中包含ARM指令,有些程序中包含Thumb指令,这些程序可以相互调用,只是在编译这些程序时指定--apcs/interwork选项。当使用了--apcs/interwork选项,编译器会自动进行一些相应处理;连接器在检测到程序中存在互交工作时,会生成一些用于程序状态切换的代码。
(1)代码编译
可以使用下面的指令,将C或C++程序编译为可以执行互交的目标代码。
armcc --c90 --thumb --apcs /interwork
armcc --c90 --arm --apcs /interwork
armcc --cpp --thumb --apcs /interwork
armcc --cpp --arm --apcs /interwork
注意 |
--cpp是C++文件(文件后缀为.cpp)默认的编译选项。 |
使用--apcs/interwork选项对文件进行编译时,编译器会进行如下处理。
· 对于叶子程序(leaf function,即程序中没有其他子程序调用的程序),编译器将程序中的“MOV PC,LR”指令替换成“BX LR”指令,因为“MOV PC”指令不能进行状态切换。
· 对于非叶子程序,要进行一系列的指令替换,如:
POP {r4,r5,pc}
替换为:
POP {r4,r5}
POP {r3}
BX r3
下面的例子显示了一段带子程序调用的C语言程序,使用--apcs/interwork选项进行编译时,对代码产生的影响。
C语言源程序。
Void func(void)
{
….
Sub()
..
}
使用armcc --apcs/interwork选项进行编译产生结果如下。
Func
STMFD sp!,{r4-r7,lr}
….
BL sub
….
LDMFD sp!, {r4-r7,lr}
BX lr
使用tcc --apcs/interwork选项进行编译产生结果如下。
PUSH {r4-r7,lr}
….
BL sub
….
POP {r4-r7}
POP {r3}
BX
(2)C语言的互交实例
下面的例子显示了一个Thumb状态下的代码通过互交调用ARM子程序;而后又在ARM子程序中调用Thumb指令集的库函数printf()。
/*********************
* thumbmain.c *
**********************/
#include <stdio.h>
extern void arm_function(void);
int main(void)
{
printf("Hello from Thumb Worldn");
arm_function();
printf("And goodbye from Thumb Worldn");
return (0);
}
/*********************
* armsub.c *
**********************/
#include <stdio.h>
void arm_function(void)
{
printf("Hello and Goodbye from ARM worldn");
}
使用下面的命令对程序进行编译连接。
① 编译生成带互交的Thumb代码。
armcc --thumb -c -g --apcs /interwork -o thumbmain.o thumbmain.c
② 编译生成带互交的ARM代码。
armcc -c -g --apcs /interwork -o armsub.o armsub.c
③ 连接目标文件。
armlink thumbmain.o armsub.o -o thumbtoarm.axf
另外,可以使用--info选项使连接器输出由于互交所增加的代码大小。
armlink armsub.o thumbmain.o -o thumbtoarm.axf --info veneers
输出信息如下所示。
Adding Veneers to the image
Adding TA veneer(4 bytes, Inline) for call to'arm_function'from thumbmain.o(.text).
Adding AT veneer (8 bytes, Inline) for call to '__0printf' from armsub.o(.text).
Adding AT veneer (8 bytes, Inline) for call to '__rt_lib_init' from kernel.o(.text).
Adding AT veneer (12 bytes,Long) for call to'__rt_lib_shutdown'from kernel.o(.text).
Adding TA veneer (4 bytes, Inline) for call to '__rt_memclr_w' from stdio.o(.text).
Adding TA veneer (4 bytes, Inline) for call to '__rt_raise' from stdio.o(.text).
Adding TA veneer (8 bytes, Short) for call to '__rt_exit' from exit.o(.text).
Adding TA veneer (4 bytes, Inline) for call to '__user_libspace' from free.o(.text).
Adding TA veneer (4 bytes, Inline) for call to '_fp_init' from lib_init.o(.text).
Adding TA veneer (4 bytes, Inline) for call to '__heap_extend' from malloc.o(.text).
Adding AT veneer (8 bytes, Inline) for call to '__raise' from rt_raise.o(.text).
Adding TA veneer (4 bytes, Inline) for call to '__rt_errno_addr' from ftell.o(.text).
12 Veneer(s) (total 72 bytes) added to the image.
(3)Thumb状态下的功能指针
任何指向Thumb函数(由Thumb指令完成的功能函数并且其返回状态也为Thumb状态)的指针,其最低有效位(LSB)必为1。
当重定位Thumb代码中的地址标号时,连接器将自动设置地址的最低有效位。如果在程序中使用绝对地址,连接器将无法完成该设置。因此,如果在Thumb代码中使用绝对地址时,必须手工设置为其地址加1。
下面的例子显示了Thumb代码的功能指针的使用。
typedef int (*FN)();
myfunc() {
FN fnptrs[] = {
(FN)(0x8084 + 1), // 有效的Thumb地址
(FN)(0x8074) // 无效的Thumb地址
};
FN* myfunctions = fnptrs;
myfunctions[0](); // 调用成功
myfunctions[1](); // 调用失败
}