• 正文
    • 11.10  ARM和Thumb的混合编程
  • 相关推荐
申请入驻 产业图谱

Thumb指令集之: ARM和Thumb的混合编程

2013/09/30
2
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

 

11.10  ARM和Thumb的混合编程

11.10.1  互交工作基础

Thumb以其较高的代码密度和在窄存储器上的性能,使得它在很多系统中得到广泛应用。但在很多情况下,还是不得不使用ARM指令,这是因为:

① ARM代码比Thumb代码有更快的执行速度;

② ARM处理器的一些特定功能必须由ARM指令实现,其中包括PSR指令、协处理器指令;

③ 异常发生时,处理器自动进入ARM状态,如果异常处理程序需要使用Thumb指令也必须通用一个ARM程序头(ARM assembler header)。

基于以上原因,即使程序需要由Thumb代码实现,也必须通过ARM-Thumb互交(ARM-Thumb interworking)进入Thumb状态。

ARM-Thumb互交是指对汇编语言和C/C++语言的ARM和Thumb代码进行连接的方法,它进行两种状态(ARM和Thumb状态)间的切换。在进行这种切换时,有时需使用额外的代码,这些代码被称为Veneer。AAPCS定义了ARM和Thumb过程调用的标准。

从一个ARM例程调用一个Thumb例程,内核必须进行状态切换。状态的变化由CPSR的T位来显示。在跳转到一个例程时BX指令可用于ARM和Thumb状态切换,具体用法如下。

在Thumb状态调用ARM例程时,采用:

BX  Rn;

在ARM状态调用Thumb例程时,采用:

BX{cond}  Rn;

其中,Rn可以是r0~r15中的任意寄存器

这种带状态切换的跳转指令BX,将寄存器Rn的内容拷贝到程序计数器寄存器PC,因此可以实现4G空间的跳转。指令根据寄存器Rn的bit[0]来决定处理器是否进行状态切换,详细内容参见ARM指令一节。

下面是一段ARM程序,该程序调用虚拟的SWI_writeC子程序从存储器的固定地址取出字符串“hello world”并输出。

        AREA    Hello,CODE,READONLY

SWI_WriteC        EQU        &0 ;软中断调用参数

SWI_Exit           EQU        &11 ;程序退出软中断调用参数

        ENTRY

START    ADR    r1,TEXT ;取字符串地址

LOOP    LDRB    r0,[r1],#1 ;取下一字节内容

         CMP  r0,#0 ;判断是否为字符串尾

         SWINE  SWI_WriteC ;软中断调用打印字符

         BEN  LOOP ;循环

         SWI  SWI_Exit ;软中断调用退出程序执行

TEXT      =      “Hello World”,&0a,&0d,0

         END

下面的代码将上面的ARM代码转换成等价的Thumb代码。

          AREA  HelloW_Thumb,CODE,READONLY 

SWI_WriteC  EQU    &0 ;软中断调用参数

SWI_Exit  EQU    &11 ;程序退出软中断调用参数

          ENTRY ;程序入口点

          CODE32  进入ARM状态

          ADR r0, START+1 ;取得Thumb代码入口地址 

          BX r0 ;进入Thumb代码 

          CODE16 ;Thumb代码入口点

START    ADR  r1, TEXT ;r1 -> "Hello World" 

LOOP     LDRB  r0, [r1] ;取下一字节内容 

          ADD  r1, r1, #1 ;地址指针加1  **T 

          CMP r0, #0 ;判断是否为字符串尾

          BEQ DONE ;完成? **T 

          SWI SWI_WriteC ;如果不是字符串尾

          B LOOP ;继续循环 

DONE     SWI  SWI_Exit ;程序退出 

          ALIGN ;字对齐 

TEXT     DATA 

                "Hello World",&0a,&0d,&00 

          END

上例中,ARM代码到Thumb代码转换过程中新增加的指令用“**T”标注。

 

在实现ARM代码和Thumb代码转换时,大部分的ARM指令有等价的Thumb指令,只有少数指令没有。如加载字节指令(LDR)不支持自动变址,软中断指令不能条件执行。

在编写Thumb代码时要注意以下几点。

① 汇编器需要知道什么时候产生ARM代码、什么时候产生Thumb代码,程序中使用CODE32和CODE16伪操作提供给编译器这些信息。

② 由于处理器上电执行是在ARM状态下完成的,所以要使用Thumb指令必须由ARM指令调用Thumb指令,这一过程是通过“BX  LR”指令来实现的。需要注意的是,在使用“BX  LR”指令前,要对寄存器LR做正确的初始化。

③ 在ARM和Thumb混合编程时,常使用ALIGN伪操作保证内存地址对齐。

11.10.2  互交子程序

编写ARM/Thumb互交代码时,下面两点需要注意。

① 对于C/C++子程序而言,只要在编译时指定--apcs/interwork选项,汇编器会生成合适的返回代码,使得程序返回到和调用程序相同的状态。

② 在汇编语言子程序中,用户必须自己编写相应的返回代码,使得程序返回到和调用程序相同的状态。

如果目标代码包含以下内容,应该在编译或汇编时使用--apcs/interwork选项使处理器能够在ARM和Thumb代码间进行正确的切换,这种情况包含以下4种。

① 需要返回到ARM状态的Thumb子程序。

② 需要返回到Thumb状态的ARM子程序。

③ 间接调用ARM子程序的Thumb子程序。

④ 间接调用Thumb子程序的ARM子程序。

如果在程序连接阶段,连接器发现ARM子程序和Thumb子程序间存在相互调用,而源文件在编译时没有使用--apcs/interwork选项,则连接器将报告以下错误。

Error: L6239E: Cannot call ARM symbol 'arm_function' in non-interworking object

armsub.o from THUMB code in thumbmain.o(.text)

其中,“arm_function”为需要进行状态切换的子程序名。

在这种情况下,用户必须使用--apcs/interwork选项重新对源文件进行编译。

但在下面两种情况下,不必指定--apcs/interwork选项。

① 在Thumb状态下,发生异常中断时,处理器自动切换到ARM状态,这时不需要添加状态切换代码。

② 当异常发生在Thumb状态时,从异常返回不需要添加状态切换的Veneer代码。

1.使用汇编语言实现互交

对于汇编程序来说,可以有两种方法来实现程序状态的切换。第一种方法是利用连接器提供的交互子程序Veneer来实现程序状态的切换,这时用户可以使用指令BL来调用子程序;另一种方法是用户自己编写状态切换的程序。

在ARMv4版本及其以前的版本中,可以使用BX指令实现程序状态的切换。

从ARMv5版本开始,下面的指令也可以用来实现程序的状态切换。

·  BX(Branch and eXchange)

·  BLX、LDR、LDM和POP

下面的两个伪操作用来区分源程序中的ARM代码和Thumb代码。

·  CODE16

·  CODE32

下面简单介绍用于状态切换的指令和伪操作,更详细的信息请分别参见相关章节。

(1)BX指令

ARM状态下的BX指令,使程序跳转到指令中指定的参数Rm指定的地址执行程序,Rm的第0位拷贝到CPSR中T位,位[31∶1]移入PC。若Rm的bit[0]为1,则跳转时自动将CPSR中的标志位T置位,即把目标地址的代码解释为Thumb代码;若Rm的位bit[0]为0,则跳转时自动将CPSR中的标志位T复位,即把目标地址代码解释为ARM代码。指令的语法格式如下。

BX{<cond>}  <Rm>

① <cond>

为指令编码中的条件域。它指示指令在什么条件下执行。当<cond>忽略时,指令为无条件执行(cond=AL(Alway))。

② <Rm>

包含跳转指令的目标地址。如果Rm的bit[0]=0,目标地址处指令为ARM指令;如果Rm的bit[0]=1,目标地址处指令为Thumb指令。

指令操作的伪代码。

指令操作的伪代码如下面程序段所示。

If  conditionPassed{cond}  then

     T  Flag=Rm[0]

     PC = Rm AND 0xfffffffe

Thumb状态下的BX指令,用于ARM和Thumb代码间的相互调用。

指令的语法格式。

BX  <Rm>

其中<Rm>为目标地址寄存器,包含程序的跳转地址。BX指令的目标地址寄存器可以是r0~r15中的任意寄存器。

注意

如果Rm[1:0]=0b10,不满足ARM指令的内存对齐方式。指令的执行结果不可预知。如果该指令使用r15作为目标寄存器,其操作方式和使用其他寄存器相同。

 

指令操作的伪代码如下所示。

T  Flag=Rm[0]

PC=Rm[31:1]<<1

ARM指令集中的BX指令和Thumb指令集中的BX指令相差较大,它们分别为不同方向的跳转。当r15作为目的寄存器使用时,要特别注意该指令在两个指令集中的区别。

(2)BLX指令

ARM状态下的BLX指令使用一个寄存器中的绝对地址或标号,用于使程序跳转到Thumb状态或从Thumb状态返回,该指令用分支寄存器的最低位来更新CPSR中的T位,并将返回地址写入到连接寄存器LR中。

指令的语法格式如下所示:

① BLX  <target_addr>

② BLX{<cond>}  <Rm>

第一种格式中,转移目标按下述方法计算。将指令中指定的24位偏移量进行符号扩展,左移两位形成字偏移量,然后将其累加进程序计数器PC中。这时,程序计数器的内容为BX指令地址加8字节。位H(bit[24])也加到结果地址的第一位(bit[1]),使目标地址为半字地址,以执行接下来的Thumb指令。计算偏移量的工作一般由ARM汇编器来完成。这种形式的跳转指令只能实现±32MB空间的跳转。

第二种格式中,寄存器Rm指定转移目标,Rm的第0位拷贝到CPSR中的T位,bit[31:0]移入PC。

·  如果Rm的bit[0]=1,则跳转时自动将CPSR中的标志位T置位,即把目标地址的代码解释为Thumb代码。

·  如果Rm的bit[0]=0,则跳转时自动将CPSR中的标志位T复位,即把目标地址的代码解释为ARM代码。

指令操作的伪代码如下面程序段所示。

第一种格式BLX指令。

LR=address of the instruction after the BLX instruction

T Flag=1

PC=PC + PC = PC + (SignExtend(signed_immed_24)<<2) + (H<<1)

第二种格式BLX指令。

If  ConditionPass{cond}  then

       LR = address of the instruction after the branch instruftion

       T Flag=Rm[0]

       PC=Rm AND 0xfffffffe

Thumb状态下带返回链接的跳转指令BLX(1)提供了一种在Thumb状态下无条件调用ARM子程序的方法,当从子程序返回时,通常使用下面的方式之一:

·  BX  LR

·  加载PC的LDR或LDM指令。

BLX指令不可条件执行,可以实现在大约±4MB的地址空间范围内跳转,实现方法是将一条BLX指令编译成两条16位的Thumb指令,从而实现上述跳转。对编译后的两条指令说明如下。

① H=10的跳转指令。该跳转包含跳转偏移量的高位部分。

② H=01的跳转指令。该跳转包含跳转偏移量的低位部分。

指令的语法格式

BL  <target_address>

<target_address>

指定程序跳转的目标地址。指令通过下面的方法计算目标地址。

·  将H=10的BL指令的offset_11域左移12位。

·  将结果符号扩展为32位。

·  将得到的值加到PC寄存器中。

·  与H=11的BL指令的offset_11域相加。

因此BL指令可以实现在大约±4MB的地址空间范围内跳转。

指令操作的伪代码为:

if  H==10  then

     LR=PC+(SignExtend(offset_11)<<12)

Else  if  H==11  then

     PC=LR+(offset_11<<11)

     LR=(address  of  next  instruction)|1

Else  if  H==01  then

     PC=(LR+(offset_11<<1)) AND 0xFFFFFFFC

     LR=(address of next instruction)|1

Else  if  H==01  then

     PC=(LR+(offset_11<<1)) AND 0Xfffffffc

     LR=(address of next instruction)|1

     T Flag=0

另外Thumb状态下包含另一种格式的BLX指令,该BLX(2)指令用于ARM和Thumb子程序间的相互调用。程序状态字的T标志位根据目的寄存器的bit[0]位而改变。

 

指令的语法格式为:

BLX  <Rm>

其中<Rm>为目标地址寄存器,r0~r14寄存器均可以作为目标地址寄存器。

注意

如果在此指令中使用r15作为目的寄存器,指令的执行结果不可预知。

此指令只在ARMv5版本以上指令集中被支持。

指令操作的伪代码为:

LR = (address of the instruction after this BLX)|1

T Flag = Rm[0]

PC = Rm[31:1]<<1

(3)汇编伪指令

汇编编译器可以产生ARM代码也可以产生Thumb代码。使用--thumb或--16选项指示编译器产生Thumb代码。由于所有支持Thumb代码的ARM处理器都从ARM状态开始执行,所以必须人为地使用BX或BLX指令,使处理器状态切换到Thumb状态并使用下面的伪操作使编译器产生Thumb代码。

·  CODE16

·  CODE32

CODE32伪操作指示汇编器后面的指令为32位的ARM指令。

ARM和CODE32伪操作的意义相同。

当汇编器对源程序进行编译时,如果需要,将会在程序中插入空指令,以保证内存单元字对齐。

语法格式如下。

ARM

CODE32

使用在同时包含ARM指令和Thumb指令的源文件中。当需要从ARM指令序列切换到Thumb指令序列时,使用伪操作ARM(或CODE32);当需要从Thumb指令序列切换到ARM指令序列时使用Thumb伪操作。ARM(或CODE32)伪操作只是指示汇编器后面的指令类型是ARM指令。该伪操作本身并不进行程序状态的切换,要进行状态切换,可以使用BX指令操作。

CODE16伪指令通知编译器,其后的指令序列为16位的Thumb指令。

语法格式如下。

CODE16

若在汇编源程序中同时包含ARM指令和Thumb指令时,可用CODE16伪指令通知编译器其后的指令序列为16位的Thumb指令。

(4)编程实例

      PRESERVE8

      AREA     AddReg,CODE,READONLY ;段名为AddReg,属性为READONLY

      ENTRY ;程序入口

; SECTION 1

main

      ADR r0, ThumbProg + 1 ;确定跳转地址

;并将bit[0]置1

;使程序切换到thumb状态

      BX  r0 ;程序跳转并执行状态切换

; SECTION 2

      CODE16 ;Thumb代码指示伪操作

ThumbProg

      MOV r2, #2 ;r2 = 2

      MOV r3, #3 ;r2 = 3

      ADD r2, r2, r3 ;r2 = r2 + r3

      ADR r0, ARMProg

      BX  r0 ;程序跳转并执行状态切换

; SECTION 3

      CODE32 ;ARM代码指示伪操作

ARMProg

     MOV r4, #4

     MOV r5, #5

     ADD r4, r4, r5

; SECTION 4

stop MOV r0, #0x18 ;设置semihosting软中断号

      LDR r1, =0x20026 ;ADP_Stopped_ApplicationExit

      SWI 0x123456 ;ARM semihosting SWI软中断调用

      END ;文件结束

 

上面的例子分为4部分,通过下面的步骤编译和运行。

① 使用文本编辑器,如notepad,输入上面的代码,并保存成文件addreg.s;

② 在命令行中键入汇编命令 armasm –g addreg.s;

③ 在命令行中键入链接命令 armlink addreg.o -o addreg;

④ 使用调试器(Debugger)(如,RealView Debuggeror AXD)运行映像文件。可以使用单步执行,观察代码在Thumb状态下的执行。

注意

Thumb代码的地址标号如果用伪操作export声明为“外部的”,则连接器会自动调整该地址标号使其bit[0]等于1;如果该地址标号没有被声明为“外部的”,则使用者必须手动地对标号进行调整,如上例中的ThumProg+1。

(5)ARMv5架构下的状态切换

在ARMv5体系结构的指令集中,增加了下面两条指令用于ARM和Thumb代码互交。

·  BLX  address

该指令跳转到指令中指定的地址处执行程序并进行程序状态切换,该地址是“PC相关的”,地址范围为±32MB(ARM状态)或±4MB(Thumb状态)。

·  BLX  register

在该中格式的跳转指令中寄存器Rm指定转移目标,Rm的第0位拷贝到CPSR中的T位,bit[31:0]移入PC。

使用上面两条指令,在执行程序跳转之前,处理器自动将返回连接寄存器LR的bit[0]位更新为CPSR寄存器的T位,所以无论处理器状态是否发生变化,程序都能正确返回。

当使用LDR、LDM及POP指令向PC寄存器中赋值时,寄存器CPSR中的Thumb位将被设置成PC寄存器的bit[0],这时就实现了程序状态的切换。这种方法在子程序的返回时非常有效,同样的指令可以根据需要返回到ARM状态或Thumb状态。

连接器在对目标代码进行连续时,将代码中的地址标号分为3类。

·  ARM指令地址标号。

·  Thumb指令地址标号。

·  数据(Data)地址标号。

当连接器重定位Thumb代码中的地址标号时,地址标号的bit[0]位将被自动设置为1。这就意味着跳转指令(这些指令包括BX、BLX和LDR)可以根据目标地址正确的进行状态切换。

注意

上面提到的连接器自动设置目的地址的行为,只有在ARMv5及其以上版本中支持。

 

2.使用C和C++语言实现互交

对于不同的C和C++源程序,可以有些程序中包含ARM指令,有些程序中包含Thumb指令,这些程序可以相互调用,只是在编译这些程序时指定--apcs/interwork选项。当使用了--apcs/interwork选项,编译器会自动进行一些相应处理;连接器在检测到程序中存在互交工作时,会生成一些用于程序状态切换的代码。

(1)代码编译

可以使用下面的指令,将C或C++程序编译为可以执行互交的目标代码。

armcc --c90 --thumb --apcs /interwork

armcc --c90 --arm --apcs /interwork

armcc --cpp --thumb --apcs /interwork

armcc --cpp --arm --apcs /interwork

注意

--cpp是C++文件(文件后缀为.cpp)默认的编译选项。

使用--apcs/interwork选项对文件进行编译时,编译器会进行如下处理。

·  对于叶子程序(leaf function,即程序中没有其他子程序调用的程序),编译器将程序中的“MOV  PC,LR”指令替换成“BX  LR”指令,因为“MOV  PC”指令不能进行状态切换。

·  对于非叶子程序,要进行一系列的指令替换,如:

POP  {r4,r5,pc}

替换为:

  POP  {r4,r5}

  POP  {r3}

  BX   r3

下面的例子显示了一段带子程序调用的C语言程序,使用--apcs/interwork选项进行编译时,对代码产生的影响。

C语言源程序。

Void  func(void)

{

….

Sub()

..

}

使用armcc  --apcs/interwork选项进行编译产生结果如下。

Func

STMFD  sp!,{r4-r7,lr}

….

BL  sub

….

LDMFD  sp!, {r4-r7,lr}

BX  lr

使用tcc  --apcs/interwork选项进行编译产生结果如下。

PUSH  {r4-r7,lr}

….

BL  sub

….

POP  {r4-r7}

POP  {r3}

BX

 

(2)C语言的互交实例

下面的例子显示了一个Thumb状态下的代码通过互交调用ARM子程序;而后又在ARM子程序中调用Thumb指令集的库函数printf()。

   /*********************

   *       thumbmain.c  *

   **********************/

   #include <stdio.h>

   extern void arm_function(void);

   int main(void)

   {

          printf("Hello from Thumb Worldn");

          arm_function();

          printf("And goodbye from Thumb Worldn");

          return (0);

   }

   /*********************

   *            armsub.c    *

   **********************/

   #include <stdio.h>

   void arm_function(void)

   {

          printf("Hello and Goodbye from ARM worldn");

   }

使用下面的命令对程序进行编译连接。

① 编译生成带互交的Thumb代码。

armcc --thumb -c -g --apcs /interwork -o thumbmain.o thumbmain.c

② 编译生成带互交的ARM代码。

armcc -c -g --apcs /interwork -o armsub.o armsub.c

③ 连接目标文件。

armlink thumbmain.o armsub.o -o thumbtoarm.axf

另外,可以使用--info选项使连接器输出由于互交所增加的代码大小。

armlink armsub.o thumbmain.o -o thumbtoarm.axf --info veneers

输出信息如下所示。

Adding Veneers to the image

     Adding TA veneer(4 bytes, Inline) for call to'arm_function'from thumbmain.o(.text).

     Adding AT veneer (8 bytes, Inline) for call to '__0printf' from armsub.o(.text).

     Adding AT veneer (8 bytes, Inline) for call to '__rt_lib_init' from kernel.o(.text).

     Adding AT veneer (12 bytes,Long) for call to'__rt_lib_shutdown'from kernel.o(.text).

     Adding TA veneer (4 bytes, Inline) for call to '__rt_memclr_w' from stdio.o(.text).

     Adding TA veneer (4 bytes, Inline) for call to '__rt_raise' from stdio.o(.text).

     Adding TA veneer (8 bytes, Short) for call to '__rt_exit' from exit.o(.text).

     Adding TA veneer (4 bytes, Inline) for call to '__user_libspace' from free.o(.text).

     Adding TA veneer (4 bytes, Inline) for call to '_fp_init' from lib_init.o(.text).

     Adding TA veneer (4 bytes, Inline) for call to '__heap_extend' from malloc.o(.text).

     Adding AT veneer (8 bytes, Inline) for call to '__raise' from rt_raise.o(.text).

     Adding TA veneer (4 bytes, Inline) for call to '__rt_errno_addr' from ftell.o(.text).

12 Veneer(s) (total 72 bytes) added to the image.

(3)Thumb状态下的功能指针

任何指向Thumb函数(由Thumb指令完成的功能函数并且其返回状态也为Thumb状态)的指针,其最低有效位(LSB)必为1。

当重定位Thumb代码中的地址标号时,连接器将自动设置地址的最低有效位。如果在程序中使用绝对地址,连接器将无法完成该设置。因此,如果在Thumb代码中使用绝对地址时,必须手工设置为其地址加1。

下面的例子显示了Thumb代码的功能指针的使用。

typedef int (*FN)();

myfunc() {

     FN fnptrs[] = {

          (FN)(0x8084 + 1), // 有效的Thumb地址

          (FN)(0x8074) // 无效的Thumb地址

     };

     FN* myfunctions = fnptrs;

     myfunctions[0](); // 调用成功

     myfunctions[1](); // 调用失败

}

Arm

Arm

ARM公司是一家知识产权(IP)供应商,主要为国际上其他的电子公司提供高性能RISC处理器、外设和系统芯片技术授权。目前,ARM公司的处理器内核已经成为便携通讯、手持计算设备、多媒体数字消费品等方案的RISC标准。公司1990年11月由Acorn、Apple和VLSI合并而成。

ARM公司是一家知识产权(IP)供应商,主要为国际上其他的电子公司提供高性能RISC处理器、外设和系统芯片技术授权。目前,ARM公司的处理器内核已经成为便携通讯、手持计算设备、多媒体数字消费品等方案的RISC标准。公司1990年11月由Acorn、Apple和VLSI合并而成。收起

查看更多

相关推荐

登录即可解锁
  • 海量技术文章
  • 设计资源下载
  • 产业链客户资源
  • 写文章/发需求
立即登录

华清远见(www.farsight.com.cn)是国内领先嵌入师培训机构,2004年注册于中国北京海淀高科技园区,除北京总部外,上海、深圳、成都、南京、武汉、西安、广州均有直营分公司。华清远见除提供嵌入式相关的长期就业培训、短期高端培训、师资培训及企业员工内训等业务外,其下属研发中心还负责嵌入式、Android及物联网方向的教学实验平台的研发及培训教材的出版,截止目前为止已公开出版70余本嵌入式/移动开发/物联网相关图书。企业理念:专业始于专注 卓识源于远见。企业价值观:做良心教育、做专业教育,更要做受人尊敬的职业教育。