14.10 浮点运算
大多数的ARM处理器硬件上并不支持浮点运算。但ARM上提供了以下几个选项来实现浮点运算。
· 浮点累加协处理器FPA(Floating-Point Accelerator):ARM上提供了一组协处理器指令专门实现浮点运算。但这需要硬件支持,具体某一处理器上是否有FPA协处理器支持,可以查看ARM相关手册。
· 浮点运算仿真(FPE):使用软件仿真了FPA协处理器的执行。
· 浮点运算库(FPLib):使用ARM的浮点运算库函数实现程序中的浮点运算操作。这就意味着C编译器要把每一个浮点操作转换成一个子程序调用。C库中的子函数使用整型运算来模拟浮点操作。这些代码是用高效的汇编语言编写而成的。尽管如此,浮点运算执行起来还是要比相应整型运算慢得多。
注意 |
Thumb指令不支持协处理器指令,所以在Thumb状态下实现浮点运算,只能调用ARM浮点运算库。 |
为了在ARM上高效地实现浮点运算,请遵循以下规则。
· 避免使用浮点除法运算。通常情况下,除法运算的执行速度是普通加法或乘法运算速度的1/2。在无法避免除法的情况下,尽量使除法的除数为常数。如,x=x/3.0,可将其变为x = x * (1.0/3.0)。这样除数为常数(1.0/3.0),该值在编译阶段由编译器计算。
· 使用float型代替double型。float型要比double使用更少的内存和寄存器。
· 避免使用三角函数功能。实现三角函数功能,如sin、cos,使用了大量的乘加运算,它的运算速度大约是普通乘法运算的十倍。
· 当编译器处理浮点运算操作时,由于精度的影响很多优化不能实现。比如,表达式3 * (x / 3),编译器不能判断其值和x是等价的。所以在使用浮点运算表达式时,最好先人工的做一些必要的优化。