加入星计划,您可以享受以下权益:

  • 创作内容快速变现
  • 行业影响力扩散
  • 作品版权保护
  • 300W+ 专业用户
  • 1.5W+ 优质创作者
  • 5000+ 长期合作伙伴
立即加入
  • 正文
    • 14.5  C循环结构
  • 相关推荐
  • 电子产业图谱
申请入驻 产业图谱

高效的C编程之:C循环结构

2013/09/30
阅读需 8 分钟
加入交流群
扫码加入
获取工程师必备礼包
参与热点资讯讨论

 

14.5  C循环结构

循环体是程序设计与优化的重点考虑对象。本节将着重讲解在ARM上处理for和while循环最有效的方法。

14.5.1  循环中止

首先来看下面的例子,两个不同的循环退出条件,产生的不同汇编代码。

C源程序如下所示。

int fact1 (int n)

{

int i, fact = 1;

for (i = 1; i <= n; i++)

fact *= i;

return (fact);

}

int fact2 (int n)

{

int i, fact = 1;

for (i = n; i != 0; i--)

fact *= i;

return (fact);

}

产生的汇编代码如下所示。

fact1

            MOV      a3,#1

            MOV      a2,#1

            CMP      a1,#1

            BLT      |L000020.J5.fact1|

 |L000010.J4.fact1|

            MUL      a3,a2,a3

            ADD      a2,a2,#1

            CMP      a2,a1

            BLE      |L000010.J4.fact1|

 |L000020.J5.fact1|

            MOV      a1,a3

            MOV      pc,lr

 fact2

            MOVS     a2,a1

            MOV      a1,#1

            MOVEQ    pc,lr

 |L000034.J4.fact2|

            MUL      a1,a2,a1

            SUBS     a2,a2,#1

            BNE      |L000034.J4.fact2|

            MOV      pc,lr

从产生的汇编代码中,可以看出两个函数虽然实现的功能相同,但产生的代码效率却不尽相同。这里的关键是,循环的中止条件应为计数减到零(count down to zero),而不是计数增加到某个值。由于减计数结果已存储在条件标志里,与零比较的指令就可以省略。同时也可以少用一个寄存器来存储循环中止值。

注意

上面的例子使用了-O2 –Otime的编译选项,如果使用-Ospace选项,编译结果会有不同。

对循环计数值i来说,如果i是无符号的,则循环继续的条件既可以是i!=0,也可以是i > 0。由于i不可能是负数,所以这两个条件是等价的。而对一个有符号的循环计数值来说,最好不要用条件i > 0作为循环继续执行的条件。如果使用i > 0作为循环继续执行的条件,编译器将生成下面的代码。

         SUB     a2,a2,#1

         CMP      r1,#0

         BGT      |L000034.J4.fact2|

这时,编译器多增加了一条CMP指令,主要是为了防止有符号数i= −0x8000000。总之,无论对于有符号还是无符号的循环计数值,都应该使用i != 0作为循环的结束条件。对于有符号数i,这比使用i > 0少了一条指令。

 

14.5.2  循环展开

在14.5.1节中可以发现,每次循环需要在循环体外加两条指令:一条减法指令来减少循环计数值和一条条件分支指令。通常这些指令称为循环开销(Loop Overhead)。在ARM7或ARM9处理器上,加法指令需要1个周期,条件分支指令需要3个周期,这样每个循环就需要4个周期的开销。

可以通过展开循环体(Loop Unrolling),即重复循环主体多次,同时按同样的比例减少循环次数来降低循环开销。

下面的例子通过将循环体展开4次,来达到减少循环开销的目的。

int countbit1(uint n)

{ int bits = 0;

while (n != 0)

{

if (n & 1) bits++;

n >>= 1;

}

return bits;

}

将循环主体展开。

int countbit2(uint n)

{ int bits = 0;

while (n != 0)

{

if (n & 1) bits++;

if (n & 2) bits++;

if (n & 4) bits++;

if (n & 8) bits++;

n >>= 4;

}

return bits;

}

这里减少了4N的循环开销(N=4,即循环体执行的次数)。如果循环体中存在耗时的Store/Load指令,则代码执行效率的提高将更明显。

ARM编译器不会自动将循环体展开,只有用户自己判断何时将循环体展开,到底应该展开多少次,如果循环的次数不是循环展开的倍数该怎么办?下面就将详细讨论,用户编写自己的循环展开程序时,需要注意的问题。

① 只有当循环展开对提高应用程序的整体性能非常重要时,才进行循环展开;否则反而会增加代码尺寸。

② 应设法使循环的次数是循环展开的倍数。如果难以实现,那么就要增加额外的代码来处理数组的剩余元素。这将增加少许代码量,但可以保持较好的性能。

Arm

Arm

ARM公司是一家知识产权(IP)供应商,主要为国际上其他的电子公司提供高性能RISC处理器、外设和系统芯片技术授权。目前,ARM公司的处理器内核已经成为便携通讯、手持计算设备、多媒体数字消费品等方案的RISC标准。公司1990年11月由Acorn、Apple和VLSI合并而成。

ARM公司是一家知识产权(IP)供应商,主要为国际上其他的电子公司提供高性能RISC处理器、外设和系统芯片技术授权。目前,ARM公司的处理器内核已经成为便携通讯、手持计算设备、多媒体数字消费品等方案的RISC标准。公司1990年11月由Acorn、Apple和VLSI合并而成。收起

查看更多

相关推荐

电子产业图谱

华清远见(www.farsight.com.cn)是国内领先嵌入师培训机构,2004年注册于中国北京海淀高科技园区,除北京总部外,上海、深圳、成都、南京、武汉、西安、广州均有直营分公司。华清远见除提供嵌入式相关的长期就业培训、短期高端培训、师资培训及企业员工内训等业务外,其下属研发中心还负责嵌入式、Android及物联网方向的教学实验平台的研发及培训教材的出版,截止目前为止已公开出版70余本嵌入式/移动开发/物联网相关图书。企业理念:专业始于专注 卓识源于远见。企业价值观:做良心教育、做专业教育,更要做受人尊敬的职业教育。