编程教程
您现在的位置: 中国个人站长站 >> 网络编程 >> Visual C++ >> 教程正文 代码优化试验——短循环优化(下)
推荐位

代码优化试验——短循环优化(下)

中国个人站长站 Visual C++ 点击数: 更新时间:2004-8-25

测试程序2

#include <iostream.h>

#include <Timer.h>

void sum4()

{

       int j = 0;

       for (unsigned i = 1; i < 630001;)

       {

              j += i++;

              j += i++;

              j += i++;

              j += i++;

       }

}

 

void sum5()

{

       int j = 0;

       for (unsigned i = 1; i < 630001;)

       {

              j += i++;

              j += i++;

              j += i++;

              j += i++;

              j += i++;

       }

}

int main()

{

       int i, j; Timer timer;

       timer.Start();

       for (i = 0; i < 5; i++) sum4();

       cout << "sum4  : " << timer.GetTime() << endl;

       timer.Start();

       sum4();sum4();sum4();sum4();sum4();

       cout << "sum4E : " << timer.GetTime() << endl;

       timer.Start();

       for (i = 0; i < 5; i++) sum5();

       cout << "sum5  : " << timer.GetTime() << endl;

       timer.Start();

       sum5();sum5();sum5();sum5();sum5();

       cout << "sum5E : " << timer.GetTime() << endl;

       timer.Start();

       for (i = 0; i < 100; i++) sum4();

       cout << "sum4H : " << timer.GetTime() << endl;

       timer.Start();

       for (i = 0; i < 100; i++) sum5();

       cout << "sum5H : " << timer.GetTime() << endl;

       timer.Start();

       for (i = 0; i < 1000; i++)

              for (j = 0; j < 5; j++) sum4();

       cout << "sum4T : " << timer.GetTime() << endl;

       timer.Start();

       for (i = 0; i < 1000; i++)

       {sum4();sum4();sum4();sum4();sum4();}

       cout << "sum4TE: " << timer.GetTime() << endl;

       for (i = 0; i < 1000; i++)

              for (j = 0; j < 5; j++) sum5();

       cout << "sum5T : " << timer.GetTime() << endl;

       timer.Start();

       for (i = 0; i < 1000; i++)

       {sum5();sum5();sum5();sum5();sum5();}

       cout << "sum5TE: " << timer.GetTime() << endl;

       return 0;

}

测试结果2

Sum4

Sum4E

Sum5

Sum5E

Sum4H

Sum5H

Sum4T

Sum4TE

Sum5T

Sum5TE

VC6 Release,生成文件大小57,344B,以下时间单位ms

8.781

8.45918

7.54705

7.54677

174.909

152.656

8672.62

8794.3

16433.9

7633.09

BCC32,生成文件大小140,800B,以下时间单位ms

8.5874

8.91789

8.61534

7.64287

169.769

180.58

8548.64

8758.32

17586.1

7835.57

这个表是个大致趋势,更多的数据我就不列了。这个结果颇出乎我的预料,变化很不规律,我得出以下结论,还望大家商榷:

1.         如果是单层循环,短循环不需要展开,性能提升不明显。对于BCC32,更不需要展开,由于编译器的优化,展开后还不如原来的。但是对于原来就很高效的,BCC32展开还是能带来提升的。

2.         对于不能展开的单层短循环,VC6和循环体内的函数性能一致,BCC32由于有优化,结果出现了倒退。

3.         对于多层循环的内循环短循环,如果原来函数的性能不是很好,展开的效果并不明显,这里是出现了倒退。最奇怪的是原来性能最好的sum5,在不展开的情况下居然性能那么差,展开后竟又是性能最好的了,提高了一倍多,真是怪事。

综上,对于原来性能好的函数,短循环展开能提升性能;如果你对自己的代码没信心,就不要展开了,有时会适得其反。

教程录入:swh    责任编辑:swh 
个人站长站与你风雨同舟!
本站所提供的资源均来源于互联网,如有侵权行为,请与本站管理员联系,我们会第一时间删除!
·如果您发现《代码优化试验——短循环优化(下)》文章有错误,也请通知我们修改!
联系邮箱chinageren#126.com,谢谢支持!
站内搜索:
版权所有:中国个人站长站 2007-2008 未经授权禁止复制或建立镜像 客服QQ号:112731235
copyright © 2007-2008 www.ChinaGeRen.com online services. all rights reserved. 苏ICP备05000059号