1. for(i=0;i<5;i++) for(j=0;j<100;j++) 2. for(j=0;j<100;j++) for(i=0;i<5;i++)
* 双层循环,较长的循环放在内层效率要高 特例: int x[1000][100]; for(i=0;i<1000;i++) for(j=0;j<100;j++) { //access x[i][j] } int x[1000][100]; for(j=0;j<100;j++) for(i=0;i=1000;i++) { //access x[i][j] } *这时候第一个的效率就比第二个的高 解释: 比如一个通用CPU,一级缓存(L1-Cache)的大小为16K,而其组织结构为每32个字节一组(cache line size=32byte), 也就是每次从二级缓存或内存取数据到一级缓存,都是一次性取32个字节。 对于上面的第一段代码,每次取数据到一级缓存,都有连续8次内存访问可以共享一条缓存。 而对于第二段代码,每次取数据到一级缓存后,访问一次后,基本上就没有机会被再次使用了; 上面这两段代码的区别在于第一段代码,每次内存访问后,地址值需要加常数4,而第二段代码,每次访问后,地址值加400。 3.for语句中条件快慢 for(int i=1; i<=10; i++) for(int i=10; i>0; i--) 速度较快;i>0被底层优化成i!=0,可直接用符号位判断。