由汇编内核的MD5算法编写谈代码优化

　2010-06-23 20:41:03　来源：WEB开发网　　　

核心提示：开始我们做个实验，先打开两个文档附带的程序，由汇编内核的MD5算法编写谈代码优化，一个工程是MD5C,一个工程是MD5ASM,其中MD5C是从VCKBASE下载的md5算法的标准C语言原代码，MD5ASM是我修改后的md5算法原代码，比如说搜索算法，如果选择不当，我给这两个工程的main函数里面都添加了一段回朔代码，用

开始我们做个实验，先打开两个文档附带的程序，一个工程是MD5C,一个工程是MD5ASM,其中MD5C是从VCKBASE下载的md5算法的标准C语言原代码，MD5ASM是我修改后的md5算法原代码。我给这两个工程的main函数里面都添加了一段回朔代码，用来产生0～99999999的数字，然后用这两个工程里面的可执行文件去对每个数字md5加密。好了，经过一段时间的等待后，就可以看到类似的结果了：

MD5ASM工程在我的机器上的结果是181秒，MD5C在我的机器上产生的结果是999秒，呵呵，数字有点怪，不过我看了表的，差不多是这个时间，巨大的差距是怎样产生的，让我们接下来往下看吧。

在开始正题之前，大家需要清楚一件事，就是MD5C里面的代码虽然效率不高，但绝对是优秀的，因为它主要在演示md5的算法，用的是纯粹的C，没有添加任何平台相干的代码，而我改写的MD5ASM是只能够运行于x86上的windows系统中。所以速度是以兼容性来交换的。

一、算法优化

先观察一下MD5C里面的一段代码：

static void Encode (unsigned char *output, unsigned int　*input, unsigned int len) { 　　 unsigned int i, j; 　　 for (i = 0, j = 0; j < len; i++, j += 4) { 　　　　 output[j] = (unsigned char)(input[i] & 0xff); 　　　　 output[j+1] = (unsigned char)((input[i] >> 8) & 0xff); 　　　　 output[j+2] = (unsigned char)((input[i] >> 16) & 0xff); 　　　　 output[j+3] = (unsigned char)((input[i] >> 24) & 0xff); 　　 } }

这是一段将整数数组转换成为字符数组的代码，我们看看它到底做了些什么。假设主函数输入了一个整数0x30313233,那么这个子函数的调用就可以写成下面的样子：

Encode (output, input, 1)

Input指向一个整数数组，数组的第一个元素是0x30313233，我们接下来看函数转换

i=0,j=0 output[0]= (unsigned char)(input[0]& 0xff)=0x33 output[1]= (unsigned char)(input[0]& 0xff)=0x32 output[2]= (unsigned char)(input[0]& 0xff)=0x31 output[3]= (unsigned char)(input[0]& 0xff)=0x30 i=0,j=4

跳出循环

output的内存排列顺序为

+--+--+--+--+--

|33|32|31|30|

+--+--+--+--+--

^

output

现在大家注意了，input的排列顺序是什么？由计算机原理可知道，在计算机内部，数据的存放顺序是“高位对应高位，低位对应低位”，0x30313233中的33因为是个位，是低位，所以对应内存单元的最低位，同理30在内存单元的最高位，由此推出0x30313233在数组中的排列顺序为：

+--+--+--+--+--

|33 32 31 30|

+--+--+--+--+--

^