WEB开发网
开发学院软件开发C语言 163相册验证码图片的识别手记之二 --- 识别 阅读

163相册验证码图片的识别手记之二 --- 识别

 2009-03-26 08:20:15 来源:WEB开发网   
核心提示: 相似度比较法:此方法是将每个“切”出来的字图和所有源数字图逐一比较,并得出一个图形结构的相似度值,163相册验证码图片的识别手记之二 --- 识别(4),然后再取相似度值最高的“源数字图”,这样“字图”对应的字符就识别

相似度比较法:

此方法是将每个“切”出来的字图和所有源数字图逐一比较,并得出一个图形结构的相似度值,然后再取相似度值最高的“源数字图”,这样“字图”对应的字符就识别出来了。

图形结构相似度:

假如将一幅图看成一个二维数组(一维下标对应X轴,二维下标对应Y轴),数组里的数据就是每个象素点的颜色值。那么求两副图图形结构的相似度值,则是等价于求两个二维数组里的数据的相似度统计。

假如有两个数组的数据分别如下:

二维数组A里的数据:("4"字的01图)

00000110
00001110
00011110
00110110
01100110
11000110
11111111
00000110
00000110
00000110

二维数组B里的数据:("4"字被干扰破坏后的01图,注意红色部分)

00000110
00001110
00011110
00110110
01100110
11000110
11100111
00000010
00000110
00000110

求A与B的相似度,则分别比较AB对应“行”里的数据,找出不相同点的数量,也就是共有3次不相同,所以相似度值大概为96% ,因此就可以认为B是A了。

注:对于相似度取什么值就可考虑AB“相等”,这个大家要权衡一下,毕竟取的值过低识差率可是很大的。

声明: 此文章只是记录我在处理163相册验证码图片识别过程时的想法思路,在此发表只是纯粹基于技术探讨目的.因此在文章中不会提供任何源码下载!!任何人利用这里介绍的方法所做任何事情而出现的责任本人概不负责!!如果需要转载此文,请注明原作者和出处!!

上一页  1 2 3 4 

Tags:相册 验证 图片

编辑录入:爽爽 [复制链接] [打 印]
赞助商链接