163相册验证码图片的识别手记之一 --- 去除干扰
2009-03-26 08:20:18 来源:WEB开发网核心提示: "干扰线" : 从上面两组对比可看出.去除干扰点后,效果也不是很明显:( 干扰线占的比率太大了.所以还要进一步去掉干扰线.而对于直线型的干扰线.则可以简单直接判断某点的颜色值是否连续出现,如果连续出现次数超过10次(嘿嘿,留个作业.这个值怎么来的?)则基本可以判断为干扰
"干扰线" : 从上面两组对比可看出.去除干扰点后,效果也不是很明显:( 干扰线占的比率太大了.所以还要进一步去掉干扰线.而对于直线型的干扰线.则可以简单直接判断某点的颜色值是否连续出现,如果连续出现次数超过10次(嘿嘿,留个作业.这个值怎么来的?)则基本可以判断为干扰线.但可惜的是.163验证码图片中使用的是非直线型干扰线.所以此方法行不通.只好采用"块判断法"(嘿嘿,自己取的名字).也就是扫描一遍图片.当扫描到某点时,则以此点为左上角,取宽为8高为10的块(又是一个作业.这两个值怎么来的?如果上面的作业会做了.这个应该不是问题了.嘿嘿).然后判断此点的颜色值在此块中出现的次数.如果出现的次数越过一定数量(这个数量值很重要,因为关系到干扰线清除的"干净度"又关系到是否会"误杀"掉验证码图片.我试验过程中使用的是17)则可认为此颜色值是验证码使用的颜色.否则继续扫描下一点.直到图象的所有点扫描完成.扫描完后则可认为除了刚扫描到的验证码颜色外其它颜色都可认为为干扰色直接去除即可.
根据上面方法进行处理后的验证码图片样例如下:
更多精彩
赞助商链接