反垃圾邮件防火墙的核心技术分析
2006-12-05 12:39:06 来源:WEB开发网由复合概率公式可得P(A|t1 ,t2, t3……tn)=(P1*P2*。。。。PN)/[P1*P2*。。。。。PN+(1-P1)*(1-P2)*。。。(1-PN)]当P(A|t1 ,t2, t3……tn)超过预定阈值时,就可以判断邮件为垃圾邮件。
贝叶斯过滤算法举例
例如:一封含有"法轮功"字样的垃圾邮件 A和 一封含有"法律"字样的非垃圾邮件B 根据邮件A生成hashtable_ bad,该哈希表中的记录为:
法:1次
轮:1次
功:1次
计算得在本表中:
法出现的概率为0.3
轮出现的概率为0.3
功出现的概率为0.3
根据邮件B生成hashtable_good,该哈希表中的记录为:
法:1
律:1
计算得在本表中:
法出现的概率为0.5
律出现的概率为0.5
综合考虑两个哈希表,共有四个TOKEN串: 法 轮 功 律当邮件中出现"法"时,该邮件为垃圾邮件的概率为:
P=0.3/(0.3+0.5)=0.375
出现"轮"时:
P=0.3/(0.3+0)=1
出现"功"时:
P=0.3/(0.3+0)=1
出现"律"时
P=0/(0+0.5)=0;
由此可得第三个哈希表:hashtable_probability 其数据为:
法:0.375
轮:1
功:1
律:0
当新到一封含有"功律"的邮件时,我们可得到两个TOKEN串,功 律查询哈希表hashtable_probability可得
P(垃圾邮件| 功)=1
P (垃圾邮件|律)=0
此时该邮件为垃圾邮件的可能性为:
P=(0*1)/[0*1+(1-0)*(1-1)]=0
由此可推出该邮件为非垃圾邮件
(注:贝叶斯算法和举例来自反垃圾邮件论坛)
反垃圾邮件防火墙和防火墙的关系
防火墙是一个广义上称呼,从实际应用的角度看防火墙是为了保护企业内部网络资源(如www服务器、文件服务器等等)免受外部安全威胁侵害的防护设备,通过设置不同的防护级别和防护措施对内部网络资源实行实施保护。根据它所防护的侧重点的不同,防火墙可以分为病毒防火墙,DDOS(分布式拒绝服务攻击)防火墙,垃圾邮件防火墙等等。
简而言之,反垃圾邮件防火墙是用来反垃圾邮件的专用防火墙。
防火墙从工作方式上来说都有一个共性:分析出入防火墙的数据包,决定放行还是阻断。在实际部署中,作为专用垃圾邮件防火墙可以放在普通防火墙的前面也可是防火墙的后面,建议放在后面在逻辑上保持和邮件服务器是串联的关系就可以了。
a)安装在防火墙的外面就要修改(或是增加)MX记录,是MX记录能够指向反垃圾邮件防火墙,如果有两条的话,指向反垃圾邮件防火墙的MX记录有优先级要调的高一些
b)安装在防火墙的里面要将SMTP的NAT记录指向反垃圾邮件防火墙此两种情况都不需要在服务器和客户端软件(outlookfoxmail等)做任何更改
写道这里防垃圾邮件技术和防垃圾邮件防火墙的基本知识就介绍完了。如果不清楚的地方大家可以通过留言来一起交流
更多精彩
赞助商链接