|
自从垃圾邮件问题开始被重视,迄今已经有十多年了。虽然反垃圾邮件技术和政策不断出现,但是,垃圾邮件问题仍然没有彻底得到解决。让我们先回顾一下这十几年来,都出现了哪些反垃圾邮件技术,借此可以了解是否因为技术不当而造成目前防范效果不佳的状况呢?
传统技术的弊端 1995年,人们就开始尝试利用黑名单的方法来防范垃圾邮件。所谓实时黑名单实际上是一组可供查询的IP地址列表,判断一个IP地址是否已经被列入了黑名单,只要使用黑名单服务的软件会发出一个查询到黑名单服务器。如果该地址被列入了黑名单,那么服务器会返回一个有效地址的答案。反之将得到一个否定答案。由于现在世界上大多数的主流邮件服务器都支持实时黑名单服务,因此该名单是可信任的。但是,这种方式最大弊端在于容易发生 “误判”,比如ISP提供的虚拟主机服务,一旦某个用户被认定发送垃圾邮件,就会导致整个IP区域被列入黑名单,其它的用户也会受到牵连。
与杀毒软件类似,通过建立“垃圾邮件特征库”的方法来阻止垃圾邮件,通过对邮件的信封、信头、信体等内容进行对比检测,从而对垃圾邮件进行阻止。但是,随着垃圾邮件制造者的技术水平不断提高,这种方法很容易失效。另外,可以通过相互认证的服务器和用户之间建立信任关系,以此来避免垃圾邮件的发送。当然,由于邮件服务器的数量非常巨大,这种做法实现起来比较困难。不过,现在已经有一些邮件服务器之间建立了关联,并且采用了一些全新的技术。如针对垃圾邮件传播者惯用的伪造成同域用户的伎俩,就可以利用同域认证技术,经过该技术的过滤,凡是那些伪装成同域用户的邮件,都会被打入垃圾邮件的黑名单,以保证邮件的安全。
除此之外,人们还采用了HASH 技术以及贝叶斯(Bayesian)算法。贝叶斯算法可以学习单词的频率和模式,这样可以同垃圾邮件和正常邮件关联起来进行判断。这是一种相对于关键字来说,更复杂和更智能化的内容过滤技术。
黑白名单存在弊端 大部分情况下,邮件服务商和企业还是主要通过服务器过滤垃圾邮件,利用在反病毒软件中单独或者增加了防范垃圾邮件的功能或者购买专业的反垃圾邮件产品。目前安全厂商所提供的反垃圾邮件产品一般分为两种:一种是在防病毒软件或安全网关当中集成反垃圾邮件功能;另一种就是专门的反垃圾邮件产品。由于安全厂商都是从信息安全起家的,虽然安全技术堪称一流,但是,他们对邮件的认识还存在一些盲点。因此,大多数的反垃圾邮件功能,还是基于黑名单或关键词过滤等方法。虽然实时黑名单、内容过滤看上去的确不错,但关键字的规则有几万条,对网络资源消耗过大。
传统的反垃圾邮件方法没有节省流量和存储资源,反而增加了计算的难度。垃圾邮件不是在空中拦截,而是通过把邮件缩小,截获样本来寻找关键字,经过分析之后再判断是否是垃圾邮件。然而,这样的模式却对流量和网络资源产生了较大的影响。其次,关键字的规则是一种被动的思路,需要根据不断变化的垃圾邮件特征进行变化,就像防病毒技术一样,需要针对新病毒的特征,才能更新病毒库,对其进行防护。Mirapoint公司亚太区总监任兆雄说:“每天不同内容的垃圾邮件有几千万,甚至上亿封,没有哪家安全厂商有足够的实力和时间来分析和把握这些关键字的特征。而且,垃圾邮件内容特征变化很快,比病毒变化快得多。”
另外,以内容过滤为主导的技术,容易受到内容的干扰,容易造成误判断。任兆雄举了一个例子,社会科学院的一些教授和台湾的一些学者有学术往来,因此在邮件来往过程中会针对一些敏感问题进行探讨和辩论。因为这些内容涉及需要过滤的关键字,所以邮件经常被删除。相反,各种垃圾邮件则往往采取更加隐秘的手段,反而有可能顺利通过网关。
任兆雄认为,“传统反垃圾邮件技术,基本上还是沿用了黑白名单的方式,基本遵循‘截获样本—解析特征—生成规则—分发规则—内容过滤’的原理。这种十几年来一直沿用的方法,无法跟上不断变化和发展的垃圾邮件技术,也为网络资源造成了较大的影响。”
判断垃圾邮件靠行为 据统计,我国目前已经成为全球第二大垃圾邮件受害国,我国用户平均每周收到的垃圾邮件数超过邮件总数的60%,部分企业每年为此投入上百万元的设备和人力。巨大的市场需求驱动了各安全厂家在防垃圾邮件产品方面的研发投入逐渐加大。目前国内市场上已经有了数十个防垃圾邮件产品,分别采用三代不同的反垃圾邮件技术。这三代技术目前同时存在于市场上,但是,到底哪种技术更适合解决垃圾邮件问题呢?
从下表中可以看出,由于第一代和第二代的过滤技术始终没有跳出内容匹配过滤的技术局限,仅仅是对孤立的词语进行匹配,抛弃了连贯性,从而无法正确对邮件进行判别,于是造成邮件的大量误判。同时,这两种技术需要进行大量的匹配运算,对CPU和内存的占用极高,这样就很容易成为处理瓶颈。
而最新的防范垃圾邮件的方法是通过行为判断垃圾邮件。行为识别技术能够高效、准确地区分垃圾邮件与正常邮件,使得采用任何垃圾邮件发送技术发出的垃圾邮件都无法躲过它的检测。很多安全厂商相继推出了基于行为识别技术的第三代防垃圾邮件网关。该技术对大量的垃圾邮件样本进行了统计、分析和计算,并且根据RFC.822标准,建立了垃圾邮件发送的行为识别模型。这一模型能够在MTA通信阶段就判断出所接收邮件是否为垃圾邮件,不需要接受全部的邮件内容进行相应的内容匹配,从而提高了邮件过滤速度,减少了网络延迟,同时还避免了内容过滤技术不可避免的高误报率问题,也提高了对垃圾邮件的识别精度。
MailHurdle+RAPID技术出现 正当人们对传统技术一筹莫展的时候,Mirapoint公司推出了邮件网关的连接层拦截技术,使得垃圾邮件和病毒邮件在消耗系统资源和管理资源之前就已经被拦截。在Mirapoint的技术当中,Mirapoint MailHurdle邮件栏杆技术是核心,提供了一种业界领先的连接控制手段。它能够在垃圾邮件产生网络带宽、存储、处理器、管理资源浪费前,将80%以上的垃圾邮件和病毒邮件直接拦截在网络外层。MailHurdle策略基于对邮件发送者心理行为的缝隙,因此对大量新爆发的垃圾或者正在变异的垃圾威胁具有非常出色的拦截效果。
Mirapoint的RAPID防垃圾引擎,是一种全新概念的防垃圾邮件引擎,它改变了传统基于内容关键字技术的局限,真正实现了和内容无关、语言类型无关的垃圾邮件实时检测。RAPID技术是基于全球的、实时的、相同邮件的数字DNA进行重复模式检测并进行实时判断的技术,RAPID不是对每封单独的邮件进行内容关键字分析,而是根据邮件的数字DNA进行大批量实时处理,能够在最短的时间内检测到最新爆发的垃圾邮件甚至是病毒邮件。利用Mirapoint的RAPID引擎和邮件栏杆技术,在不影响网络资源的情况下,能够阻止98%的垃圾邮件。
反垃圾邮件技术对比表 第一代技术 通过IP过滤,关键字过滤,邮件(附件)大小控制,SMTP连 接时间频率控制来进行垃圾邮件的区分;
第二代技术 通过基于统计算法(如贝叶斯)的智能内容过滤,RBL过滤进 行垃圾邮件的区分;
第三代技术 通过基于对垃圾邮件发送行为的研究和统计而发展出来的行为 识别技术对垃圾邮件区分。
(阅读次数:)
|