企业垃圾邮件过滤器:还可以做得更好吗?

企业垃圾邮件过滤器的工作方式令人惊讶:一封电子邮件将经过多次合法性检查才能达到目的地。邮件服务器会检查你是否有权限通过它发送邮件。同时还有可能会检查你发送的邮件是否是一大群可疑邮件的一部分,如果是则说明你在发送垃圾邮件。在允许你的邮件进入收件人的邮箱之前,接收端的邮件服务器将检查邮件的各种属性:发件人的邮箱地址或者IP是否在黑名单上?邮件主题和内容是否包含垃圾内容?

邮件过滤器通过匹配关键字和表达式来过滤邮件,也可以使用统计分析工具,如朴素贝叶斯分类器(the naive Bayes classifier)来判断一封邮件是否属于垃圾邮件。采用贝叶斯分类器进行垃圾邮件过滤这种方式,你甚至可以为每位用户单独进行训练,学习某位用户日常邮件所包含的主要内容。图片过滤则被用于检测邮件的整体色调和特殊身体形状(通常与色情图片相关)。Gmail还能为中到大型的图片提供光学字符识别(OCR)功能。当电子邮件被你的邮件客户端下载时,过滤器会该邮件进行检查,看其是否符合过滤设置,包括自动的和手动的设置。尽管有这么多的过滤器,我们仍然不断地收到大量各种各样的垃圾邮件。

垃圾邮件发送者使用各种技术来绕过这些过滤器。他们在邮件中包含大量合法的文本信息,从而降低邮件的垃圾邮件评分——大多数垃圾邮件分析程序根据邮件包含的垃圾邮件特征的多少而给邮件的评分——令贝叶斯过滤器失效。邮件中的文本还可以用图片或者一行行的‘X’取代。尽管垃圾邮件黑名单有一定的用处,但需要大量的时间去维护;垃圾邮件发送者会使用成千上万被攻击的电脑来发送垃圾邮件,这意味着我们的黑名单永远也填不满。另一方面,白名单则显得过于严格,经常会拦截来自新联系人的正常邮件。

尽管有许多法律法规限制或禁止垃圾邮件,但垃圾邮件发送者仍然可以获得大量经济利益,因为他们非法使用互联网服务供应商(ISP)提供的资源,使得发送垃圾邮件几乎不需要成本。鉴于垃圾邮件仍然有利可图,那么这个行业就会继续想方设法绕过垃圾邮件过滤器和各种反垃圾邮件的安全检查。

恶意垃圾邮件指那些包含恶意软件或者进行某种欺诈活动的垃圾邮件;拦截恶意垃圾邮件的重任就落在了主要ISP(互联网服务提供商)和邮件服务提供商身上,因为他们有拦截必须的资源和流量控制能力。垃圾邮件流量控制,即对可能的垃圾邮件涉及的带宽和资源进行大规模缩减,能够对垃圾邮件发送者的活动造成直接的影响。但是,反垃圾邮件工作也就只能做到这里了;对一个人来说是垃圾邮件,对另一个人则有可能是非常重要的信息。

尽管有局限性,各个公司仍然需要基于网关的电子邮件过滤软件;否则,泛滥的垃圾邮件会淹没真正的用户。基于网关的垃圾邮件过滤器包含一个检查选项,既能减少由垃圾邮件造成的分心,又能降低合法电子邮件丢失的几率。用户应习惯于将不想要的电子邮件标记为垃圾邮件,而不是仅仅将之删除。这会帮助邮件客户端将相似的邮件列为垃圾邮件。对于小型公司来说,一个办法是将所有邮件都重定向到Gmail账户中,从而充分利用Gmail过滤器的功能。

可悲的是,能完全识别垃圾邮件的软件还没发明出来。尽管反垃圾邮件厂商能够迅速地采用新方法打击垃圾邮件,但他们最近则专注于常见形式的垃圾邮件的各种变种。将来我们总有可能会接触到垃圾邮件,所以对公司机构而言,对付垃圾邮件最好的办法之一就是确保他们的电脑没有被入侵并被用于发送更多的垃圾邮件。微软去年的一份报告指出,美国是世界上最大的僵尸网络或被入侵计算机来源地,这些计算机中有一些还是企业的电脑终端。

许多公司机构在防止垃圾邮件及未授权信息经由他们自己的网络发出这方面做得不足。数据泄漏造成的罚款和后果比垃圾邮件更严重。这是一个在与垃圾邮件的战斗中不应被忽视的领域。