当前位置: 首页 > 专利查询>微软公司专利>正文

外发垃圾邮件的阻止制造技术

技术编号:2866303 阅读:350 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供了用于在不同网络通信环境中检测和阻止垃圾邮件的系统和方法。特别是,本发明专利技术提供了几种用于监视外发通信的技术以识别潜在的垃圾邮件制造者。可以通过检测部件来至少部分地实现潜在垃圾邮件制造者的识别,该部件至少监视每个发送者的外发信息量、接收者的数量,和/或外发信息速率之一。此外,可至少根据外发信息的部分内容来存储外发信息。可以对每个发送者的每个信息添加记分,并且如果每个发送者或每个信息的总记分超过了某个临界值,则可采取更多的行动来验证该潜在的垃圾邮件制造者是否是垃圾邮件制造者。这些行动包括人为检查信息的抽样,发送问题给该账户,发送法律通知去警告潜在的垃圾邮件制造者和/或关闭该账户。

【技术实现步骤摘要】

本专利技术涉及用于识别垃圾邮件信息的系统和方法。尤其是监视外发通信来帮助识别垃圾邮件的发送者。
技术介绍
诸如互联网之类的全球通信网的出现对能够得到大量潜在的消费者而展示了商机。电子信息,特别是电子邮件(“email”)作为向网络用户传播不需要的广告和宣传(也表示为“垃圾邮件”)的手段变得日益普遍。Radicati Group.Inc,一个咨询和市场调查公司,估测出在2002年8月中每天都发送了20亿封垃圾邮件—这个数字有可能每两年翻三番。个人和组织(例如商业、管理机构)被日益增多的打扰,并且时常因为垃圾信息而不快。照那样的话,垃圾邮件现在或不远的将来将会很快成为可靠计算的主要威胁。用于阻止垃圾邮件的普通技术包括使用过滤系统/方法。一种公认的过滤技术是基于机器学习方法。在该方法中,通常从两种类型的举例信息(例如垃圾邮件和非垃圾邮件信息)中提取出特征,并使用一个学习过滤器在这两种类型之间辨别可能性。由于大多数信息特征与内容(例如,主题和/或信息本身中的词和短语)有关,这种类型的过滤器通常被称为“基于内容的过滤器”。此外,传统的垃圾邮件过滤器和过滤技术通常在外来信息上操作或与外来信息进行操作。也就是说,从滤波器中传送外来信息以识别垃圾邮件和好的信息。由于许多垃圾邮件制造者已经想到回避或绕开这些类型的过滤器的方法,这些滤波器仍然不够完善。因此,传统的基于内容的和/或适应性垃圾邮件过滤器通常在有效地识别垃圾邮件和阻止外来信息方面是无效的。本专利技术的概述为了提供对本专利技术的一些方面的基本理解,接下来将描述本专利技术的概要。该概要不是本专利技术的广泛观点。其并不想确定本专利技术的关键点/要点或描绘本专利技术的范围。其唯一的目的是以简单的形式展现本专利技术的一些观点,作为之后对本专利技术的详细描述的前序。本主题专利技术提供了用于在各种网络通信环境中检测和阻止垃圾邮件的系统和方法。特别是,本专利技术提供了几种技术,该技术通过监视诸如邮件、即时信息发送、密谈聊天室、和/或聊天室信息这样的信息来识别潜在的垃圾邮件发送者,也称为垃圾邮件制造者。垃圾邮件制造者经常试图通过利用合法的因特网服务提供者(ISP)或其它信息服务来发送他们的垃圾邮件。而这种行为严重的增加了ISP的带宽以及维护的费用,并降低了ISP作为信息委托资源的声誉,这可以妨碍其取得发送的合法信息的能力。由于ISP提供了免费的用户账户而使得垃圾邮件制造者可以最容易利用它,因此该问题对ISP来说是非常重要的。区别于常规垃圾邮件的阻止方法,本专利技术通过检查用户的外发信息—与外来信息相反—来识别潜在的垃圾邮件制造者。一种技术包括追踪发送者的信息数量和/或接收人数量。举例来说,被要求发送信息的ISP服务器可以保存特定用户的发送信息数量的计数。作为选择,ISP服务器可通过检查信息的“To”栏和“cc”栏(副本)来对该特定信息的接收者数量进行计数。可以在一个周期时间内(例如,每小时、每天、每星期、每月、每年、每隔h小时,每个d天等)对这些类型的计数进行追踪,或者可以得到用户曾经发送的信息总数(例如从激活或打开账户到现在)。由于大多数垃圾邮件者向相对大量的收件人发送信息合法用户通常向相对少量的收件人发送信息,因此这种技术是相当有效的。另一种用于识别潜在的垃圾邮件制造者的技术包括机器学习系统和方法。例如,垃圾邮件具有属于它们自己而且通常在合法信息中不会发现的特征。可以识别出这种特征,并将这种特征连同机器学习系统一起使用以建立和训练过滤器。机器学习系统可以分配一个概率给外发信息并向ISP服务器或服务器操作者传达各自的外发信息将落在最不类似垃圾邮件和最类似垃圾邮件的范围中的某处。处理外发信息的服务器基于至少部分基于一个或多个外发信息为最类似垃圾邮件的概率来确定适当的行为方式。可以将发送的信息中具有高概率成为垃圾邮件的发送者视为比仅发送具有成为垃圾邮件的低概率的信息的发送者更可疑。除了或代替使用过滤器对一些或所有外发信息分配概率,还可以根据某些重要特征对外发信息进行记分,其中该记分表示该特定的信息更可能是垃圾邮件。举例来说,本质上所有的垃圾邮件都包含与垃圾邮件制造者的联系方式,如URL或电话号码。可分配一个高记分给带有URL、链接、或电话号码的信息,给那些不带这些内容的信息一个低记分,或甚至是等于0的记分。可以将这些记分添加到不同信息的机器学习系统概率中,或代替过滤器使用。一些垃圾邮件制造者可以巧妙地控制机器学习系统以及同样的设备来分配等于0或近似于0的外发信息记分,使得不论其内容如何这些垃圾邮件作为非垃圾邮件或不太像的垃圾邮件通过。因此,本专利技术的另一方面通过总是或几乎总是对每个外发信息分配某个最小记分而使记分总和(例如每个信息的总记分=MLS概率+最小记分)以某个可能的速率增加,以帮助减少垃圾邮件制造者的控制。作为选择,可以为每个信息设置最小记分,例如每个信息的总记分=max(MLS概率,最小记分)。如果每个外发信息的记分总和超过了某个临界值数,则可标记该信息和/或各自的发送者为潜在的垃圾邮件制造者。还有一种用于检测潜在的垃圾邮件制造者的技术包括对用户所发信息的不同接收者进行追踪和计数。垃圾邮件制造者倾向于发送出少量的信息给大量不同接收者。而在本专利技术中,一个发送给20个接收者(如在“To”区域中列出了20个接收者)的信息相当于20个信息。因此,对用户发送到的不同接收者的数量的计数任务可能是高消耗及低效率的。为了减少这种极低效率,可执行对所有信息接收者的抽样或探询来估计在任意期望的周期内每个发送者的接收者总数。垃圾邮件制造者比合法用户更可能试图发送邮件到无效的邮箱中。因此,大量失败的传送尝试也是垃圾邮件的象征。这些失败可出现在信息交付时期,或者也可以在NDRs(未交付收据)送回给发送者的时候。这种技术的缺点是,有时用户会成为被垃圾邮件制造者使用他们的名字来发送垃圾邮件的受害者,而导致NDR实际上并不是来自于该用户。验证信息实际发送信息的发送者是可行的。例如,可通过追踪来自该用户的信息的接收者或由该用户发送的信息来实现。每一次交付失败时可分配一个较大的记分。此外,可以追踪指定的接收者来维护那些从例如被怀疑是潜在的垃圾邮件制造者的指定发送者处所接收到的信息的记录。可以对发送到这些指定接收者的信息进行存储和/或分配给它们一个MSL概率。可以追踪每个接收者或每个发送者的最差得分信息。因此,计算每个发送者的全部接收者的最差记分总和可以帮助确定该发送者是否是潜在的垃圾邮件制造者。该技术通过不处罚或较少的处罚而允许合法用户发送大量不像垃圾邮件的信息给接收者。发送单个类似垃圾邮件的信息也是有害的。此处假设给出的接收者可能会阻止或通告任何发送大量信息到相同接收者的垃圾邮件制造者,或至少认出该发送者的名字并不打开附加信息。垃圾邮件制造者是不可能发送合法邮件的。由此可以假设发送大量合法邮件和少量类似垃圾邮件的用户可能是合法的。因此,可以追踪用户发送的明显合法的邮件数量,以及由于发送了合法邮件而对该用户提供“奖励”。该奖励可以是增加或减少发送者记分的形式。作为选择,该奖励可以是允许用户发送额外的外发信息(例如在每个指定的时间框架内超过分配的数量)的形式。垃圾邮件制造者可能通过发送合法邮件试图利用该技术。因此,应该限制潜在的奖励,例本文档来自技高网...

【技术保护点】
一种用于减少外发垃圾邮件的系统,包含:检测部件,用于至少结合一个外发信息来检测潜在的垃圾邮件制造者,该外发信息至少包含即时信息垃圾邮件、密谈垃圾邮件、以及聊天室垃圾邮件中的一个,该检测至少部分地依据垃圾邮件过滤器、信息量监视、总接收者计数、指定接收者计数、信息速率监视、明显的合法信息的数量,以及没有送达的信息数量中的一个;以及动作部件,从检测部件上接收实体是潜在的垃圾邮件制造者的信息,该部件启动至少一个动作来用于进行确定该实体是垃圾邮件制造者、减少该实体的垃圾邮件制造行为、增加垃圾邮件制造者的费用,以及它们的组合中的任何一项。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:JT古德曼RL劳斯维特EC吉伦
申请(专利权)人:微软公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1