当前位置: 首页 > 专利查询>微软公司专利>正文

使用模板生成和指纹比较特征管理不想要的通信制造技术

技术编号:7789348 阅读:209 留言:0更新日期:2012-09-21 23:52
本发明专利技术涉及使用模板生成和指纹比较特征管理不想要的通信。提供不想要通信的检测和/或管理特征,包括使用一个或多个共性度量作为生成模板以进行指纹化和对比操作的一部分,但是这些实施例不限于此。一个实施例的计算架构包括被配置成为已知不想要通信生成模板和相关联指纹的组件,其中将该模板指纹与未知通信指纹进行比较,作为确定该未知通信是否是基于类似模板的并且可以被恰当分类为不想要的或可能不安全的通信以进行后续分析和/或阻挡的一部分。一个实施例的方法用于使用多个模板指纹来检测未知通信并将其分类为兜售信息、网络钓鱼(phishing)、和/或其他不想要通信。

【技术实现步骤摘要】

本专利技术涉及使用模板生成和指纹比较特征管理不想要的通信
技术介绍
兜售信息(spam) —般被描述为使用电子消息收发系统来发送未经请求的、而且通常是不想要的批量消息。兜售信息一般可被表征为包含一些不想要的或者未经请求的电子通信。3 售信息包含许多电子服务,包括电子邮件3 售信息、即时消息收发3 售信息、Usenet新闻组兜售信息、Web搜索引擎兜售信息、博客中的兜售信息、维基兜售信息、在线分类广告兜售信息、移动设备兜售信息、因特网论坛兜售信息、社交联网兜售信息等。兜售信息检测和保护系统尝试标识并控制兜售信息通信。 当前的兜售信息检测系统使用基本内容过滤技术,像正则表达式或关键字匹配,作为检测兜售信息的一部分。然而,这些系统不能够捕捉所有类型的兜售信息和其他不想要的通信。例如,兜售信息者通常重用(reuse)HTML/文字模板来发送兜售信息。除了检测和消除问题以外,兜售信息技术一直涉及对绕过原地兜售信息检测和/或排除技术的尝试。此外,可缩放性(scalability)和性能问题成为部署某些兜售信息检测系统的考虑因素。不幸的是,标识和排除不想要的通信的传统方法和系统可能是资源密集的,并且难以实现附加的预防措施。
技术实现思路
提供本
技术实现思路
以便以简化的形式介绍将在以下的具体实施例中进一步描述的一些概念。本
技术实现思路
并不旨在标识出所要求保护的主题的关键特征或必要特征,也不旨在用于帮助确定所要求保护的主题的范围。各实施例提供不想要通信的检测和/或管理特征,包括使用一个或多个共性度量(commonality measure)作为生成模板以进行指纹化(fingerprinting)和对比操作的一部分,但是实施例不限于此。在一实施例中,计算架构包括被配置成为已知不想要的通信生成模板和相关联指纹的组件,其中将该模板指纹与未知通信指纹进行比较,作为确定该未知通信是否是基于类似模板的并且可以被恰当分类为不想要的或可能不安全的通信以进行后续分析和/或阻挡的一部分。一个实施例的方法用于使用多个模板指纹来检测未知通信并将其分类为兜售信息、网络钓鱼(Phishing)、和/或其他不想要通信。还包括其他实施例。通过阅读下面的详细描述并参考相关联的附图,这些及其它特点和优点将变得显而易见。可以理解,前述一般描述和以下详细描述均仅是说明性的,并且不限制所要求保护的本专利技术。附图说明图I是示例性计算架构的框图。图2A-2B示出了使用包含系数计算作为标识兜售信息通信的一部分的示例性过程。图3是描绘标识不想要的电子通信的示例性过程的流程图。图4是描绘处理和管理不想要的电子通信的示例性过程的流程图。图5A- 描绘了部分地使用消 息来生成模板以进行指纹化并在消息表征操作中使用的示例。图6A-6C描绘了部分地使用消息来生成模板以进行指纹化并在消息表征操作中使用的示例。图7是描绘处理和管理不想要的电子通信的示例性过程的流程图。图8是描绘示例性兜售信息检测系统的方面的框图。图9是描绘示例性兜售信息检测系统的方面的框图。图10是示出用于实现此处所描述的各个实施例的示例性计算环境的框图。具体实施例方式图I是示例性计算架构100的框图,计算架构100包括处理、存储器和提供通信处理操作的其他组件/资源,这些操作包括处理电子消息的功能,作为防止不想要通信被传递和/或阻塞通信管道的一部分。例如,基于存储器和处理器的计算系统/设备可以被配置成提供消息处理操作,作为标识和/或防止兜售信息或其他不想要通信被传递到接收者的一部分。在一实施例中,架构100的组件可被用作对通信管道上的消息进行监视的一部分,包括部分基于一个或多个已知不想要通信模板指纹来标识不想要通信。例如,可以根据各种因素(诸如通过已知兜售信息实体)来生成模板指纹并将其分组。已知的不想要通信的模板的指纹可以代表已知不想要通信的已定义组或分组。如同下面描述的,假的和/或负面的反馈通信可被用作维护模板指纹储存库的方面的一部分,诸如删除/移除和/或添加/修改模板指纹。在一个实施例中,可以部分基于部分基于第一共性度量提取多个不想要通信的第一部分以及部分基于第二共性度量提取该多个不想要通信的第二部分来生成模板。例如,模板生成过程可以用于部分基于第一共性度量来标识并提取第一组电子消息的部分,其中该第一共性度量指示该第一组电子消息的所标识的部分之间有很少共性或没有共性。继续该示例,模板生成过程还可用于部分基于第二共性度量来标识并提取第二组(例如,跨多个组)电子消息的部分,其中该第二共性度量指示该第二组电子消息的所标识的部分之间的很高的或显著的共性(例如,跨多个消息的极常见的标记(markup)结构)。一旦已提取了这些部分,则可以生成指纹以用于检测不想要的通信,如下面讨论的。在另一实施例中,可以部分基于对自定义串解析器的使用来生成模板,该自定义串解析器被配置成提取包括超文本标记语言(HTML)的多个不想要的通信的已定义部分,作为生成用于指纹化的模板的一部分。一实施例的模板生成器可以被配置成从不想要通信数据结构中提取所有文字和标记属性,从而暴露基本标签(例如,<html>, <a>,〈table〉等)。例如,模板生成器可以使用自定义解析器来从MME消息部分移除文字,然后对剩余部分应用正则表达式,以提取纯标签,作为生成模板以用于指纹化和在消息表征操作中使用的一部分。继续参考图1,架构100的组件监视一个或多个电子通信,诸如例如专用消息通信管道,作为标识或监视不想要电子通信(诸如兜售信息、网络钓鱼和其他不想要通信)的一部分。如同下面讨论的,架构100的组件被配置成为一个或多个已知不想要电子通信生成模板和模板指纹。已知不想要电子通信的模板指纹可被用作将未知电子通信表征为安全或不安全的一部分。例如,已知不想要电子通信的模板指纹可被存储在计算机存储器(例如,远程的和/或本地的)中,并被与未知消息指纹进行比较,作为将未知电子消息表征或标识为不想要电子通信(例如,兜售信息消息、网络钓鱼消息等)的一部分。如图I所示,一实施例的架构100包括模板生成器组件或模板生成器102、指纹生成器组件或指纹生成器104、表征组件106、指纹储存库108、和/或知识管理器组件或知识管理器110。如图所示,并且如下面进一步描述的,架构100的组件可被用于监视并处理通信管道(例如,简单邮件传输(SMTP)管道)上的入站未知电子通信112的各方面,但是不 限于此。作为未知消息表征操作的示例,可基于兜售信息活动的指示(经由源IP地址、源域、相似度打分等完成)将电子邮件消息的集合分组在一起,并且可以使用模板处理操作来提供模板以进行指纹化。例如,微软的用于Exchange的前线在线保护(FOPE)维护已知会发送3 售信息的IP地址的列表,其中可以根据IP地址分组来生成模板。在一个实施例中,与该已知IP地址相关联的消息被用于捕捉实况兜售信息电子邮件,以供模板生成器102在生成用于指纹化的模板时使用。模板生成器102被配置成部分基于一个或多个源通信的方面来生成电子模板,但不限于此。例如,模板生成器102可以部分基于由标记语言和数据(例如,包括文字的HTML模板)组成的已知兜售信息或其他不想要通信的各方面来生成不想要通信模板。一实施例的模板生本文档来自技高网...

【技术保护点】

【技术特征摘要】
2011.02.17 US 13/029,2811.一种系统,包括 模板生成器组件(102),所述模板生成器组件被配置为移除已知不想要通信的第一部分、移除所述已知不想要通信的第二部分、以及使用所述已知不想要通信的剩余部分生成模板,其中所述第一部分与第一共性度量相关联,其中所述第二部分与第二共性度量相关联; 指纹生成器组件(104),所述指纹生成器组件被配置为生成所述模板的模板指纹和未知通信的未知通信指纹;以及 表征组件(106),所述表征组件被配置为将所述模板指纹和所述未知通信指纹的方面进行比较,作为确定所述未知通信是否是不想要通信的一部分;以及 指纹储存库(108),所述指纹储存库用于存储模板指纹。2.如权利要求I所述的系统,其特征在于,所述模板生成器组件(102)被配置为根据第一分组已知不想要通信来移除所述已知不想要通信的所述第一部分,其中所述第一共性度量与所述第一分组的所述已知不想要通信的很少的共性或没有共性相对应。3.如权利要求2所述的系统,其特征在于,所述模板生成器组件(102)被配置为根据第二分组通信来移除所述已知不想要通信的所述第二部分,其中所述第二共性度量与所述第二分组的所述第二部分之间的高程度的共性相对应。4.如权利要求I所述的系统,其特征在于,所述表征组件(106)被配置为部分基于包含系数评估来将所述未知通信分类为兜售信息,包括使用已知兜售信息模板的一组字单元和实况消息的一组字单元。5.如权利要求4所述的系统,其特征在于,所述表征组件(106)被配置为部分基于包含系数参数将主动未知电子消息分类为兜售信息,包括使用相似度参数比乘以所述模板中...

【专利技术属性】
技术研发人员:M·森达拉姆C·P·希洛维茨M·甘地C·W·拉曼纳
申请(专利权)人:微软公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1