一种图像邮件的检测分析方法技术

技术编号:10898488 阅读:67 留言:0更新日期:2015-01-12 19:40
本发明专利技术涉及一种图像邮件的检测分析方法。该方法基于邮件中的图像,以及邮件的其它内容属性检测过滤。首先,截取邮件中的图像或子区域图像与用户的垃圾图像库匹配,若匹配,则为垃圾邮件;否则,查询用户的黑名单列表和白名单列表、以及基于信任度分值的灰名单,获得邮件的类别;对于无法确认类别的邮件,可通过查询网络中朋友节点的黑名单列表和白名单列表获得该邮件的类别,所述朋友节点是指与当前用户节点之间具有较高邮件交互频率的网络节点;还可以将该邮件发送至云端服务器进行类别判断。该方法可有效检测过滤邮件中的垃圾图片,并可对邮件进行多层次和级别的全面检测分析。

【技术实现步骤摘要】
一种图像邮件的检测分析方法
本专利技术涉及网络通信领域。具体地,涉及一种图像邮件的检测分析方法。
技术介绍
随着互联网应用的发展,电子邮件得到广泛的应用,已成为Internet上最基本的服务之一,用户可以通过电子邮件与远程用户进行经济、方便和快捷的信息交流。然而,就在电子邮件逐渐成为一种不可缺少的重要信息交流工具的同时,也正在成为一种商业广告手段。用户在收到有用信息的同时,还必须花费大量时间和精力多各种各样的邮件进行分类识别,以过滤“垃圾”邮件,而现有的邮件分类识别方法或采用较单一的分类识别方法而导致结果不准确,或使用过于复杂的识别方式而提高了时间成本。因此,如何提高邮件分类识别的准确率以及效率是目前研究的热点问题。现有技术在处理单机垃圾邮件过滤方面卓有成效。如今,最好的垃圾邮件过滤累积差错已经远低于1%。这似乎意味着人们已经在对抗垃圾邮件的战役中取得了胜利。但另外一方面,垃圾邮件制造者采用更加隐蔽的信息载体形式,即图片或图像形式,我们称这种垃圾邮件为图像垃圾邮件。他们将文字嵌入到图像当中,使得一些基于文本的过滤系统无法识别而失效。这种包含图片或者图像的垃圾邮件正以很快的速度增长,这些垃圾邮件可避免基于文本的过滤器的过滤。由于图像垃圾邮件可以比文本邮件能更好的躲避过滤器,为垃圾邮件制造者所发送的垃圾邮件提供了更好的保护屏障,从而也给用户带来了不少负担。图像垃圾邮件现状:图像垃圾邮件,是垃圾邮件发送者宣传其信息并诱使用户针对其信息进行操作的一种新型垃圾邮件。垃圾邮件发送者将信息作为嵌入附件的一部分(如gif)也或者是嵌入网页中的而不是在邮件主题内容中发送。这些图像自动地显示给最终用户,但是图像本身内容却可以躲过大部分垃圾邮件过滤器的过滤。更复杂的图像垃圾邮件的增长已经导致电子邮件安全行业垃圾邮件截获率的全面下降,使最终用户感到失望。因为许多邮件系统无法跟上这些垃圾邮件数量的增长速度,电子邮件基础设施逐渐堵塞。由于图像文件的格式与电子邮件中的文本完全不同,因此基于文本内容的过滤器绝对“发现”不了垃圾邮件信息的内容,因此这些过滤器很容易被这类垃圾邮件欺骗。图像垃圾邮件的过滤技术:从邮件过滤的执行方法来说大致可以分为以下3类:一是基于IP地址的方式,根据发送方的邮件地址或地址,拒绝接收不正当的邮件攻击;二是基于手工规则的过滤,手工设置一些规则,只要符合这些规则的一条或几条,就认为是垃圾邮件;三是基于邮件内容的过滤,通过对邮件内容进行识别和检查,来决定是否接收邮件。另外随着邮件过滤技术的发展还出现了一些其它的方法。目前大部分图像过滤方法主要是针对广告图像中的文字内容进行提取与分析,这种针对图像文字的操作往往难以见效,垃圾邮件制造者可以很容易地做一些预处理而躲避过滤器的检测。从另一个角度来看,关于垃圾邮件的定义本身就是个难题,仅通过一个算法或者规则去判别垃圾邮件是不现实的,因为“垃圾邮件”只是一个相对的定义,并不存在一个绝对的评判标准能够完全正确地进行区分,所以应该根据具体用户的意见进行垃圾邮件的识别与过滤。垃圾邮件不存在普遍适用的具体评判准则,而应该属于个性化的定义,交由邮件用户做具体的判断是较为合理的。此外,由于图像垃圾邮件绝大部分是广告邮件,无论广告的产品内容如何变化,生产商的相关信息(例如商标图案)却往往是固定不变的,所以垃圾图片的局部内容重复性很高,针对这一特性,可以利用这部分重复性高的子图内容去识别同属一系列的广告垃圾图像。同时,通过长期的研究,现有技术在处理单机垃圾邮件过滤方面卓有成效。但近年来复杂网络和社会网络方面研究的深入开展,人们普遍猜测真实世界网络都具有无标度和小世界的特性,比如计算机网络、神经系统、交通网络、电力网络、邮件网络、社会关系网络等等。为何现有现状和用户体验之间有如此之大的落差?这应归结于以往的垃圾邮件过滤技术大多从个人用户角度考虑垃圾邮件的防治,从而忽略了用户之间实际上是一种相互影响、相互协作的关系而联结在一起,进而表现出某些类似的特性。网络中存在许多的孤立节点,而如果两个网络用户节点之间如果存在较大的邮件交互(收发邮件)频率,则意味着这两个用户节点之间有较高的同质性。用户收到的垃圾邮件绝大部分来自于之前从未接触过的邮件收/发件人;另一方面,随着邮件收/发件人的熟悉或信任程度的增加,邮件是垃圾邮件的概率将迅速降低。由于与用户节点进行邮件交互的网络IP地址数量较庞大且不断动态增长,要全面分析所有人的邮件交互关系是不可能的,也是没有必要的。云计算(CloudComputing)是近年来在互联网领域新兴的一个热点,它将应用的“计算”从终端转移到服务器端,交给“云”端去做,从而弱化了对终端设备的处理需求,用户不关心应用的具体实现方式,应用的实现和维护由其提供商完成,云计算具有规模经济性,多个用户通过互联网共享同一应用,进而实现了计算在客户间的共享,显著提高了处理器和存储设备的利用率,也避免了用户对信息系统的重复建设。在云计算模式下,邮件复杂的过滤任务交给云端去做,弱化了对终端设备的处理需求,符合瘦客户端的发展趋势。云计算为存储和管理数据提供了几乎无限多的空间,也为我们完成各类应用提供了几乎无限强大的计算能力。把海量邮件的过滤任务转移到可以提供无限处理能力的“云”端,避免了传统反垃圾邮件系统在少数服务器上执行,服务器功能单一,处理能力有限,容易发生系统瓶颈等缺点。云计算可以轻松实现信息共享在云环境下,邮件被送到“云”端分析,如果一封邮件被判定为垃圾邮件,它的判定结果会被保存在“云”端垃圾邮件数据库中,只要有一封垃圾邮件被识别了,整个互联网的用户都可以共享该结果,网络中资源得到充分利用,可以更有效更准确的识别垃圾邮件,这与云防毒的思想比较类似,把病毒的查杀功能通过网络放到云端,终端不需要装大容量的病毒样本库,也不用管病毒库的升级,这样既可以消除防御空窗期,也可以减轻用户维护管理的负担。
技术实现思路
本专利技术的主要目的在于提供一种图像邮件的检测分析方法,该方法首先基于邮件中的图像,其次基于邮件的其它内容及属性进行检测过滤:首先,截取邮件中的图像或子区域图像与用户的垃圾图像库匹配,若匹配,则为垃圾邮件;否则,查询用户的黑名单列表和白名单列表、以及基于信任度分值的灰名单,获得邮件的类别;对于无法确认类别的邮件,可通过查询网络中朋友节点的黑名单列表和白名单列表获得该邮件的类别,所述朋友节点是指与当前用户节点之间具有较高邮件交互频率的网络节点;还可以将该邮件发送至云端服务器进行类别判断。上述方法可有效检测过滤邮件中的垃圾图片,并可结合其他检测方法对邮件进行多层次和级别的全面检测分析,可解决现有技术中对于垃圾邮件的识别的计算代价过大、效率较低的问题。为了实现上述目的,根据本专利技术的一个方面,提供了一种图像邮件的检测分析方法,包括以下步骤:步骤1,截取邮件中的图像或图像的子区域图像,将所述图像或子区域图像与用户节点的垃圾图像库中的图像进行匹配,如果存在匹配项,则该邮件的分类属性为垃圾邮件,结束;否则,执行步骤2;步骤2,根据用户接收的邮件的地址查询该用户节点本地存储的黑名单列表和白名单列表,获得该邮件的分类属性,所述分类属性包括:垃圾邮件、正常邮件、以及无法确认;如果该邮件的地址在黑名单列表中,则该本文档来自技高网
...
一种图像邮件的检测分析方法

【技术保护点】
一种图像邮件的检测分析方法,其特征在于,该方法包括以下步骤:步骤1,截取邮件中的图像或图像的子区域图像,将所述图像或子区域图像与用户节点的垃圾图像库中的图像进行匹配,如果存在匹配项,则该邮件的分类属性为垃圾邮件,结束;否则,执行步骤2;步骤2,根据用户接收的邮件的地址查询该用户节点本地存储的黑名单列表和白名单列表,获得该邮件的分类属性,所述分类属性包括:垃圾邮件、正常邮件、以及无法确认;如果该邮件的地址在黑名单列表中,则该邮件的分类属性为垃圾邮件;如果该邮件的地址在白名单列表中,则该邮件的分类属性为正常邮件;否则,该邮件的分类属性为无法确认。

【技术特征摘要】
1.一种图像邮件的检测分析方法,其特征在于,该方法包括以下步骤:步骤1,截取邮件中的图像或图像的子区域图像,将所述图像或子区域图像与用户节点的垃圾图像库中的图像进行匹配,如果存在匹配项,则该邮件的分类属性为垃圾邮件,结束;否则,执行步骤2;步骤2,根据用户接收的邮件的地址查询该用户节点本地存储的黑名单列表和白名单列表,获得该邮件的分类属性,所述分类属性包括:垃圾邮件、正常邮件、以及无法确认;如果该邮件的地址在黑名单列表中,则该邮件的分类属性为垃圾邮件;如果该邮件的地址在白名单列表中,则该邮件的分类属性为正常邮件;否则,该邮件的分类属性为无法确认;所述将所述图像或子区域图像与用户节点的垃圾图像库中的图像进行匹配的过程使用基于特征的图像匹配方法;其中,所述基于特征的图像匹配方法包括:基于空间关系的匹配算法、基于不变量描述的匹配算法、金字塔算法和小波算法;所述图像的子区域包括:文字区域和广告公司商标图案;如果邮件的分类属性为无法确认,则执行以下步骤:步骤3,用户节点向所有朋友节点发出一个查询请求,所述查询请求包含当前邮件的地址信息;步骤4,朋友节点根据所述查询请求搜索自己的黑名单列表和白名单列表,如果发现命中黑名单列表或白名单列表,则向该用户节点返回查询结果,所述查询结果表示该邮件的类型是垃圾邮件或正常邮件;如果收到朋友节点返回的查询结果,并且所有的查询结果所表示的邮件类型相同,则执行步骤5;否则,执行步骤6;步骤5,用户节点根据该查询结果更新本地的黑名单列表或白名单列表,结束;步骤6,将该邮件发送至云端服务器,以判断该邮件的类别;其中,所述朋友节点是指与当前用户节点之间具有较高的邮件交互频率的网络节点。2.根据权利要求1所述的方法,其特征在于,如果用户节点将邮件发送至云端服务器,则云端服务器执行以下操作:步骤7,接收云计算网络中用户节点发送的邮件,将所述邮件发送至垃圾邮件数据库;步骤8,查看云端服务器的垃圾邮件数据库,判断所述邮件是否与垃圾邮件数据库中的邮件匹配;如果匹配,执行步骤9;否则,执行步骤10;步骤9,将该垃圾邮件数据库中对应的结果报告返回给用户节点,结束;步骤10,将该邮件发送给多个不同的过滤引擎并进行分析;步骤11,整合多个不同的过滤引擎产生的子结果得到一个结果报告,该结果报告表明该邮件是否为垃圾邮件,将该结果报告返回给用户节点,结束。3.根据权利要求2所...

【专利技术属性】
技术研发人员:罗阳陈虹宇王峻岭
申请(专利权)人:四川神琥科技有限公司
类型:发明
国别省市:四川;51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1