垃圾邮件过滤方法及装置制造方法及图纸

技术编号:8492030 阅读:175 留言:0更新日期:2013-03-28 23:09
本发明专利技术涉及一种垃圾邮件过滤方法,包括:在接收到电子邮件时,扫描内容中是否存在命中预设的模糊词和情境识别库中条目的模糊词;如果存在命中条目,则对电子邮件进行情境分析,并根据电子邮件对应的情境调整得到电子邮件的邮件值向量;根据电子邮件的邮件值向量计算垃圾邮件概率,并将垃圾邮件概率与预设阈值进行比较,以判断电子邮件是否为可疑垃圾邮件,并对确定为可疑垃圾邮件的电子邮件进行拦截处理。本发明专利技术还涉及一种垃圾邮件过滤装置。本发明专利技术基于模糊词识别和情境分析,对包含模糊词的垃圾邮件进行拦截,在大大提高垃圾邮件的拦截范围的同时保证过滤的准确度,还对现有的以关键字过滤方式的垃圾邮件拦截方式提供了进一步的补充和优化。

【技术实现步骤摘要】

本专利技术涉及反垃圾邮件技术,尤其涉及一种垃圾邮件过滤方法及装置
技术介绍
垃圾电子邮件(简称垃圾邮件)是指未经用户许可就强行发送到用户的邮箱中的任何电子邮件。电子邮件是目前互联网用户的基础应用之一,而垃圾邮件主要通过电子邮箱来发送。2010年12月监测数据显示,全球每天发送的垃圾电子邮件数量约为500亿个。垃圾邮件的内容包括推销广告、成人广告、赚钱信息,以及包含电脑病毒等破坏性的电子邮件,给电子邮件使用者带来了诸多困扰,因此各大邮件提供商都把提升电子邮件反垃圾系统效果作为提升邮箱用户体验的重要关注点。 常用的反垃圾系统是通过预定义的关键字技术进行过滤的,即先预定义一个关键字列表,然后从通过的邮件中抓取内容与关键字列表进行对比,如果有命中的则进行相应的垃圾邮件拦截动作。这种单纯的关键字列表匹配方式虽然实现比较简单,但很容易被垃圾邮件制造者通过加插干扰字符、使用同音字、使用形近字等方式规避,进而令垃圾邮件过滤系统失效。另外,单纯关键字过滤的方案在识别正常邮件的能力上还有欠缺,可能将部分正常邮件错误拦截,影响到电子邮件使用者的正常使用。
技术实现思路
本专利技术的目的是提出一种垃圾邮件过本文档来自技高网...

【技术保护点】
一种垃圾邮件过滤方法,包括:在接收到电子邮件时,扫描所述电子邮件的内容中是否存在命中预设的模糊词和情境识别库中条目的模糊词;如果存在命中条目,则对所述电子邮件进行情境分析,并根据所述电子邮件对应的情境调整得到所述电子邮件的邮件值向量;根据调整后得到的所述电子邮件的邮件值向量计算垃圾邮件概率,并将所述垃圾邮件概率与预设阈值进行比较,以判断所述电子邮件是否为可疑垃圾邮件,并对确定为可疑垃圾邮件的电子邮件进行拦截处理。

【技术特征摘要】

【专利技术属性】
技术研发人员:郭涛于洪涌薛立宏丘凌张国威
申请(专利权)人:中国电信股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1