垃圾邮件的识别方法及装置制造方法及图纸

技术编号:16219386 阅读:61 留言:0更新日期:2017-09-16 01:52
本发明专利技术提供一种垃圾邮件的识别方法及装置。该垃圾邮件的识别方法,包括:接收邮件并对邮件进行解析,以获取邮件的IP地址和邮件内容,其中邮件内容包括主题、正文和附件;通过预设校验算法,对邮件内容进行计算,得到邮件的校验码;判断邮件的校验码是否存在于垃圾邮件样本中,其中,垃圾邮件样本中存储有不同的垃圾邮件对应的校验码;若邮件的校验码存在于垃圾邮件样本中,则识别邮件为垃圾邮件。本发明专利技术提供的方法及装置能够基于垃圾邮件的行为特征对邮件进行识别,以提高垃圾邮件的识别率。

Method and device for identifying spam

The invention provides a method and a device for identifying junk mail. Including the identification method, the spam mail: receives and parses the message, the IP address and e-mail content to get the message, the message content including theme, text and accessories; through the preset calibration algorithm, the contents of the message are calculated by mail check code; check code to judge whether exists in email spam samples the check code storage, spam samples corresponding to different spam; if the check code exists in the email spam samples, is identified as spam mail. The method and the device provided by the invention can identify the mail based on the behavior characteristics of the junk mail, so as to improve the recognition rate of the junk mail.

【技术实现步骤摘要】
垃圾邮件的识别方法及装置
本专利技术涉及垃圾邮件识别技术,尤其涉及一种垃圾邮件的识别方法及装置。
技术介绍
随着互联网的广泛普及,邮件已经成为常用的通信工具之一,但用户常会收到各种垃圾邮件,严重影响用户对正常邮件的查收和处理。因此,识别垃圾邮件越来越重要。目前基于概率统计的贝叶斯识别技术为常用的识别垃圾邮件技术,该技术会收集大量的正常邮件样本和垃圾邮件样本,把正常邮件样本和垃圾邮件样本的内容进行分词,统计各个分词在正常邮件样本和垃圾邮件样本的次数。然而,基于概率统计的贝叶斯识别技术对于不适合分词的垃圾信息(如图片等)识别的效果不佳,现亟需一种识别准确率较高的识别垃圾邮件技术。
技术实现思路
本专利技术提供一种垃圾邮件的识别方法及装置,以解决现有的基于概率统计的贝叶斯识别技术识别准确率较低的问题。本专利技术提供一种垃圾邮件的识别方法,包括:接收邮件并对所述邮件进行解析,以获取所述邮件的IP地址和邮件内容,其中所述邮件内容包括主题、正文和附件;通过预设校验算法,对所述邮件内容进行计算,得到所述邮件的校验码;判断所述邮件的校验码是否存在于垃圾邮件样本中,其中,所述垃圾邮件样本中存储有不同的垃圾本文档来自技高网...
垃圾邮件的识别方法及装置

【技术保护点】
一种垃圾邮件的识别方法,其特征在于,包括:接收邮件并对所述邮件进行解析,以获取所述邮件的IP地址和邮件内容,其中所述邮件内容包括主题、正文和附件;通过预设校验算法,对所述邮件内容进行计算,得到所述邮件的校验码;判断所述邮件的校验码是否存在于垃圾邮件样本中,其中,所述垃圾邮件样本中存储有不同的垃圾邮件对应的校验码;若所述邮件的校验码存在于所述垃圾邮件样本中,则识别所述邮件为垃圾邮件。

【技术特征摘要】
1.一种垃圾邮件的识别方法,其特征在于,包括:接收邮件并对所述邮件进行解析,以获取所述邮件的IP地址和邮件内容,其中所述邮件内容包括主题、正文和附件;通过预设校验算法,对所述邮件内容进行计算,得到所述邮件的校验码;判断所述邮件的校验码是否存在于垃圾邮件样本中,其中,所述垃圾邮件样本中存储有不同的垃圾邮件对应的校验码;若所述邮件的校验码存在于所述垃圾邮件样本中,则识别所述邮件为垃圾邮件。2.根据权利要求1所述的方法,其特征在于,若所述邮件的校验码不存在于所述垃圾邮件样本中,所述方法还包括:针对已接收到的邮件的IP值和校验码,判断所述邮件的校验码所对应的IP地址的个数是否大于预设阀值,所述邮件的校验码所对应的IP地址包括与所述邮件的校验码相同的校验码所对应的已接收到的邮件的IP地址和所述邮件的IP地址;若所述个数大于预设阈值,则识别所述邮件为垃圾邮件,并将所述邮件的校验码写入到所述垃圾邮件样本中;若所述个数小于所述预设阈值,则识别所述邮件为正常邮件。3.根据权利要求2所述的方法,其特征在于,所述针对已接收到的邮件的校验码和IP值,判断所述邮件的校验码所对应的IP地址的个数是否大于预设阀值,包括:判断临时缓存中是否存储有与所述邮件的校验码相同的校验码,所述临时缓存中存储有所述已接收到的邮件对应的不同的校验码和各所述校验码对应的IP地址集合;若是,则将所述邮件的IP地址写入到与所述邮件的校验码相同的校验码对应的IP地址集合中,并判断所述相同的校验码所对应的IP地址的个数是否大于预设阀值;若否,则将所述邮件的校验码和IP地址写入到所述临时缓存中。4.根据权利要求3所述的方法,其特征在于,所述方法还包括:获取所述临时缓存中写入校验码的写入时刻距当前时刻的间隔时长;判断所述间隔时长是否大于预设时长;若是,则释放所述临时缓存。5.根据权利要求1所述的方法,其特征在于,所述预设校验算法包括MD5算法或SHA1算法。6.一种垃圾邮件的识别装置,其特征在于,包括:获取模块,...

【专利技术属性】
技术研发人员:黄福昌王海斌李宁宁
申请(专利权)人:北京二六三企业通信有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1