当前位置: 首页 > 专利查询>李天明专利>正文

一种垃圾邮件过滤方法、装置、系统及存储介质制造方法及图纸

技术编号:33800379 阅读:26 留言:0更新日期:2022-06-16 10:05
本申请公开一种垃圾邮件过滤方法,包括如下步骤:读取邮件的标题与内容;对所述标题进行文本分类,形成标题词组;根据过滤规则,判断所述标题词组中是否包含敏感词组;若包含,则将邮件标记为垃圾邮件,中断操作;若不包含,则对所述内容进行文本分类,形成内容组词;根据过滤规则,判断所述内容词组中是否包含敏感词组;若包含,则将邮件标记为垃圾邮件,中断操作;若不包含,则将邮件标记为正常邮件。本申请提供的垃圾邮件过滤方法,能对垃圾邮件进行有效识别,减少用户收到垃圾邮件数量。减少用户收到垃圾邮件数量。减少用户收到垃圾邮件数量。

【技术实现步骤摘要】
一种垃圾邮件过滤方法、装置、系统及存储介质


[0001]本申请涉及互联网通讯
,更具体地说,尤其涉及一种垃圾邮件过滤方法、装置、系统及存储介质。

技术介绍

[0002]电子邮件是一种用电子手段提供信息交换的通信方式,是互联网应用最广的服务。通过网络的电子邮件系统,用户可以以非常低廉的价格(不管发送到哪里,都只需负担网费)、非常快速的方式(几秒钟之内可以发送到世界上任何指定的目的地),与世界上任何一个角落的网络用户联系。
[0003]电子邮件可以是文字、图像、声音等多种形式。同时,用户可以得到大量免费的新闻、专题邮件,并轻松实现轻松的信息搜索。电子邮件的存在极大地方便了人与人之间的沟通与交流,促进了社会的发展。
[0004]在电子邮件中常常存在垃圾邮件,例如,用于各种商业宣传的广告邮件或用来窃取用户账号信息的钓鱼邮件,或者是用于宣传反动信息的反动邮件,这些垃圾邮件严重地威胁了网络资源的共享性、交互性和开放性,影响了用户使用电子邮件的体验感。
[0005]因此,设计一种能对垃圾邮件进行有效识别,减少用户收到垃圾邮件数量的垃圾邮件过滤方法,是本领域技术人员函待解决的问题。

技术实现思路

[0006]为解决上述技术问题,本申请提供一种垃圾邮件过滤方法,能对垃圾邮件进行有效识别,减少用户收到垃圾邮件数量。
[0007]本申请提供的技术方案如下:
[0008]一种垃圾邮件过滤方法,包括如下步骤:
[0009]读取邮件的标题与内容;
[0010]对所述标题进行文本分类,形成标题词组;
[0011]根据过滤规则,判断所述标题词组中是否包含敏感词组;
[0012]若包含,则将邮件标记为垃圾邮件,中断操作;
[0013]若不包含,则对所述内容进行文本分类,形成内容组词;
[0014]根据过滤规则,判断所述内容词组中是否包含敏感词组;
[0015]若包含,则将邮件标记为垃圾邮件,中断操作;
[0016]若不包含,则将邮件标记为正常邮件。
[0017]优选的,所述若包含,则将邮件标记为垃圾邮件,中断操作具体为:
[0018]若包含,将此发件邮箱的记录值加一;
[0019]将邮件标记为垃圾邮件,中断操作。
[0020]进一步的,在所述读取邮件的标题与内容之前,还包括:
[0021]读取邮件的所述发件邮箱;
[0022]判断所述发件邮箱的记录值是否大于次数阈值;
[0023]若判断结果为是,则将邮件标记为垃圾邮件,中断操作;
[0024]若判断结果为否,则进入下一步。
[0025]优选的,所述若包含,则将邮件标记为垃圾邮件,中断操作具体为:
[0026]若包含,则获取敏感词组的出现次数;
[0027]判断所述出现次数是否大于敏感阈值;
[0028]若判断结果为是,则将邮件标记为垃圾邮件,中断操作;
[0029]若判断结果为否,则进入下一步。
[0030]优选的,在所述读取邮件的标题与内容之前,还包括:
[0031]判断服务器过滤规则的版本是否高于本地过滤规则的版本;
[0032]若判断结果为是,则获取所述服务器过滤规则,作为更新后的所述本地过滤规则;
[0033]若判断结果为否,则获取所述本地过滤规则;
[0034]读取所述本地过滤规则。
[0035]进一步的,所述若包含,则将邮件标记为垃圾邮件,中断操作具体为:
[0036]若包含,则将邮件标记为垃圾邮件;
[0037]将此垃圾邮件发送至服务器,更新所述服务器过滤规则;
[0038]中断操作。
[0039]一种垃圾邮件过滤装置,包括:
[0040]读取模块,用于读取邮件的标题与内容;
[0041]分类模块,用于对所述标题进行文本分类,形成标题词组;
[0042]过滤模块,用于根据过滤规则,判断所述标题词组中是否包含敏感词组;
[0043]所述分类模块,还用于对所述内容进行文本分类,形成内容词组;
[0044]所述过滤模块,还用于根据过滤规则,判断所述标内容词组中是否包含敏感词组;
[0045]与所述过滤模块相连的标记模块,所述标记模块用于根据所述过滤模块的判断结果,标记邮件为垃圾邮件或正常邮件。
[0046]进一步的,还包括:
[0047]记录模块,用于更新垃圾邮件的记录值;
[0048]判断模块,用于判断所述发件邮箱的记录值是否大于次数阈值。
[0049]一种垃圾邮件过滤系统,包括如上述任一所述的垃圾邮件过滤装置,其特征在于,还包括用于更新过滤规则的服务器。
[0050]一种存储介质,所述存储介质存储有计算机程序,其特征在于,所述计算机程序被执行后,实现如上述任一所述的垃圾邮件过滤方法。
[0051]本专利技术提供的垃圾邮件过滤方法,通过读取邮件的标题与内容,依次对标题和内容进行文本分类后,根据过滤规则,判断其中是否包含敏感词组,根据判断结果来将邮件标记为垃圾邮件或正常邮件,从而实现过滤垃圾邮件。能对垃圾邮件进行有效识别,减少用户收到垃圾邮件数量,解决垃圾邮件严重地威胁网络资源的共享性、交互性和开放性,影响用户使用电子邮件的体验感。
附图说明
[0052]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0053]图1为本专利技术实施例提供的垃圾邮件过滤方法的一种流程示意图;
[0054]图2为本专利技术实施例提供的垃圾邮件过滤装置的一种结构示意图。
具体实施方式
[0055]为了使本领域的技术人员更好地理解本申请中的技术方案,下面将对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0056]须知,本说明书附图所绘示的结构、比例、大小等,均仅用以配合说明书所揭示的内容,以供熟悉此技术的人士了解与阅读,并非用以限定本申请可实施的限定条件,故不具技术上的实质意义,任何结构的修饰、比例关系的改变或大小的调整,在不影响本申请所能产生的功效及所能达成的目的下,均应仍落在本申请所揭示的
技术实现思路
得能涵盖的范围内。
[0057]本专利技术实施例采用递进的方式撰写。
[0058]本实施例公开了一种垃圾邮件过滤方法,如图1所示,包括如下步骤:
[0059]S1.读取邮件的标题与内容;
[0060]S2.对标题进行文本分类,形成标题词组;
[0061]S3.根据过滤规则,判断标题词本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种垃圾邮件过滤方法,其特征在于,包括如下步骤:读取邮件的标题与内容;对所述标题进行文本分类,形成标题词组;根据过滤规则,判断所述标题词组中是否包含敏感词组;若包含,则将邮件标记为垃圾邮件,中断操作;若不包含,则对所述内容进行文本分类,形成内容组词;根据过滤规则,判断所述内容词组中是否包含敏感词组;若包含,则将邮件标记为垃圾邮件,中断操作;若不包含,则将邮件标记为正常邮件。2.根据权利要求1所述的垃圾邮件过滤方法,其特征在于,所述若包含,则将邮件标记为垃圾邮件,中断操作具体为:若包含,将此发件邮箱的记录值加一;将邮件标记为垃圾邮件,中断操作。3.根据权利要求2所述的垃圾邮件过滤方法,其特征在于,在所述读取邮件的标题与内容之前,还包括:读取邮件的所述发件邮箱;判断所述发件邮箱的记录值是否大于次数阈值;若判断结果为是,则将邮件标记为垃圾邮件,中断操作;若判断结果为否,则进入下一步。4.根据权利要求1所述的垃圾邮件过滤方法,其特征在于,所述若包含,则将邮件标记为垃圾邮件,中断操作具体为:若包含,则获取敏感词组的出现次数;判断所述出现次数是否大于敏感阈值;若判断结果为是,则将邮件标记为垃圾邮件,中断操作;若判断结果为否,则进入下一步。5.根据权利要求1所述的垃圾邮件过滤方法,其特征在于,在所述读取邮件的标题与内容之前,还包括:判断服务器过滤规则的版本是否高于本地过滤规则的版本;若...

【专利技术属性】
技术研发人员:李天明
申请(专利权)人:李天明
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1