【技术实现步骤摘要】
一种垃圾邮件过滤方法、装置、系统及存储介质
[0001]本申请涉及互联网通讯
,更具体地说,尤其涉及一种垃圾邮件过滤方法、装置、系统及存储介质。
技术介绍
[0002]电子邮件是一种用电子手段提供信息交换的通信方式,是互联网应用最广的服务。通过网络的电子邮件系统,用户可以以非常低廉的价格(不管发送到哪里,都只需负担网费)、非常快速的方式(几秒钟之内可以发送到世界上任何指定的目的地),与世界上任何一个角落的网络用户联系。
[0003]在电子邮件中常常存在垃圾邮件,例如,用于各种商业宣传的广告邮件或用来窃取用户账号信息的钓鱼邮件,或者是用于宣传反动信息的反动邮件,这些垃圾邮件严重威胁了网络资源的共享性、交互性和开放性,影响了用户使用电子邮件的体验感。
[0004]相较于普通的文字内容的垃圾邮件,垃圾邮件制造者会采用另一种更加隐蔽的垃圾邮件模式,即邮件中没有任何文字内容,或者文字内容中没有涉及垃圾内容,只有附件中有不含文字的反动或色情或欺诈等内容的图片,让基于文本过滤的邮件系统无法识别此类垃圾邮件,而对于垃圾 ...
【技术保护点】
【技术特征摘要】
1.一种垃圾邮件过滤方法,其特征在于,包括如下步骤:读取邮件内容;判断所述邮件内容中是否包含图片;若包含,则提取图片中的特征向量;判断在预存的向量集合中是否存在所述特征向量;若存在,则将邮件标记为垃圾邮件,中断操作。2.根据权利要求1所述的垃圾邮件过滤方法,其特征在于,在所述读取邮件内容之前,还包括:读取已有的垃圾邮件中的图片;截取图片中包含垃圾信息的区域图像;提取所述区域图像的特征向量;将所述特征向量存入所述向量集合。3.根据权利要求1所述的垃圾邮件过滤方法,其特征在于,在所述判断所述邮件内容中是否包含图片之后,还包括:若不包含,则对所述邮件内容的文字进行文本分类,形成所述内容组词;根据过滤规则,判断所述内容词组中是否包含敏感词组;若包含,则将邮件标记为垃圾邮件,中断操作;若不包含,则将邮件标记为正常邮件。4.根据权利要求1所述的垃圾邮件过滤方法,其特征在于,在所述读取邮件内容之前,还包括:读取邮件标题;对所述标题进行文本分类,形成标题词组;根据过滤规则,判断所述标题词组中是否包含敏感词组;若包含,则将邮件标记为垃圾邮件,中断操作;若不包含,则进入下一步。5.根据权利要求1所述的垃圾邮件过滤方法,其特征在于,所述若包含,则将邮件标记为垃圾邮件,中断操作具体为:若包含,将此发...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。