邮件处理方法、装置、计算机设备和存储介质制造方法及图纸

技术编号:38461181 阅读:12 留言:0更新日期:2023-08-11 14:38
本申请涉及一种邮件处理方法、装置、计算机设备、存储介质和计算机程序产品,涉及信息安全技术领域。方法包括:获取待接收邮件的发件地址,判断发件地址是否存在于预设名单中,根据判断结果,确定待接收邮件的初次处理结果;在初次处理结果为邮件待定的情况下,对待接收邮件进行文本预处理,得到待接收邮件对应的词向量;将词向量输入至至少两个分类模型中,对待接收邮件的文本内容进行分析,得到至少两个子分类结果;根据至少两个子分类结果,确定待接收邮件的最终处理结果。在根据预设名单对待接收邮件进行处理的基础上,基于训练好的邮件分类模型对待接收的邮件进行二次处理,能够对邮件进行基于内容的筛选,提高邮件的过滤效果和接收安全性。滤效果和接收安全性。滤效果和接收安全性。

【技术实现步骤摘要】
邮件处理方法、装置、计算机设备和存储介质


[0001]本申请涉及信息安全
,特别是涉及一种邮件处理方法、装置、计算机设备、存储介质和计算机程序产品。

技术介绍

[0002]近年来随着互联网相关应用的普及以及办公形式多样化发展,邮件系统逐步成为主流的办公软件之一,在有效提高数字化办公效率的同时,不可避免的存在接收垃圾邮件的情况。垃圾邮件的产生不仅会占用一定的用户邮箱资源,若其邮件信息中带有攻击性的病毒软件,将对企业安全办公环境造成极大的破坏,金融科技领域尤为如此。
[0003]在相关技术中,通过黑白名单对邮件名称进行筛选,以判断是否未垃圾邮件。由于上述识别过程中主要是通过邮件安全协议层面对邮件名称进行判断,缺乏接入应用再校验机制,也即对于不存在黑白名单中的邮件无法进行识别,且无法对邮件的内容进行具体识别。

技术实现思路

[0004]基于此,有必要针对上述技术问题,提供一种准确有效的邮件处理方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。
[0005]第一方面,本申请提供了一种邮件处理方法。所述方法包括:
[0006]获取待接收邮件的发件地址,判断发件地址是否存在于预设名单中,根据判断结果,确定待接收邮件的初次处理结果,初次处理结果包括接收邮件、拒收邮件以及邮件待定;
[0007]在初次处理结果为邮件待定的情况下,对待接收邮件进行文本预处理,得到待接收邮件对应的词向量;
[0008]将词向量输入至至少两个分类模型中,对待接收邮件的文本内容进行分析,得到至少两个子分类结果,子分类结果用于指示分类模型对待接收邮件的文本异常情况进行分类;
[0009]根据至少两个子分类结果,确定待接收邮件的最终处理结果,最终处理结果用于指示待接收邮件的接收情况。
[0010]在其中一个实施例中,预设名单包括白名单和黑名单;判断发件地址是否存在于预设名单中,根据判断结果,确定待接收邮件的初次处理结果,包括:
[0011]判断发件地址是否存在于黑名单中,在发件地址存在于黑名单中的情况下,则确定待接收邮件的初次处理结果为拒收邮件;
[0012]判断发件地址是否存在于白名单中,在发件地址存在于白名单中的情况下,则确定待接收邮件的初次处理结果为接收邮件;
[0013]在发件地址不存在于黑名单中且不存在于白名单中的情况下,则确定待接收邮件的初次处理结果为邮件待定。
[0014]在其中一个实施例中,对待接收邮件进行文本预处理,得到待接收邮件对应的词向量,包括:
[0015]获取自定义字典和引用停用词表,将待接收邮件的文本切分为若干个单词;
[0016]将若干个单词输入至Word2vec模型,得到待接收邮件对应的词向量。
[0017]在其中一个实施例中,根据至少两个子分类结果,确定待接收邮件的最终处理结果,包括:
[0018]在至少两个子分类结果均相同的情况下,确定待接收邮件的分类结果与子分类结果一致;
[0019]在至少两个子分类结果不相同的情况下,获取每一分类模型的分类正确率,根据每一分类模型的分类正确率,确定待接收邮件的最终处理结果。
[0020]在其中一个实施例中,根据每一分类模型的分类正确率,确定待接收邮件的最终处理结果,包括:
[0021]根据每一分类模型的分类正确率和每一分类模型对应的子分类结果,确定待接收邮件的每一分类结果对应的概率;
[0022]根据待接收邮件的每一分类结果对应的概率,确定待接收邮件的最终处理结果。
[0023]在其中一个实施例中,分类结果包括正确邮件和垃圾邮件;相应地,根据待接收邮件的每一分类结果对应的概率,确定待接收邮件的最终处理分类结果,包括:
[0024]在待接收邮件为正常邮件的概率大于为垃圾邮件的概率的情况下,确定待接收邮件的分类结果为正常邮件,最终处理结果为接收,并将第一安全等级标识赋予待接收邮件;
[0025]在待接收邮件为正常邮件的概率不大于为垃圾邮件的概率的情况下,确定待接收邮件的分类结果为垃圾邮件,最终处理结果为接收,并将第二安全等级标识赋予待接收邮件;
[0026]其中,第一安全等级高于第二安全等级。
[0027]第二方面,本申请还提供了一种邮件处理装置。所述装置包括:
[0028]第一处理模块,用于获取待接收邮件的发件地址,判断发件地址是否存在于预设名单中,根据判断结果,确定待接收邮件的初次处理结果,初次处理结果包括接收邮件、拒收邮件以及邮件待定;
[0029]文本预处理模块,用于在初次处理结果为邮件待定的情况下,对待接收邮件进行文本预处理,得到待接收邮件对应的词向量;
[0030]分类模块,用于将词向量输入至至少两个分类模型中,对待接收邮件的文本内容进行分析,得到至少两个子分类结果,子分类结果用于指示分类模型对待接收邮件的文本异常情况进行分类;
[0031]第二处理模块,用于根据至少两个子分类结果,确定待接收邮件的最终处理结果,最终处理结果用于指示待接收邮件的接收情况。
[0032]第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现以下步骤:
[0033]获取待接收邮件的发件地址,判断发件地址是否存在于预设名单中,根据判断结果,确定待接收邮件的初次处理结果,初次处理结果包括接收邮件、拒收邮件以及邮件待定;
[0034]在初次处理结果为邮件待定的情况下,对待接收邮件进行文本预处理,得到待接收邮件对应的词向量;
[0035]将词向量输入至至少两个分类模型中,对待接收邮件的文本内容进行分析,得到至少两个子分类结果,子分类结果用于指示分类模型对待接收邮件的文本异常情况进行分类;
[0036]根据至少两个子分类结果,确定待接收邮件的最终处理结果,最终处理结果用于指示待接收邮件的接收情况。
[0037]第四方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现以下步骤:
[0038]获取待接收邮件的发件地址,判断发件地址是否存在于预设名单中,根据判断结果,确定待接收邮件的初次处理结果,初次处理结果包括接收邮件、拒收邮件以及邮件待定;
[0039]在初次处理结果为邮件待定的情况下,对待接收邮件进行文本预处理,得到待接收邮件对应的词向量;
[0040]将词向量输入至至少两个分类模型中,对待接收邮件的文本内容进行分析,得到至少两个子分类结果,子分类结果用于指示分类模型对待接收邮件的文本异常情况进行分类;
[0041]根据至少两个子分类结果,确定待接收邮件的最终处理结果,最终处理结果用于指示待接收邮件的接收情况。
[0042]第五方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现以下步骤:
[00本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种邮件处理方法,其特征在于,所述方法包括:获取待接收邮件的发件地址,判断所述发件地址是否存在于预设名单中,根据所述判断结果,确定所述待接收邮件的初次处理结果,所述初次处理结果包括接收邮件、拒收邮件以及邮件待定;在所述初次处理结果为邮件待定的情况下,对所述待接收邮件进行文本预处理,得到所述待接收邮件对应的词向量;将所述词向量输入至至少两个分类模型中,对所述待接收邮件的文本内容进行分析,得到至少两个子分类结果,所述子分类结果用于指示分类模型对所述待接收邮件的文本异常情况进行分类;根据所述至少两个子分类结果,确定所述待接收邮件的最终处理结果,所述最终处理结果用于指示所述待接收邮件的接收情况。2.根据权利要求1所述的方法,其特征在于,所述预设名单包括白名单和黑名单;所述判断所述发件地址是否存在于预设名单中,根据所述判断结果,确定所述待接收邮件的初次处理结果,包括:判断所述发件地址是否存在于所述黑名单中,在所述发件地址存在于所述黑名单中的情况下,则确定所述待接收邮件的初次处理结果为拒收邮件;判断所述发件地址是否存在于所述白名单中,在所述发件地址存在于所述白名单中的情况下,则确定所述待接收邮件的初次处理结果为接收邮件;在所述发件地址不存在于所述黑名单中且不存在于所述白名单中的情况下,则确定所述待接收邮件的初次处理结果为邮件待定。3.根据权利要求1所述的方法,其特征在于,所述对所述待接收邮件进行文本预处理,得到所述待接收邮件对应的词向量,包括:获取自定义字典和引用停用词表,将所述待接收邮件的文本切分为若干个单词;将所述若干个单词输入至Word2vec模型,得到所述待接收邮件对应的词向量。4.根据权利要求1所述的方法,其特征在于,所述根据所述至少两个子分类结果,确定所述待接收邮件的最终处理结果,包括:在所述至少两个子分类结果均相同的情况下,确定所述待接收邮件的分类结果与子分类结果一致;在所述至少两个子分类结果不相同的情况下,获取每一分类模型的分类正确率,根据每一分类模型的分类正确率,确定所述待接收邮件的最终处理结果。5.根据权利要求4所述的方法,其特征在于,所述根据每一分类模型的分类正确率,确定所述待接收邮件的最终处理结果,包括...

【专利技术属性】
技术研发人员:魏从猛李渊苑赵一帆杨超邵玉倩
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1