邮件分类方法、装置及电子设备制造方法及图纸

技术编号:34138913 阅读:27 留言:0更新日期:2022-07-14 17:19
本申请提供一种邮件分类、装置及电子设备,涉及风险识别领域。该邮件分类方法可以基于机器学习模型对网址中的各个第一字符进行转换,得到第一数组;对第一数组进行分组得到N个第二数组,并记录N个第二数组之间的位置顺序,N为大于或等于2的整数;并行地对N个第二数组进行归一化处理,得到归一化后的N个第二数组,由于是并行地对N个第二数组进行归一化处理,效率高。进而,根据记录的N个第二数组之间的位置顺序,将归一化后的N个第二数组合成为归一化后的第一数组。这样一来,可以对归一化后的第一数组进行分类,输出携带网址的邮件的分类结果。如此,得到分类结果的效率也高。得到分类结果的效率也高。得到分类结果的效率也高。

【技术实现步骤摘要】
邮件分类方法、装置及电子设备


[0001]本申请涉及风险识别领域,尤其涉及一种邮件分类方法、装置及电子设备。

技术介绍

[0002]钓鱼邮件通常是包含引诱用户回复个人私密信息(如身份证号,银行卡密码)的邮件,或者,包括存在泄露个人私密信息的网址链接的邮件。如此,为了避免用户在钓鱼邮件回复个人私密信息,或者点击钓鱼邮件中的网址链接。在接收到邮件时,需要对邮件的内容进行分析,以便对接收到的邮件进行分类。如此,当邮件被分类为钓鱼邮件时,可以对钓鱼邮件进行标记以提示用户。
[0003]目前,对接收到的邮件进行分类的速度慢,效率低。

技术实现思路

[0004]本申请提供一种邮件分类、装置及电子设备,用以解决对接收到的邮件进行分类的速度慢、效率低的问题。
[0005]第一方面,本申请提供了一种邮件分类方法,应用于服务器。本申请提供的方法包括:
[0006]获取待识别的邮件中包含的网址;
[0007]基于预训练的机器学习模型对网址进行分词处理,得到网址中的各个第一字符,其中,机器学习模型是将多个标记有第一标识的网址和多个携带第二标识的网址构成的训练样本集输入到待训练网络中训练得到的,其中,第一标识用于指示存在风险,第二标识用于指示不存在风险;
[0008]基于机器学习模型对网址中的各个第一字符进行转换,得到第一数组;
[0009]基于机器学习模型对第一数组进行分组得到N个第二数组,并记录N个第二数组之间的位置顺序,其中,N为大于或等于2的整数;
[0010]基于机器学习模型并行地对N个第二数组进行归一化处理,得到归一化后的N个第二数组;
[0011]基于机器学习模型根据记录的N个第二数组之间的位置顺序,将归一化后的N个第二数组合成为归一化后的第一数组;
[0012]基于机器学习模型对归一化后的第一数组进行分类,输出携带网址的邮件的分类结果。
[0013]本申请提供的邮件分类方法,可以基于机器学习模型对网址中的各个第一字符进行转换,得到第一数组;基于机器学习模型对第一数组进行分组得到N个第二数组,并记录N个第二数组之间的位置顺序,其中,N为大于或等于2的整数;基于机器学习模型并行地对N个第二数组进行归一化处理,得到归一化后的N个第二数组,由于是并行地对N个第二数组进行归一化处理,效率高。进而,基于机器学习模型根据记录的N个第二数组之间的位置顺序,将归一化后的N个第二数组合成为归一化后的第一数组。这样一来,可以基于机器学习
模型对归一化后的第一数组进行分类,输出携带网址的邮件的分类结果。如此,得到分类结果的效率也高。
[0014]第二方面,本申请提供了一种邮件分类装置,应用于服务器。本申请提供的装置包括:
[0015]信息获取单元,用于获取待识别的邮件中包含的网址;
[0016]分词处理单元,用于基于预训练的机器学习模型对网址进行分词处理,得到网址中的各个第一字符,其中,机器学习模型是将多个标记有第一标识的网址和多个携带第二标识的网址构成的训练样本集输入到待训练网络中训练得到的,其中,第一标识用于指示存在风险,第二标识用于指示不存在风险;
[0017]数据转换单元,用于基于机器学习模型对网址中的各个第一字符进行转换,得到第一数组;
[0018]数据分组单元,用于机器学习模型对第一数组进行分组得到N个第二数组,并记录N个第二数组之间的位置顺序,其中,N为大于或等于2的整数;
[0019]归一化单元,用于基于机器学习模型并行地对N个第二数组进行归一化处理,得到归一化后的N个第二数组;
[0020]数据合成单元,用于基于机器学习模型根据记录的N个第二数组之间的位置顺序,将归一化后的N个第二数组合成为归一化后的第一数组;
[0021]数据分类单元,用于基于机器学习模型对归一化后的第一数组进行分类,输出携带网址的邮件的分类结果。
[0022]第三方面,本申请还提供了一种电子设备,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时,使得电子设备执行如本申请第一方面提供的方法。
[0023]第四方面,本申请还提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时,使得计算机执行如本申请第一方面提供的方法。
[0024]第五方面,本申请还提供了一种计算机程序产品,包括计算机程序,当计算机程序被运行时,使得计算机如本申请第一方面提供的方法。
[0025]此外,本申请第二方面、第三方面、第四方面、第五方面提供的方案的技术效果可以参考第一方面提供的邮件分类方法的技术效果,此处不再赘述。
附图说明
[0026]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本申请的实施例,并与说明书一起用于解释本申请的原理。
[0027]图1为本申请实施例提供的邮件分类方法的流程图;
[0028]图2为本申请实施例提供的服务器与终端设备的交互示意图;
[0029]图3为本申请实施例提供的机器学习模型的架构示意图;
[0030]图4为图1中的S104的具体流程图;
[0031]图5本申请实施例提供的邮件分类装置的功能模块结构示意图;
[0032]图6为图5中的数据管理模块的子单元的结构示意图;
[0033]图7为图5中的邮件识别模块的子单元的结构示意图;
[0034]图8为本申请实施例提供的一种电子设备的电路连接框图。
[0035]通过上述附图,已示出本申请明确的实施例,后文中将有更详细的描述。这些附图和文字描述并不是为了通过任何方式限制本申请构思的范围,而是通过参考特定实施例为本领域技术人员说明本申请的概念。
具体实施方式
[0036]这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
[0037]下面以具体地实施例对本申请的技术方案以及本申请的技术方案如何解决上述技术问题进行详细说明。下面这几个具体的实施例可以相互结合,对于相同或相似的概念或过程可能在某些实施例中不再赘述。下面将结合附图,对本申请的实施例进行描述。
[0038]本领域技术人员在考虑说明书及实践这里公开的专利技术后,将容易想到本申请的其它实施方案。本申请旨在涵盖本申请的任何变型、用途或者适应性变化,这些变型、用途或者适应性变化遵循本申请的一般性原理并包括本申请未公开的本
中的公知常识或惯用技术手段。说明书和实施例仅被视为示例性的,本申请的真正范围和精神由下面的权利要求书指出。
[0039]应当理解的是,本申请并不局限于上面已经描述并在附图中示出的精确结构,并且可以在不脱离其范围进行各种修改和改本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种邮件分类方法,其特征在于,应用于服务器,所述方法包括:获取待识别的邮件中包含的网址;基于预训练的机器学习模型对所述网址进行分词处理,得到所述网址中的各个第一字符,其中,所述机器学习模型是将多个标记有第一标识的网址和多个携带第二标识的网址构成的训练样本集输入到待训练网络中训练得到的,其中,所述第一标识用于指示存在风险,所述第二标识用于指示不存在风险;基于所述机器学习模型对所述网址中的各个第一字符进行转换,得到第一数组;基于所述机器学习模型对所述第一数组进行分组得到N个第二数组,并记录所述N个第二数组之间的位置顺序,其中,所述N为大于或等于2的整数;基于所述机器学习模型并行地对所述N个第二数组进行归一化处理,得到归一化后的N个第二数组;基于所述机器学习模型根据记录的所述N个第二数组之间的位置顺序,将归一化后的N个第二数组合成为归一化后的第一数组;基于所述机器学习模型对所述归一化后的第一数组进行分类,输出携带所述网址的邮件的分类结果。2.根据权利要求1所述的方法,其特征在于,所述机器学习模型包括N个多头注意层,所述基于所述机器学习模型并行地对所述N个第二数组进行归一化处理,得到归一化后的N个第二数组,包括:所述N个多头注意层并行地对所述N个第二数组进行归一化处理,得到归一化后的N个第二数组,其中,任一所述多头注意层对一个所述第二数组进行归一化处理。3.根据权利要求1所述的方法,其特征在于,所述基于所述机器学习模型对所述网址中的各个第一字符进行转换,得到第一数组,包括:基于所述机器学习模型确定所述网址的长度;根据所述网址的长度,对所述网址进行处理以使所述网址的长度等于预设长度;当处理后的所述网址的第一字符在预设词表中时,将所述第一字符转换为所述第一字符在所述预设词表中对应的整型常量;当处理后的所述网址的第一字符不在预设词表中时,将所述第一字符转换为目标字符。4.根据权利要求1所述的方法,其特征在于,在所述基于所述机器学习模型对所述归一化后的第一数组进行分类,输出携带所述网址的邮件的分类结果之后,所述方法还包括:在所述分类结果指示所述邮件是钓鱼邮件时,所述服务器发送提示信息到终端设备显示,其中,所述提示信息用于指示邮件是钓鱼邮件;响应于来自所述终端设备的用户对携带所述网址的邮件标记所述第一标识或所述第二标识;将标记有所述第一标识或所述第二标识邮件,添加到所述训练样本集中。5.根据权利要求4所述的方法,其特征在于,在所...

【专利技术属性】
技术研发人员:谢伟刘慕雨潘玲王豪赞
申请(专利权)人:中国工商银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1