邮件分类方法、装置及电子设备制造方法及图纸

技术编号：34138913 阅读：27 留言：0更新日期：2022-07-14 17:19

本申请提供一种邮件分类、装置及电子设备，涉及风险识别领域。该邮件分类方法可以基于机器学习模型对网址中的各个第一字符进行转换，得到第一数组；对第一数组进行分组得到N个第二数组，并记录N个第二数组之间的位置顺序，N为大于或等于2的整数；并行地对N个第二数组进行归一化处理，得到归一化后的N个第二数组，由于是并行地对N个第二数组进行归一化处理，效率高。进而，根据记录的N个第二数组之间的位置顺序，将归一化后的N个第二数组合成为归一化后的第一数组。这样一来，可以对归一化后的第一数组进行分类，输出携带网址的邮件的分类结果。如此，得到分类结果的效率也高。得到分类结果的效率也高。得到分类结果的效率也高。

全部详细技术资料下载

【技术实现步骤摘要】
邮件分类方法、装置及电子设备

[0001]本申请涉及风险识别领域，尤其涉及一种邮件分类方法、装置及电子设备。

技术介绍

[0002]钓鱼邮件通常是包含引诱用户回复个人私密信息(如身份证号，银行卡密码)的邮件，或者，包括存在泄露个人私密信息的网址链接的邮件。如此，为了避免用户在钓鱼邮件回复个人私密信息，或者点击钓鱼邮件中的网址链接。在接收到邮件时，需要对邮件的内容进行分析，以便对接收到的邮件进行分类。如此，当邮件被分类为钓鱼邮件时，可以对钓鱼邮件进行标记以提示用户。
[0003]目前，对接收到的邮件进行分类的速度慢，效率低。

技术实现思路

[0004]本申请提供一种邮件分类、装置及电子设备，用以解决对接收到的邮件进行分类的速度慢、效率低的问题。
[0005]第一方面，本申请提供了一种邮件分类方法，应用于服务器。本申请提供的方法包括：
[0006]获取待识别的邮件中包含的网址；
[0007]基于预训练的机器学习模型对网址进行分词处理，得到网址中的各个第一字符，其中，机器学习模型是将多个标记有第一标识的网址和多个携带第二标识的网址构成的训练样本集输入到待训练网络中训练得到的，其中，第一标识用于指示存在风险，第二标识用于指示不存在风险；
[0008]基于机器学习模型对网址中的各个第一字符进行转换，得到第一数组；
[0009]基于机器学习模型对第一数组进行分组得到N个第二数组，并记录N个第二数组之间的位置顺序，其中，N为大于或等于2的整数；
[0010]基...

【技术保护点】

【技术特征摘要】
1.一种邮件分类方法，其特征在于，应用于服务器，所述方法包括：获取待识别的邮件中包含的网址；基于预训练的机器学习模型对所述网址进行分词处理，得到所述网址中的各个第一字符，其中，所述机器学习模型是将多个标记有第一标识的网址和多个携带第二标识的网址构成的训练样本集输入到待训练网络中训练得到的，其中，所述第一标识用于指示存在风险，所述第二标识用于指示不存在风险；基于所述机器学习模型对所述网址中的各个第一字符进行转换，得到第一数组；基于所述机器学习模型对所述第一数组进行分组得到N个第二数组，并记录所述N个第二数组之间的位置顺序，其中，所述N为大于或等于2的整数；基于所述机器学习模型并行地对所述N个第二数组进行归一化处理，得到归一化后的N个第二数组；基于所述机器学习模型根据记录的所述N个第二数组之间的位置顺序，将归一化后的N个第二数组合成为归一化后的第一数组；基于所述机器学习模型对所述归一化后的第一数组进行分类，输出携带所述网址的邮件的分类结果。2.根据权利要求1所述的方法，其特征在于，所述机器学习模型包括N个多头注意层，所述基于所述机器学习模型并行地对所述N个第二数组进行归一化处理，得到归一化后的N个第二数组，包括：所述N个多头注意层并行地对所述N个第二数组进行归一化处理，得到归一化后的N个第二数组，其中，任一所述多头注意层对一个所述第二数组进行归一化处理。3.根据权利要求1所述的方法，其特征在于，所述基于所述机器学习模型对所述网址中的各个第一字符进行转换，得到第一数组，包括：基于所述机器学习模型确定所述网址的长度；根据所述网址的长度，对所述网址进行处理以使所述网址的长度等于预设长度；当处理后的所述网址的第一字符在预设词表中时，将所述第一字符转换为所述第一字符在所述预设词表中对应的整型常量；当处理后的所述网址的第一字符不在预设词表中时，将所述第一字符转换为目标字符。4.根据权利要求1所述的方法，其特征在于，在所述基于所述机器学习模型对所述归一化后的第一数组进行分类，输出携带所述网址的邮件的分类结果之后，所述方法还包括：在所述分类结果指示所述邮件是钓鱼邮件时，所述服务器发送提示信息到终端设备显示，其中，所述提示信息用于指示邮件是钓鱼邮件；响应于来自所述终端设备的用户对携带所述网址的邮件标记所述第一标识或所述第二标识；将标记有所述第一标识或所述第二标识邮件，添加到所述训练样本集中。5.根据权利要求4所述的方法，其特征在于，在所...

【专利技术属性】
技术研发人员：谢伟，刘慕雨，潘玲，王豪赞，
申请(专利权)人：中国工商银行股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人