一种异常邮件检测方法、装置、电子设备及存储介质制造方法及图纸

技术编号:30642883 阅读:24 留言:0更新日期:2021-11-04 00:43
本发明专利技术实施例适用于计算机技术领域,提供了一种异常邮件检测方法、装置、电子设备及存储介质,其中,异常邮件检测方法包括:获取至少两封电子邮件中的每封电子邮件的至少两个第一数据;第一数据表征对应的电子邮件的邮件信息;基于获取到的第一数据构建关于至少两封电子邮件的知识图谱;知识图谱表征至少两封电子邮件之间的关联关系;识别知识图谱的至少两个子图中的异常子图;基于识别出的异常子图确定至少两封电子邮件中的异常邮件。至少两封电子邮件中的异常邮件。至少两封电子邮件中的异常邮件。

【技术实现步骤摘要】
一种异常邮件检测方法、装置、电子设备及存储介质


[0001]本专利技术涉及计算机
,尤其涉及一种异常邮件检测方法、装置、电子设备及存储介质。

技术介绍

[0002]钓鱼邮件是异常邮件的一种,钓鱼邮件指利用伪装的电子邮件,诱导收件人将账号、口令等信息回复给指定的接收者,从而造成收件人的财产损失。相关技术基于规则、机器学习和深度学习等方法检测钓鱼邮件,相关技术在检测钓鱼邮件时,很多钓鱼邮件都会漏检,钓鱼邮件检测准确率不高。

技术实现思路

[0003]为了解决上述问题,本专利技术实施例提供了一种异常邮件检测方法、装置、电子设备及存储介质,以至少解决相关技术异常邮件检测准确率不高的问题。
[0004]本专利技术的技术方案是这样实现的:
[0005]第一方面,本专利技术实施例提供了一种异常邮件检测方法,该方法包括:
[0006]获取至少两封电子邮件中的每封电子邮件的至少两个第一数据;所述第一数据表征对应的电子邮件的邮件信息;
[0007]基于获取到的第一数据构建关于所述至少两封电子邮件的知识图谱;所述知识图谱表征所述至少两封电子邮件之间的关联关系;
[0008]识别所述知识图谱的至少两个子图中的异常子图;
[0009]基于识别出的异常子图确定所述至少两封电子邮件中的异常邮件。
[0010]上述方案中,所述识别所述知识图谱的至少两个子图中的异常子图,包括:
[0011]基于所述至少两个子图中每个子图的特征参数确定对应的子图的向量;
[0012]将所述向量输入设定的分类模型,得到所述设定的分类模型输出的预测值;所述设定的分类模型用于基于对应的超球面输出所述预测值;所述预测值表征所述向量对应的子图是否为异常子图。
[0013]上述方案中,其特征在于,所述设定的分类模型确定所述向量是否在所述超球面内,
[0014]在所述向量在所述超球面内的情况下,所述设定的分类模型输出第一预测值;所述第一预测值表征所述向量对应的子图为正常子图;
[0015]在所述向量不在所述超球面内的情况下,所述设定的分类模型输出第二预测值;所述第二预测值表征所述向量对应的子图为异常子图。
[0016]上述方案中,所述基于识别出的异常子图确定所述至少两封电子邮件中的异常邮件,包括:
[0017]将所述异常子图对应的所有电子邮件确定为异常邮件。
[0018]上述方案中,所述识别所述知识图谱的至少两个子图中的异常子图,包括:
[0019]确定所述知识图谱的至少两个子图中每个子图的第一节点的数量;所述第一节点表征电子邮件的发件人身份字段;
[0020]在所述第一节点的数量大于1的情况下,识别对应的子图为异常子图。
[0021]上述方案中,所述基于识别出的异常子图确定所述至少两封电子邮件中的异常邮件,包括:
[0022]在识别出的异常子图的所有第二节点中确定出第三节点;所述第二节点表征电子邮件的ID;所述第三节点表征相连的第一节点未在设定白名单中的第二节点;
[0023]将确定出的第三节点对应的电子邮件确定为异常邮件。
[0024]上述方案中,所述识别所述知识图谱的至少两个子图中的异常子图,包括:
[0025]在所述知识图谱中与第四节点相连的第二节点的数量大于1的情况下,确定与所述第二节点相连的第五节点的数量是否大于1;所述第二节点表征电子邮件的ID;所述第四节点表征电子邮件的URL中的一级域名;所述第五节点表征电子邮件的源IP地址或电子邮件的发件人地址中的一级域名;
[0026]在所述第五节点的数量大于1的情况下,识别对应的子图为异常子图。
[0027]上述方案中,所述基于所述异常子图确定所述至少两封电子邮件中的异常邮件,包括:
[0028]将所述异常子图中与所述第四节点相连的第二节点对应的电子邮件确定为异常邮件。
[0029]上述方案中,所述基于获取到的第一数据构建关于所述至少两封电子邮件的知识图谱时,所述方法包括:
[0030]基于所述至少两封电子邮件中的每封电子邮件的至少两个第一数据生成所述知识图谱的节点;其中,相同的第一数据在所述知识图谱中对应同一节点;
[0031]将属于同一封电子邮件的第一数据对应的节点相连,以构成所述知识图谱。
[0032]上述方案中,所述至少两个第一数据至少包括以下任意两项:
[0033]电子邮件的发件人地址中的一级域名;
[0034]电子邮件的标识ID;
[0035]电子邮件的源网际互连协议IP地址;
[0036]电子邮件的统一资源定位系统URL中的一级域名;
[0037]电子邮件的发件人身份字段。
[0038]第二方面,本专利技术实施例提供了一种异常邮件检测装置,该装置包括:
[0039]获取模块,用于获取至少两封电子邮件中的每封电子邮件的至少两个第一数据;所述第一数据表征对应的电子邮件的邮件信息;
[0040]构建模块,用于基于获取到的第一数据构建关于所述至少两封电子邮件的知识图谱;所述知识图谱表征所述至少两封电子邮件之间的关联关系;
[0041]识别模块,用于识别所述知识图谱的至少两个子图中的异常子图;
[0042]确定模块,用于基于识别出的异常子图确定所述至少两封电子邮件中的异常邮件。
[0043]第三方面,本专利技术实施例提供了一种电子设备,包括处理器和存储器,所述处理器和存储器相互连接,其中,所述存储器用于存储计算机程序,所述计算机程序包括程序指
令,所述处理器被配置用于调用所述程序指令,执行本专利技术实施例第一方面提供的异常邮件检测方法的步骤。
[0044]第四方面,本专利技术实施例提供了一种计算机可读存储介质,包括:所述计算机可读存储介质存储有计算机程序。所述计算机程序被处理器执行时实现如本专利技术实施例第一方面提供的异常邮件检测方法的步骤。
[0045]本专利技术实施例通过获取至少两封电子邮件中的每封电子邮件的至少两个第一数据,第一数据表征对应的电子邮件的邮件信息。基于获取到的第一数据构建关于至少两封电子邮件的知识图谱,知识图谱表征至少两封电子邮件之间的关联关系,识别知识图谱的至少两个子图中的异常子图,基于识别出的异常子图确定至少两封电子邮件中的异常邮件。本专利技术实施例通过构建电子邮件的知识图谱,知识图谱能够体现电子邮件之间的关联关系,通过知识图谱中的异常子图确定电子邮件中的异常邮件,可以提高异常邮件检测的准确率。
附图说明
[0046]图1是本专利技术实施例提供的一种异常邮件检测方法的实现流程示意图;
[0047]图2是本专利技术实施例提供的一种知识图谱的示意图;
[0048]图3是本专利技术实施例提供的另一种异常邮件检测方法的实现流程示意图;
[0049]图4是本专利技术实施例提供的一种知识图谱的示意图;
[0050]图5是本专利技术实施例提供的一种知识图谱中的子图的示意图;
[0051]图6是本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种异常邮件检测方法,其特征在于,所述方法包括:获取至少两封电子邮件中的每封电子邮件的至少两个第一数据;所述第一数据表征对应的电子邮件的邮件信息;基于获取到的第一数据构建关于所述至少两封电子邮件的知识图谱;所述知识图谱表征所述至少两封电子邮件之间的关联关系;识别所述知识图谱的至少两个子图中的异常子图;基于识别出的异常子图确定所述至少两封电子邮件中的异常邮件。2.根据权利要求1所述的方法,其特征在于,所述识别所述知识图谱的至少两个子图中的异常子图,包括:基于所述至少两个子图中每个子图的特征参数确定对应的子图的向量;将所述向量输入设定的分类模型,得到所述设定的分类模型输出的预测值;所述设定的分类模型用于基于对应的超球面输出所述预测值;所述预测值表征所述向量对应的子图是否为异常子图。3.根据权利要求2所述的方法,其特征在于,所述设定的分类模型确定所述向量是否在所述超球面内,在所述向量在所述超球面内的情况下,所述设定的分类模型输出第一预测值;所述第一预测值表征所述向量对应的子图为正常子图;在所述向量不在所述超球面内的情况下,所述设定的分类模型输出第二预测值;所述第二预测值表征所述向量对应的子图为异常子图。4.根据权利要求2所述的方法,其特征在于,所述基于识别出的异常子图确定所述至少两封电子邮件中的异常邮件,包括:将所述异常子图对应的所有电子邮件确定为异常邮件。5.根据权利要求1所述的方法,其特征在于,所述识别所述知识图谱的至少两个子图中的异常子图,包括:确定所述知识图谱的至少两个子图中每个子图的第一节点的数量;所述第一节点表征电子邮件的发件人身份字段;在所述第一节点的数量大于1的情况下,识别对应的子图为异常子图。6.根据权利要求5所述的方法,其特征在于,所述基于识别出的异常子图确定所述至少两封电子邮件中的异常邮件,包括:在识别出的异常子图的所有第二节点中确定出第三节点;所述第二节点表征电子邮件的ID;所述第三节点表征相连的第一节点未在设定白名单中的第二节点;将确定出的第三节点对应的电子邮件确定为异常邮件。7.根据权利要求1所述的方法,其特征在于,所述识别所述知识图谱的至少两个子图中的异常子图,包括:在所述知识图谱中与第四节点相连的第二节...

【专利技术属性】
技术研发人员:宁阳闫凡郜振锋郑景中王雄许云中
申请(专利权)人:深信服科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1