一种邮件危险识别和分类方法、装置、电子设备及介质制造方法及图纸

技术编号：39324643 阅读：33 留言：0更新日期：2023-11-12 16:03

本发明专利技术涉及一种邮件危险识别和分类方法、装置、电子设备及介质，属于邮箱安全技术领域，包括：S1，获取已标记分类的危险邮件，并对已标记分类的危险邮件进行解析处理，得到分类好的文本数据；S2，构建初始模型，将分类好的每一类文本数据分别输入所述初始模型，进行模型训练，得到训练好的行为检测模型，并将告警数据存储至危险邮箱分类对应的分类数据库中；S3，将行为检测模型持续对未知历史邮件进行数据检索，判断未知历史邮件是否含为危险邮件，并通过行为检测模型获取未知历史邮件的告警数据以及危险邮箱分类，并将告警数据存储至对应的分类数据库中。本发明专利技术用于分析邮件是否为危险邮件并对其危险类别进行判别。险邮件并对其危险类别进行判别。险邮件并对其危险类别进行判别。

全部详细技术资料下载

【技术实现步骤摘要】
一种邮件危险识别和分类方法、装置、电子设备及介质

[0001]本专利技术属于邮箱安全
，特别涉及一种邮件危险识别和分类方法、装置、电子设备及介质。

技术介绍

[0002]电子邮件是一种用电子手段提供信息交换的通信方式，是互联网应用最广的服务。通过网络的电子邮件系统，用户可以以非常低廉的价格、非常快速的方式，与世界上任何一个角落的网络用户联系。因此电子邮件已经成为人们日常工作交流的重要工具，然而通过危险邮件对目标用户进行攻击的情况也层出不穷。
[0003]现有技术中，公开了一种基于钓鱼邮件溯源APT攻击事件的方法及系统(公开号：CN105072137A)，包括：解析已知钓鱼邮件，获取邮件元数据、正文信息和附件信息；分析邮件元数据、正文信息和附件信息，并生成攻击溯源库；将未知邮件与所述攻击溯源库进行关联分析，若满足预设条件则进行深度检测；其中，所述邮件元数据包括：发件服务器IP、发件时间、发件人、收件人、主题；所述正文信息包括正文内容和正文内容中的URL；所述附件信息包括附件文件及附件文件中的URL。
[0...

【技术保护点】

【技术特征摘要】
1.一种邮件危险识别和分类方法,其特征在于，包括以下步骤：S1，获取已标记分类的危险邮件，并对已标记分类的危险邮件进行解析处理，得到分类好的文本数据；其中，所述危险邮件是邮件内容中含有危险信息的邮件；S2，构建初始模型，将分类好的每一类文本数据分别输入所述初始模型，进行含有危险信息的告警数据提取以及危险邮件分类的模型训练，得到训练好的行为检测模型，并将告警数据存储至危险邮箱分类对应的分类数据库中；S3，将所述训练好的行为检测模型持续对未知历史邮件进行数据检索，判断未知历史邮件是否含有危险信息，若含有危险信息则将未知历史邮件判定为危险邮件，并通过行为检测模型获取判定为危险邮件的未知历史邮件的告警数据以及危险邮箱分类，并将判定为危险邮件的未知历史邮件的告警数据根据危险邮箱分类存储至对应的分类数据库中。2.根据权利要求1所述的一种邮件危险识别和分类方法，其特征在于，S2中，训练好的行为检测模型包含依次层叠的关键词特征提取层、增强特征层、全局特征提取层、检索层和分类层，模型训练的具体过程为：分别将分类好的每一类文本数据输入关键词特征提取层进行关键词特征提取，得到多个关键词特征；将多个关键词特征输入增强特征层进行特征增强处理，对应得到多个增强关键词特征；将多个增强关键词特征输入至全局特征提取层进行特征聚合处理，得到多个全局特征；将多个全局特征输入检索层，对多个全局特征进行组合形成多条件的检索模式，所述多条件的检索模式用于对未知历史邮件进行数据检索；将全局特征输入至分类层进行分类处理，得到对应文本数据的预测分类。3.根据权利要求2所述的一种邮件危险识别和分类方法，其特征在于，所述关键词特征提取层通过自然语言处理方法提取邮箱中具有危险信息的关键词，得到多个关键词特征。4.根据权利要求3所述的一种邮件危险识别和分类方法，其特征在于，通过对关键词特征中的关键词进行近义词获取，来实现增强特征层进行特征增强处理。5.根据权利要求2所述的一种邮件危险识别和分类方法，其特征在于，将多个增强关键词特征输...

【专利技术属性】
技术研发人员：蔡晶晶，陈俊，洪荣灿，骆国华，施艳萍，张剑奇，李宇涵，郑祖荣，陈鸿，危文涛，
申请(专利权)人：北京永信至诚科技股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人