邮件分类方法、装置、计算机设备以及存储介质制造方法及图纸

技术编号:40276565 阅读:27 留言:0更新日期:2024-02-02 23:03
本申请涉及一种邮件分类方法、装置、计算机设备以及存储介质。所述方法包括:对样本邮件进行特征提取,确定所述样本邮件的样本特征信息;所述样本特征信息包括所述样本邮件的发件地址、收件地址、邮件标识、邮件主题和邮件正文;通过样本邮件的邮件正文和语言表征模型,确定所述样本邮件的样本语义特征;根据所述样本特征信息、所述样本语义特征和所述样本邮件的样本属性对监督学习集成模型进行训练,确定邮件分类模型;通过所述语言表征模型确定待分类邮件的目标语义特征,并通过所述邮件分类模型,根据所述目标语义特征和待分类邮件的目标特征信息确定所述待分类邮件的目标类别。上述方法能够提高对待检测邮件的分类精确度。

【技术实现步骤摘要】

本申请涉及传动齿轮,特别是涉及一种邮件分类方法、装置、计算机设备以及存储介质


技术介绍

1、钓鱼邮件是指利用伪装的电邮,欺骗收件人将账号和口令等信息回复给指定的接收者,或引导收件人连接到特制的网页,以盗取收件人的个人信息,是一种常见的网络欺诈手段。因此,对钓鱼邮件进行识别分类,可以有效保障收件人的个人和财产安全。钓鱼邮件具有多样性和隐蔽性的特点,且钓鱼邮件的数量十分庞大,因此对钓鱼邮件的识别面临着诸多挑战。

2、针对目前钓鱼邮件泛滥的问题,传统的钓鱼邮件检测方案主要依靠模式匹配的方式对待识别邮件进行识别,以确定待识别邮件是否为钓鱼邮件,如对发件人的发件地址、待识别邮件的邮件主题、邮件内容和邮件附件进行模式匹配,以确定待识别邮件是否为钓鱼邮件,对待检测邮件的识别准确度较低,往往无法应对新型的钓鱼邮件攻击。因此,如何准确的判断待检测邮件是否为钓鱼邮件,提高待检测邮件的分类精确度,保障收件人的财产安全,是需要解决的问题。


技术实现思路

1、基于此,有必要针对上述技术问题,提供一种能够提高对待检测邮件的本文档来自技高网...

【技术保护点】

1.一种邮件分类方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,通过样本邮件的邮件正文和语言表征模型,确定所述样本邮件的样本语义特征,包括:

3.根据权利要求2所述的方法,其特征在于,通过所述语言表征模型,根据样本邮件的邮件正文,确定所述样本邮件的样本语义特征,包括:

4.根据权利要求2所述的方法,其特征在于,通过自然语言处理模型对样本邮件的邮件正文进行分词处理,确定样本分词,包括:

5.根据权利要求1所述的方法,其特征在于,根据所述样本特征信息、所述样本语义特征和所述样本邮件的样本属性对监督学习集成模型进行训练,确定邮...

【技术特征摘要】

1.一种邮件分类方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,通过样本邮件的邮件正文和语言表征模型,确定所述样本邮件的样本语义特征,包括:

3.根据权利要求2所述的方法,其特征在于,通过所述语言表征模型,根据样本邮件的邮件正文,确定所述样本邮件的样本语义特征,包括:

4.根据权利要求2所述的方法,其特征在于,通过自然语言处理模型对样本邮件的邮件正文进行分词处理,确定样本分词,包括:

5.根据权利要求1所述的方法,其特征在于,根据所述样本特征信息、所述样本语义特征和所述样本邮件的样本属性对监督学习集成模型进行训练,确定邮件分类模型,包括:

6.根据权利要求5所述的方法,其特征在于,通过所述样本文本特征、所...

【专利技术属性】
技术研发人员:周楠李凯
申请(专利权)人:杭州安恒信息技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1