一种基于大语言模型的钓鱼邮件检测方法技术

技术编号:40533727 阅读:24 留言:0更新日期:2024-03-01 13:55
本发明专利技术提供一种基于大语言模型的钓鱼邮件检测方法,属于人工智能技术领域,大语言模型不需要进行复杂的特征工程,将写有待测邮件的提示模板输入大语言模型,大语言模型就可以直接处理邮件内容,最后由大语言模型判断待测邮件是否为钓鱼邮件;而且,大语言模型具有出色的语义理解能力,可以深入识别和理解邮件的上下文内容,从而更准确地识别钓鱼邮件中应用的社会工程学技术和心理操纵技巧;此外,大语言模型具有强大的多语言处理能力,可以解决语言障碍问题,为其他语言的钓鱼邮件检测提供新的研究思路;最后,本发明专利技术同时使用没有开源的和开源的大语言模型进行钓鱼邮件检测,能够更好地研究开源大语言模型检测钓鱼邮件的性能和探索社会工程学领域的垂直大模型构建。

【技术实现步骤摘要】

本专利技术属于人工智能,尤其涉及一种基于大语言模型的钓鱼邮件检测方法


技术介绍

1、钓鱼邮件攻击一般是指攻击者伪装成银行等权威部门的技术管理员,或者是收件人信任的朋友、家人等,通过发送电子邮件的方式诱导用户点击钓鱼链接或者下载附件,进而窃取用户的敏感信息或者在设备上植入恶意程序。近年来,随着互联网技术的快速发展,钓鱼邮件的数量也在日益增长。2022年apwg的第三季度报告显示,观察到的网络钓鱼攻击数量超过120万次,针对商业电子邮件攻击的数量增加了59%。coremail发布的2023上半年研究报告显示,全国企业邮箱用户共收到1.4亿封钓鱼邮件,同比2022上半年增长40.89%。因此,对于个人和企业来说,如何防范钓鱼邮件攻击是网络安全的重要组成部分。

2、随着生成式大语言模型在各种任务上展现的优异性能,人们也开始探索大语言模型在各个领域中的应用,但也带来了一系列安全风险,例如生成有害内容、数据泄露等。最近,在暗网上出现的基于大语言模型的网络犯罪工具wormgpt,对生成结果没有采取限制和安全过滤,专门用于恶意攻击活动。攻击者不需要掌握特定技本文档来自技高网...

【技术保护点】

1.一种基于大语言模型的钓鱼邮件检测方法,其特征在于,包括以下步骤:

2.如权利要求1所述的一种基于大语言模型的钓鱼邮件检测方法,其特征在于,所述提示模板具体为:

3.如权利要求1所述的一种基于大语言模型的钓鱼邮件检测方法,其特征在于,将待测邮件进行预处理,使得待测邮件的长度控制在设定范围内具体为:

4.如权利要求1所述的一种基于大语言模型的钓鱼邮件检测方法,其特征在于,采用LoRA微调技术调整开源大语言模型Llama2、BaiChuan2、ChatGLM2的网络参数,以此提升开源大语言模型对钓鱼邮件的检测效果,调整方法为:

5.如权利要求...

【技术特征摘要】

1.一种基于大语言模型的钓鱼邮件检测方法,其特征在于,包括以下步骤:

2.如权利要求1所述的一种基于大语言模型的钓鱼邮件检测方法,其特征在于,所述提示模板具体为:

3.如权利要求1所述的一种基于大语言模型的钓鱼邮件检测方法,其特征在于,将待测邮件进行预处理,使得待测邮件的长度控制在设定范围内具体为:

4.如权利要求1所述的一种基于大语言模型的钓鱼邮件检测方法,其特征在于,采用lora微调技术调整开源大语言模型llama2、baichuan2、chatglm2的网络参数,以此提升开源大语言模型对钓鱼邮件的检测效果,调整方法为:

5.如权利要求1~4任一权利要求所述的一种基于大语言模型的钓鱼邮件检测方法,其特征在于,采用准确率、精确度、召回率、f1分数、误报率、漏报率作为评估大语言模型检测钓鱼邮件性能的指标,其中,在所述指标的评估下,gpt-4检测钓鱼邮件的性能最优。

6.如权利要求1~4任一权利要求所述的一种基于大语言模型的钓鱼邮件检测方法,其特征在于,所述待测邮件为带有邮件头的邮件或者不带有邮件头的邮件,采用准确率、精确度、召回率、f1分数、误...

【专利技术属性】
技术研发人员:伍淳华郑康锋张尚武斌
申请(专利权)人:北京邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1