【技术实现步骤摘要】
本专利技术属于人工智能,尤其涉及一种基于大语言模型的钓鱼邮件检测方法。
技术介绍
1、钓鱼邮件攻击一般是指攻击者伪装成银行等权威部门的技术管理员,或者是收件人信任的朋友、家人等,通过发送电子邮件的方式诱导用户点击钓鱼链接或者下载附件,进而窃取用户的敏感信息或者在设备上植入恶意程序。近年来,随着互联网技术的快速发展,钓鱼邮件的数量也在日益增长。2022年apwg的第三季度报告显示,观察到的网络钓鱼攻击数量超过120万次,针对商业电子邮件攻击的数量增加了59%。coremail发布的2023上半年研究报告显示,全国企业邮箱用户共收到1.4亿封钓鱼邮件,同比2022上半年增长40.89%。因此,对于个人和企业来说,如何防范钓鱼邮件攻击是网络安全的重要组成部分。
2、随着生成式大语言模型在各种任务上展现的优异性能,人们也开始探索大语言模型在各个领域中的应用,但也带来了一系列安全风险,例如生成有害内容、数据泄露等。最近,在暗网上出现的基于大语言模型的网络犯罪工具wormgpt,对生成结果没有采取限制和安全过滤,专门用于恶意攻击活动。攻
...【技术保护点】
1.一种基于大语言模型的钓鱼邮件检测方法,其特征在于,包括以下步骤:
2.如权利要求1所述的一种基于大语言模型的钓鱼邮件检测方法,其特征在于,所述提示模板具体为:
3.如权利要求1所述的一种基于大语言模型的钓鱼邮件检测方法,其特征在于,将待测邮件进行预处理,使得待测邮件的长度控制在设定范围内具体为:
4.如权利要求1所述的一种基于大语言模型的钓鱼邮件检测方法,其特征在于,采用LoRA微调技术调整开源大语言模型Llama2、BaiChuan2、ChatGLM2的网络参数,以此提升开源大语言模型对钓鱼邮件的检测效果,调整方法为:
...【技术特征摘要】
1.一种基于大语言模型的钓鱼邮件检测方法,其特征在于,包括以下步骤:
2.如权利要求1所述的一种基于大语言模型的钓鱼邮件检测方法,其特征在于,所述提示模板具体为:
3.如权利要求1所述的一种基于大语言模型的钓鱼邮件检测方法,其特征在于,将待测邮件进行预处理,使得待测邮件的长度控制在设定范围内具体为:
4.如权利要求1所述的一种基于大语言模型的钓鱼邮件检测方法,其特征在于,采用lora微调技术调整开源大语言模型llama2、baichuan2、chatglm2的网络参数,以此提升开源大语言模型对钓鱼邮件的检测效果,调整方法为:
5.如权利要求1~4任一权利要求所述的一种基于大语言模型的钓鱼邮件检测方法,其特征在于,采用准确率、精确度、召回率、f1分数、误报率、漏报率作为评估大语言模型检测钓鱼邮件性能的指标,其中,在所述指标的评估下,gpt-4检测钓鱼邮件的性能最优。
6.如权利要求1~4任一权利要求所述的一种基于大语言模型的钓鱼邮件检测方法,其特征在于,所述待测邮件为带有邮件头的邮件或者不带有邮件头的邮件,采用准确率、精确度、召回率、f1分数、误...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。