基于大语言模型的漏洞信息识别方法及装置制造方法及图纸

技术编号:44927111 阅读:35 留言:0更新日期:2025-04-08 19:07
本公开属于核电技术领域,具体涉及一种基于大语言模型的漏洞信息识别方法及装置。本公开针对某些CVE的PoC信息进行收集,并对部分数据进行人工标注,以人工标注的方式增强了训练数据的准确可靠性,从而提高后续模型的学习能力。通过利用GPT‑3.5‑turbo模型对CVE和PoC数据进行识别和总结,基于TTP内容形式对每条信息进行描述,将CVE和PoC信息统一为TTP标准格式,剔除了原始信息中的噪音干扰,能够增强大语言模型对关键信息特征的识别和学习能力,并使用指令微调技术提高GPT模型完成任务效果。基于微调完成后的Llama‑2模型,对输入的目标CVE和PoC信息进行识别处理,并基于输出判别CVE和PoC的关联关系。从而解决CVE与PoC关联识别时依赖人工分析的问题。

【技术实现步骤摘要】

本专利技术属于核电,具体涉及一种基于大语言模型的漏洞信息识别方法及装置


技术介绍

1、随着计算机技术和网络技术的飞速发展,网络应用已经深入参与到各行各业之中。互联网技术在助力工业生产的同时,也对网络安全漏洞现象产生了深远影响。网络安全问题纷繁复杂,涉及到的场景也多种多样,这位漏洞的识别提出了挑战,cve(通用漏洞披露,common vulnerabilities and exposures)为每个漏洞提供了唯一的标识符,并为网络安全人员提供了可以统一识别和描述公开披露的网络安全漏洞的方法。同时,为了更全面的了解安全漏洞的成因及其危害流程,安全人员常使用poc(概念验证,proof of concept)对安全漏洞进行验证。cve和poc描述了漏洞生命周期的不同阶段,其从理论和实践上增强了对漏洞的管理、分类效率。因此,如何识别和关联来来源于同一漏洞的cve和poc具有重要意义。基于cve和其对应的poc,企业安全人员可以更高效地识别和处理安全漏洞,从而提高企业的安全防护能力。然而,需要注意的是,尽管cve是一种漏洞统一描述方式,但在实际的安全检测和漏洞识别本文档来自技高网...

【技术保护点】

1.一种基于大语言模型的漏洞信息识别方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,步骤2包括:

3.根据权利要求1所述的方法,其特征在于,步骤3包括:

4.根据权利要求1所述的方法,其特征在于,在步骤4中,将每条CVE和PoC的TTP形式信息输入Llama-2模型,其中,每条CVE和PoC的TTP形式信息包括战术、技术、流程三个方面的内容;将具有对应关系的CVE和PoC对作为正样本对,将没有对应关系的CVE和PoC作为负样本对;Llama-2模型基于正样本和负样本对进行训练和微调,最后输出CVE和PoC是否具有关联对应关系...

【技术特征摘要】

1.一种基于大语言模型的漏洞信息识别方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,步骤2包括:

3.根据权利要求1所述的方法,其特征在于,步骤3包括:

4.根据权利要求1所述的方法,其特征在于,在步骤4中,将每条cve和poc的ttp形式信息输入llama-2模型,其中,每条cve和poc的ttp形式信息包括战术、技术、流程三个方面的内容;将具有对应关系的cve和poc对作为正样本对,将没有对应关系的cve和poc作为负样本对;llama-2模型基于正样本和负样本对进行训练和微调,最后输出cve和poc是否具...

【专利技术属性】
技术研发人员:尹飞马澜左辉高汉军陈府冯蔚杨文俊曹端夏程俍祎
申请(专利权)人:中核武汉核电运行技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1