基于大语言模型的网络安全应急响应知识图谱补全方法技术

技术编号：40577671 阅读：5 留言：0更新日期：2024-03-06 17:19

本发明专利技术公开了一种基于大语言模型的网络安全应急响应知识图谱补全方法，包括步骤：对给定的知识图谱的三元组中的实体和关系进行结构嵌入；将得到的实体和关系嵌入输入文本适应器中，得到相对应的实体和关系的文本提示；根据所给定的知识图谱的三元组，制定其大语言模型的输入任务，得到任务语句；将任务语句和任务语句相对应的文本提示进行拼接后，输入大语言模型中，得到任务语句结果；根据得到的任务语句结果和任务语句真实的结果做损失来训练网络，进行知识图谱的补全；本方案具有精确快速补全网络安全应急响应文本中的实体和实体之间的关系，能够更快速地帮助建立网络安全应急响应知识图谱。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及网络安全领域，特别涉及一种基于大语言模型的网络安全应急响应知识图谱补全方法。

技术介绍

1、网络安全应急响应指的是人们为了应对各种网络上意外事件的发生所做的准备，以及在网络事件发生后所采取的措施。在网络安全等级保护里应急响应是网络安全工作中最不可或缺的环节之一，它可以针对网络安全事件进行应急处理，保证相关业务的连续性、可用性，从而降低攻击所带来的破坏程度。现如今随着计算机技术的不断发展，网络上的网络安全威胁也变得日益复杂，传统的网络安全被动防御方法难以快速地应对日益复杂的威胁。知识图谱是一种强大的工具，在最近几年中，知识图谱被广泛应用在各个领域。为了应对日益复杂的网络安全威胁，人们提出了使用知识图谱来处理网络安全问题，网络安全应急响应知识图谱就此诞生。网络安全应急响应知识图谱是一种数据驱动的、线性的、计算能力非常强大的工具。网络安全应急响应知识图谱可以直观地反应网络安全实体和实体之间的关系，例如：恶意软件和漏洞之间的利用关系，攻击者与组织之间的从属关系，以及软件与漏洞之间的关系，从事网络安全工作的人员可以通过网络安全应急响应知识图谱来更好地处理网络安全问题。

2、知识图谱在许多人工智能任务中起着至关重要的作用，但它们却经常面临着不完整性的问题。

3、知识图谱补全(knowledge graph completion, kgc)是知识图谱社区的一个重要研究领域，旨在挖掘给定的不完全知识图谱中缺失的三元组。kgc包含了三重分类、实体预测、关系预测等子任务。kgc任务之间的共同点是建立一个有效的机

4、基于大语言模型llm的网络安全应急响应知识图谱补全kgc是一种基于大语言模型的知识图谱补全kgc方法，其目的是利用大语言模型来预测知识图谱中缺失的三元组，使知识图谱成为更好的网络安全基础设施，从而使许多基于网络安全的自动化服务受益。但是现如今的方法普遍存在如下的问题：

5、（1）当前基于大语言模型的kgc方法构造了简单的提示符，并应用普通的指令调优it对大语言模型进行微调；然而，大语言模型对精确和微妙的事实知识的记忆不足，往往导致错误；

6、（2）知识图谱还具有复杂的结构信息，如：子图结构、关系模式、相关实体/关系等；整合这些结构信息对大语言模型发展和对知识图谱的全面理解是非常有利的；然而，指令调优it忽略了这一点，因为每个输入提示符只包含单个输入也就是三元组，这不能为大语言模型建立知识图谱结构的信息，从而导致结构性信息的浪费。因此，如何将有用的知识图谱结构信息整合到大语言模型中，以实现大语言模型中的结构感知推理，从而进行知识图谱补全就变的至关重要。

技术实现思路

1、为实现上述目的，专利技术人提供了一种基于大语言模型的网络安全应急响应知识图谱补全方法，包括步骤：

2、s1，对给定的知识图谱的三元组中的实体和关系进行结构嵌入；

3、s2，将得到的实体和关系嵌入输入文本适应器中，得到相对应的实体和关系的文本提示；

4、s3，根据所给定的知识图谱的三元组，制定其大语言模型的输入任务，得到任务语句；

5、s4，将得到的任务语句和任务语句相对应的文本提示进行拼接后，输入大语言模型中，得到相对应的任务语句结果，用于判断该三元组是否准确；

6、s5，根据得到的任务语句结果和任务语句真实的结果做损失来训练网络，进行知识图谱的补全。

7、作为本专利技术的一种优选方式，步骤s1中，所述三元组由头实体、关系和尾实体组成。

8、作为本专利技术的一种优选方式，步骤s1还包括：

9、s101，将三元组（h,r,t）输入预先训练好的结构嵌入embedings中得到该三元组的嵌入(h,r,t)，表达式为：

10、，

11、其中，h表示三元组中的头实体，r表示三元组中的关系，t表示三元组中的尾实体，h表示头实体嵌入，r表示关系嵌入，t表示尾实体嵌入；

12、s102，将三元组的位置信息加入到三元组的嵌入中得到具有位置信息的三元组嵌入,表达式为：

13、。

14、作为本专利技术的一种优选方式，步骤s2还包括：

15、s201，将三元组嵌入输入文本适应器中得到三元组文本提示信息，表达式为：

16、，

17、其中，表示头实体提示信息，表示关系提示信息，表示尾实体提示信息。

18、作为本专利技术的一种优选方式，步骤s3还包括：

19、s301，将三元组输入制定其大语言模型的输入任务的构造器中，得到针对该三元组的大语言模型的输入任务；

20、s302，构造四个任务，分别为三重分类、关系预测、头实体预测和尾实体预测；其中，

21、三重分类是指给定一个三元组（h,r,t），任务是将其分类为正确或不正确；

22、关系预测是指给定一个头实体和一个头实体，任务是预测两者之间的关系；

23、头实体预测是指给定一个头实体和一个关系，任务是预测头实体；

24、尾实体预测是指给定一个头实体和一个关系，任务是预测与头实体相关的头实体。

25、作为本专利技术的一种优选方式，步骤s4还包括：

26、s401，把三元组文本提示信息放在大语言模型任务的前面作为指令的前缀k，其中，将放在三重分类任务文本的前面作为k，放在关系预测任务前面作为k，放在头实体预测任务前面作为k，放在头实体预测任务前面作为k；

27、s402，将带有文本提本文档来自技高网...

【技术保护点】

1.一种基于大语言模型的网络安全应急响应知识图谱补全方法，其特征在于，包括步骤：

2.根据权利要求1所述的基于大语言模型的网络安全应急响应知识图谱补全方法，其特征在于：步骤S1中，所述三元组由头实体、关系和尾实体组成。

3.根据权利要求1所述的基于大语言模型的网络安全应急响应知识图谱补全方法，其特征在于，步骤S1还包括：

4.根据权利要求3所述的基于大语言模型的网络安全应急响应知识图谱补全方法，其特征在于，步骤S2还包括：

5.根据权利要求4所述的基于大语言模型的网络安全应急响应知识图谱补全方法，其特征在于，步骤S3还包括：

6.根据权利要求5所述的基于大语言模型的网络安全应急响应知识图谱补全方法，其特征在于，步骤S4还包括：

7.根据权利要求1所述的基于大语言模型的网络安全应急响应知识图谱补全方法，其特征在于：还包括测试步骤S6，即在至少两个公开的网络安全数据集上进行网络测试。

【技术特征摘要】

1.一种基于大语言模型的网络安全应急响应知识图谱补全方法，其特征在于，包括步骤：

2.根据权利要求1所述的基于大语言模型的网络安全应急响应知识图谱补全方法，其特征在于：步骤s1中，所述三元组由头实体、关系和尾实体组成。

3.根据权利要求1所述的基于大语言模型的网络安全应急响应知识图谱补全方法，其特征在于，步骤s1还包括：

4.根据权利要求3所述的基于大语言模型的网络安全应急响应知识图谱补全方法...

【专利技术属性】
技术研发人员：车洵，孙捷，金奎，杨念祖，陈亚当，
申请(专利权)人：南京众智维信息科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人