System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基于知识图谱的大语言模型幻觉问题的自动修正方法和装置制造方法及图纸_技高网

一种基于知识图谱的大语言模型幻觉问题的自动修正方法和装置制造方法及图纸

技术编号:40635976 阅读:5 留言:0更新日期:2024-03-13 21:19
本发明专利技术公开了一种基于知识图谱的大语言模型幻觉问题的自动修正方法和装置,其步骤包括:使用大语言模型抽取文本中需要校验的观点;利用少样本提示的方式提取待校验观点中的命名实体;从知识图谱中筛选与待校验观点相关的三元组;根据筛选得到的若干三元组对观点的正确性进行校验,并给出修改建议;结合所有观点的修改建议对文本中的错误表述进行修正。本发明专利技术能够利用大语言模型自动执行上述步骤,根据任意给定的知识图谱对大语言模型生成的文本进行修正。

【技术实现步骤摘要】

本专利技术涉及一种修正大预言模型幻觉的方法,特别是一种基于知识图谱的大预言模型幻觉问题的自动修正方法和装置,属于自然语言处理。


技术介绍

1、大语言模型(llm)在人工智能领域备受瞩目,其代表性模型如chatgpt和llama已经在社会、商业和研究等多个领域产生了深远的影响。这些强大的模型能够生成自然语言文本,执行文本生成、问答、翻译等任务,其灵活性和广泛应用性使其成为当今ai领域的关键技术之一。然而,尽管这些模型强大,它们仍然面临着一个严峻的挑战,即事实幻觉问题。

2、事实幻觉问题指的是大语言模型由于缺乏内在知识而经常产生关于事实信息的虚假陈述。这一问题对于现实世界中的应用尤为重要,因为事实的准确性在决策制定、信息传播和问题解决中都至关重要。事实幻觉问题已经引起了自然语言处理界的广泛关注,并成为研究热点之一。

3、其中一个导致事实幻觉的根本原因是在训练过程中的数据问题。自动化的大规模数据收集可能会导致错误信息被纳入训练数据中,从而影响模型的输出质量。此外,过度重复某些数据可能会引入记忆偏差,导致模型更容易产生虚假陈述。

4、另一个问题是在预训练语言模型中的编码器的缺陷以及不同解码策略之间的差异。这些因素都可以导致模型生成的文本中出现虚假陈述。最近的研究强调了模型输出的置信度作为潜在幻觉的指标,即模型在生成文本时对自己的答案有多有信心。

5、为了减轻大语言模型的事实幻觉问题,研究人员正在尝试将知识图谱(kg)与这些模型集成。知识图谱包含了大量高质量的事实信息,如果能够与大语言模型结合使用,可以显著改善模型的事实知识。近期的工作注重于通过检索知识图谱中与模型输入相关的实体,然后将获得的事实三元组用作额外的背景信息,以增强模型对事实的了解。

6、然而,目前的方法仅限于检索与查询中明确提到的实体相关的事实知识。而大型语言模型的基本能力通常涉及复杂的多步骤推理,这需要验证和补充推理过程中可能用到的事实知识。因此,以前的方法尚不足以解决大型语言模型在推理过程中可能出现的事实幻觉问题。这个问题仍然是自然语言处理领域亟待解决的挑战之一,需要进一步的研究和创新。


技术实现思路

1、为更有效地缓解大语言模型的幻觉问题,本专利技术提供了一种基于知识图谱的大语言模型幻觉问题的自动修正方法和装置

2、本专利技术所采用的技术方案概述如下:

3、一种基于知识图谱的大语言模型幻觉问题的自动修正方法,包括以下步骤:

4、利用大语言模型抽取文本中需要进行正确性校验的观点,得到待校验观点;

5、结合知识图谱中的信息判断抽取出的待校验观点的正确性,得到校验结果并给出修改建议;

6、利用大语言模型根据校验结果及修改建议对文本中的错误表述进行修正。

7、进一步地,所述利用大语言模型抽取文本中需要进行正确性校验的观点,包括:

8、通过少样本提示的方式使大语言模型生成有检验价值的观点,减少无用观点的生成;

9、建立命名实体提取机制,利用少样本提示的方式提取观点中包含的命名实体。

10、进一步地,所述结合知识图谱中的信息判断抽取出的待校验观点的正确性,得到校验结果并给出修改建议,包括:

11、利用大语言模型判断知识图谱中与观点校验相关的事实三元组;

12、对于输入长度受限的大语言模型,使用分块的方式逐块对事实三元组进行筛选;

13、根据筛选得到的事实三元组对观点的正确性进行判断,得到校验结果并给出相应的修改建议。

14、进一步地,所述分块是将事实三元组打乱顺序,根据超参数的设置分为若干大小相同的子块。

15、进一步地,所述逐块对事实三元组进行筛选,是通过少样本提示的方式,指导语言模型选择子块中与模型观点描述相关的事实三元组。

16、进一步地,所述对文本中的错误表述进行修正,包括:在得到所有观点的校验结果后,通过少样本提示的方式利用大语言模型对其中的错误表述进行细粒度的修正。

17、进一步地,所述方法的整体流程都由大语言模型自动完成,并可通过迭代的方式对文本中涉及多跳的观点进行校验。

18、一种基于知识图谱的大语言模型幻觉问题的自动修正装置,包括以下部分:

19、1)观点提取器:给定模型的回答作为输入,观点提取器将模型回答中需要进行事实性验证的观点都提取出来。通常,模型回答通常包含各种事实性陈述,因此观点提取器的主要功能是将这些陈述分离出来,以便进一步验证。

20、2)实体检测器和知识检索器:给定一系列提取出的模型观点,实体检测器开始工作,它的任务是从观点中识别关键实体。这些实体是需要在知识图谱中验证的重要元素。接着,知识检索器进一步利用这些实体在知识图谱中检索相关事实三元组,这些三元组包含了与这些实体相关的事实信息。

21、3)事实选择器:给定一系列图谱中的事实三元组,从知识图谱中检索到的事实三元组中选择出与模型观点最相关的那些。这个步骤确保只有最相关的信息用于验证模型的观点。

22、4)观点验证器:给定一系列和模型观点相关的事实三元组,观点验证器使用从知识图谱中检索到的事实三元组对模型的观点的事实性进行验证。它评估模型观点与已知事实的一致性,并提出对模型回答的修改建议,以使其更准确和可信。

23、5)回答修正器:给定一系列观点验证器对模型观点的事实性检验和模型回答修改建议,回答修正器修改模型原有答案。

24、本专利技术通过“提取—检测—选择—验证—修正”的循环,可以迭代多次并确保模型回答中的事实正确性。

25、与现有技术相比,本专利技术的有益效果是:

26、1)引入了一种创新的方法,利用知识图谱来解决大语言模型的幻觉问题,从而提高了回答的准确性。

27、2)提出了一种在大型语言模型的推理过程中缓解幻觉的框架,这有助于减少错误回答的风险。

28、3)通过充分利用大型语言模型的能力并进行迭代循环,无需额外的训练操作,有效地缓解了模型的幻觉问题,提高了回答的质量和可靠性。

本文档来自技高网...

【技术保护点】

1.一种基于知识图谱的大语言模型幻觉问题的自动修正方法,其特征在于,包括以下步骤:

2.如权利要求1所述的方法,其特征在于,所述利用大语言模型抽取文本中需要进行正确性校验的观点,包括:

3.如权利要求1所述的方法,其特征在于,所述结合知识图谱中的信息判断抽取出的待校验观点的正确性,得到校验结果并给出修改建议,包括:

4.如权利要求3所述的方法,其特征在于,所述分块是将事实三元组打乱顺序,根据超参数的设置分为若干大小相同的子块。

5.如权利要求4所述的方法,其特征在于,所述逐块对事实三元组进行筛选,是通过少样本提示的方式,指导语言模型选择子块中与模型观点描述相关的事实三元组。

6.如权利要求1所述的方法,其特征在于,所述对文本中的错误表述进行修正,包括:在得到所有观点的校验结果后,通过少样本提示的方式利用大语言模型对其中的错误表述进行细粒度的修正。

7.如权利要求1所述的方法,其特征在于,所述方法的整体流程都由大语言模型自动完成,并可通过迭代的方式对文本中涉及多跳的观点进行校验。

8.一种基于知识图谱的大语言模型幻觉问题的自动修正装置,其特征在于,包括:

9.一种计算机设备,其特征在于,包括存储器和处理器,所述存储器存储计算机程序,所述计算机程序被配置为由所述处理器执行,所述计算机程序包括用于执行权利要求1至7任一所述方法中各步骤的指令。

10.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至7任一所述方法的步骤。

...

【技术特征摘要】

1.一种基于知识图谱的大语言模型幻觉问题的自动修正方法,其特征在于,包括以下步骤:

2.如权利要求1所述的方法,其特征在于,所述利用大语言模型抽取文本中需要进行正确性校验的观点,包括:

3.如权利要求1所述的方法,其特征在于,所述结合知识图谱中的信息判断抽取出的待校验观点的正确性,得到校验结果并给出修改建议,包括:

4.如权利要求3所述的方法,其特征在于,所述分块是将事实三元组打乱顺序,根据超参数的设置分为若干大小相同的子块。

5.如权利要求4所述的方法,其特征在于,所述逐块对事实三元组进行筛选,是通过少样本提示的方式,指导语言模型选择子块中与模型观点描述相关的事实三元组。

6.如权利要求1所述的方法,其特征在于,所述对文本中的错...

【专利技术属性】
技术研发人员:韩先培刘衍江管新岩林鸿宇陆垚杰何苯孙乐郑佳
申请(专利权)人:中国科学院软件研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1