System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 利用外接知识库核查减轻大语言模型幻觉的方法及系统技术方案_技高网

利用外接知识库核查减轻大语言模型幻觉的方法及系统技术方案

技术编号:41129811 阅读:5 留言:0更新日期:2024-04-30 17:58
本发明专利技术公开了利用外接知识库核查减轻大语言模型幻觉的方法及系统,涉及大语言模型技术领域,该方法包括以下步骤:获取大语言模型输出的文本信息并转化成结构化的事实三元组数据;基于结构化的事实三元组数据进行问题生成;基于检索系统收集用于验证事实三元组数据的答案并进行验证;基于验证结果对事实三元组数据进行事实修订。本发明专利技术通过自动化的流程,有效提升了文本信息的准确性,降低了人工事实核查的劳动强度,它能够精确地识别出错误信息,并提供基于证据的修正建议,大大提高了内容质量和可信度,从而能够在需要基于精确数据的决策领域,如金融、医疗和法律咨询中,提供了支持明智决策的事实核查工具。

【技术实现步骤摘要】

本专利技术涉及大语言模型,具体来说,涉及利用外接知识库核查减轻大语言模型幻觉的方法及系统


技术介绍

1、目前,缓解幻觉的主要方法是retrieval-augmented generation(rag)技术和reinforcement learning from humanfeedback(rlhf)技术。这两种技术根据模型所处的不同阶段,所选择的两种不同的技术去缓解大语言模型的幻觉问题。

2、rag(检索增强生成)技术是自然语言处理中的一种创新方法,它结合了基于检索的模型和生成模型的优势,以提高语言模型的性能。rag模型首先利用基于检索的方法搜索大型文档或知识库,这一步用来查找相关信息用于响应的生成。然后,检索的相关信息会被输入到一个生成模型中,这个模型会使用检索的信息作为额外的上下文或证据来生成响应。最后,通过整合直接从相关文档中检索到的信息,rag可以提供比单独的生成模型更准确、更详细、更与上下文相关的响应。

3、rlhf(强化学习从人类反馈)技术是一种先进的机器学习方法,它利用人类的反馈来指导和优化模型的学习过程。rlhf方法首先从人类用户那里收集反馈,这些反馈可以是对模型输出的评分、评论或者更加直接的指导。然后,这些人类反馈会被转化为“奖励信号”,在强化学习中,模型通过最大化其在特定任务中获得的奖励来学习。模型或不断的尝试和调整其策略,以获得更多的奖励,从而学习如何更好的执行任务。最后,通过人类反馈的持续更迭,模型的表现可以逐步提高,使模型的输出更加合理可靠。

4、然而,无论是rag还是rlhf,虽然它们都在减轻模型的幻觉方面展现出它们不同的特点和优势,但是它们也存在着很明显的缺陷和不足之处。rag技术由于对外部数据库或文档的依赖性,这就要求数据库和文档中的内容必须保证准确性和可靠性,也就是说外部知识的质量直接决定了模型的输出是否准确。同时rag技术结合了检索模型和生成模型,这样在一定程度上增加了模型架构的复杂性,这会导致需要更多的计算资源和处理时间,使得在应用中会有非常高的延迟。其次,检索组件的效果也非常重要,如果检索模型获取的信息完全不相关或者在上下文中不合适,模型很难对检索内容中的有用和不太有用的部分进行区分,这也是rag技术非常明显的缺陷。

5、rlhf技术由于高度的依赖于人类反馈的质量,如果反馈是不准确、有偏见或不一致,这就会导致模型学习错误的行为。这也是rlhf的缺点和局限性的最主要的方面,人类反馈是具有主观性的,不同的人可能会对统一输出有不同的评价,这就会导致模型训练结果的不稳定性和不可预测性。同时,rlhf可能会导致模型过度的依赖人类的指导,在没有人类反馈的情况下模型的性能可能降低。

6、具体来说,现在更广泛的任务在由生成模型处理时面临着包含着事实错误的风险增加,且生成的文本往往比较长,且缺乏对个别事实明确定义的细粒度,以及在事实核查过程中,明确的证据匮乏。

7、针对相关技术中的问题,目前尚未提出有效的解决方案。


技术实现思路

1、针对相关技术中的问题,本专利技术提出利用外接知识库核查减轻大语言模型幻觉的方法及系统,以克服现有相关技术所存在的上述技术问题。

2、为此,本专利技术采用的具体技术方案如下:

3、根据本专利技术的一方面,提供了利用外接知识库核查减轻大语言模型幻觉的方法,该利用外接知识库核查减轻大语言模型幻觉的方法包括以下步骤:

4、s1、获取大语言模型输出的文本信息并转化成结构化的事实三元组数据;

5、s2、基于结构化的事实三元组数据进行问题生成;

6、s3、基于检索系统收集用于验证事实三元组数据的答案并进行验证;

7、s4、基于验证结果对事实三元组数据进行事实修订。

8、进一步的,获取大语言模型输出的文本信息并转化成结构化的事实三元组数据包括以下步骤:

9、s11、对获取的文本信息进行分析并拆分为句子形式;

10、s12、将每个句子中的事实内容转化为结构化的事实三元组数据。

11、进一步的,事实三元组数据包括主体、谓语及对象。

12、进一步的,问题生成包括类型感知问题生成和上下文驱动问题生成。

13、进一步的,基于检索系统收集用于验证事实三元组数据的答案并进行验证包括以下步骤:

14、s31、基于知识图谱问答系统对生成的问题进行答案检索,得到初步答案,初步答案为单个值或列表;

15、s32、基于网络搜索引擎对生成的问题进行答案搜索,并从前m个搜索结果提取答案,生成答案列表;

16、s33、对初步答案和答案列表进行答案验证。

17、根据本专利技术的另一方面,还提供了利用外接知识库核查减轻大语言模型幻觉的系统,该利用外接知识库核查减轻大语言模型幻觉的系统包括:数据获取模块、问题生成模块、答案收集模块及事实修订模块;

18、数据获取模块,用于获取大语言模型输出的文本信息并转化成结构化的事实三元组数据;

19、问题生成模块,用于基于结构化的事实三元组数据进行问题生成;

20、答案收集模块,用于基于检索系统收集用于验证事实三元组数据的答案并进行验证;

21、事实修订模块,用于基于验证结果对事实三元组数据进行事实修订。

22、进一步的,获取大语言模型输出的文本信息并转化成结构化的事实三元组数据包括:

23、对获取的文本信息进行分析并拆分为句子形式;

24、将每个句子中的事实内容转化为结构化的事实三元组数据。

25、进一步的,事实三元组数据包括主体、谓语及对象。

26、进一步的,问题生成包括类型感知问题生成和上下文驱动问题生成。

27、进一步的,基于检索系统收集用于验证事实三元组数据的答案并进行验证包括:

28、基于知识图谱问答系统对生成的问题进行答案检索,得到初步答案,初步答案为单个值或列表;

29、基于网络搜索引擎对生成的问题进行答案搜索,并从前m个搜索结果提取答案,生成答案列表;

30、对初步答案和答案列表进行答案验证。

31、本专利技术的有益效果为:

32、1、本专利技术通过自动化的流程,有效提升了文本信息的准确性,降低了人工事实核查的劳动强度,它能够精确地识别出错误信息,并提供基于证据的修正建议,大大提高了内容质量和可信度,从而能够在需要基于精确数据的决策领域,如金融、医疗和法律咨询中,提供了支持明智决策的事实核查工具。

33、2、本专利技术能够通过结合自动化技术和外部知识库,显著提高了事实核查的准确性和效率,对于维护信息质量和促进知识传播的正确性具有重要的积极响应。

34、3、本专利技术通过利用外接知识库核查来减轻大语言模型幻觉的方法,这种方法能够更好的解决模型的幻觉问题,在对幻觉的评判上更加严格,对于模型的生成中是否存在幻觉,该方法对生成的问答中的本文档来自技高网...

【技术保护点】

1.利用外接知识库核查减轻大语言模型幻觉的方法,其特征在于,该利用外接知识库核查减轻大语言模型幻觉的方法包括以下步骤:

2.根据权利要求1所述的利用外接知识库核查减轻大语言模型幻觉的方法,其特征在于,所述获取大语言模型输出的文本信息并转化成结构化的事实三元组数据包括以下步骤:

3.根据权利要求2所述的利用外接知识库核查减轻大语言模型幻觉的方法,其特征在于,所述事实三元组数据包括主体、谓语及对象。

4.根据权利要求1所述的利用外接知识库核查减轻大语言模型幻觉的方法,其特征在于,所述问题生成包括类型感知问题生成和上下文驱动问题生成。

5.根据权利要求1所述的利用外接知识库核查减轻大语言模型幻觉的方法,其特征在于,所述基于检索系统收集用于验证事实三元组数据的答案并进行验证包括以下步骤:

6.利用外接知识库核查减轻大语言模型幻觉的系统,用于实现权利要求1-5中任一项所述的利用外接知识库核查减轻大语言模型幻觉的方法,其特征在于,该利用外接知识库核查减轻大语言模型幻觉的系统包括:数据获取模块、问题生成模块、答案收集模块及事实修订模块

7.根据权利要求1所述的利用外接知识库核查减轻大语言模型幻觉的系统,其特征在于,所述获取大语言模型输出的文本信息并转化成结构化的事实三元组数据包括:

8.根据权利要求7所述的利用外接知识库核查减轻大语言模型幻觉的系统,其特征在于,所述事实三元组数据包括主体、谓语及对象。

9.根据权利要求1所述的利用外接知识库核查减轻大语言模型幻觉的方法,其特征在于,所述问题生成包括类型感知问题生成和上下文驱动问题生成。

10.根据权利要求1所述的利用外接知识库核查减轻大语言模型幻觉的系统,其特征在于,所述基于检索系统收集用于验证事实三元组数据的答案并进行验证包括:

...

【技术特征摘要】

1.利用外接知识库核查减轻大语言模型幻觉的方法,其特征在于,该利用外接知识库核查减轻大语言模型幻觉的方法包括以下步骤:

2.根据权利要求1所述的利用外接知识库核查减轻大语言模型幻觉的方法,其特征在于,所述获取大语言模型输出的文本信息并转化成结构化的事实三元组数据包括以下步骤:

3.根据权利要求2所述的利用外接知识库核查减轻大语言模型幻觉的方法,其特征在于,所述事实三元组数据包括主体、谓语及对象。

4.根据权利要求1所述的利用外接知识库核查减轻大语言模型幻觉的方法,其特征在于,所述问题生成包括类型感知问题生成和上下文驱动问题生成。

5.根据权利要求1所述的利用外接知识库核查减轻大语言模型幻觉的方法,其特征在于,所述基于检索系统收集用于验证事实三元组数据的答案并进行验证包括以下步骤:

6.利用外接知识库核查减轻大语言模型幻觉的系统,用...

【专利技术属性】
技术研发人员:周熠张蕊保宋建恒
申请(专利权)人:中国科学技术大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1