基于大型语言模型的领域特定对话系统的幻觉检测和处理技术方案

技术编号:44414116 阅读:21 留言:0更新日期:2025-02-25 10:29
本公开涉及基于大型语言模型的领域特定对话系统的幻觉检测和处理。本文描述了用于检测和减少幻觉并且改进基于LLM的QA系统的可靠性的系统和方法。特别地,本公开提供解决了QA系统的不同类型的幻觉的幻觉检测和处理方法集合。本文描述的幻觉检测方法包括借助于句子相似度估计和关键词匹配将自然语言答案与上下文信息进行比较。本文描述的幻觉处理方法包括取决于在自然语言答案中检测到的幻觉水平,从自然语言答案移除幻觉句子或者使用更好的上下文信息重新生成自然语言答案。还提供了一种混合框架,其系统地将幻觉检测方法和幻觉处理方法组合到一个系统中,以实现用于QA系统的最佳幻觉减少性能。

【技术实现步骤摘要】

本文件中公开的设备和方法涉及机器学习,并且更具体地涉及基于大型语言模型的对话系统的幻觉检测(hallucination detection)和处理。


技术介绍

1、除非本文另有指示,否则本章节中描述的材料不因在本章节中包括而被承认为是现有技术。

2、大型语言模型(llm)已经成为人工智能的最近焦点并且在许多应用中被使用。诸如chatgpt之类的llm已经被发现对于诸如问答(qa)系统的对话系统的开发尤其有效。llm在巨大量的训练数据上被训练,并且通常具有多个自然语言处理相关的训练目标。llm的使用显著改进了下游对话任务的性能。特别地,llm使得系统能够更好地理解用户的输入,学习更丰富的知识和更好的自然语言处理能力(例如,在共指消解中、总结中等)。附加地,llm使得系统能够生成更自然且更高质量的响应。与先前的最先进技术相比,最近开发的基于llm的对话系统(例如chatgpt、gpt4)可以更准确地理解用户的意图,并生成智能得多的与用户的对话。

3、然而,llm仍然具有多个弱点。llm的一个主要问题是所谓的“幻觉”问题。幻觉问题通常可以本文档来自技高网...

【技术保护点】

1.一种回答自然语言问题的方法,所述方法包括:

2.根据权利要求1所述的方法,检测幻觉内容进一步包括:

3.根据权利要求2所述的方法,检测幻觉内容进一步包括:

4.根据权利要求3所述的方法,确定相似度进一步包括:

5.根据权利要求4所述的方法,确定相应的嵌入相似度进一步包括:

6.根据权利要求4所述的方法,确定相似度进一步包括:

7.根据权利要求6所述的方法,确定相应的单词模式重叠率进一步包括:

8.根据权利要求7所述的方法,确定相应单词模式重叠率进一步包括:

9.根据权利要求8所述的方法,确...

【技术特征摘要】

1.一种回答自然语言问题的方法,所述方法包括:

2.根据权利要求1所述的方法,检测幻觉内容进一步包括:

3.根据权利要求2所述的方法,检测幻觉内容进一步包括:

4.根据权利要求3所述的方法,确定相似度进一步包括:

5.根据权利要求4所述的方法,确定相应的嵌入相似度进一步包括:

6.根据权利要求4所述的方法,确定相似度进一步包括:

7.根据权利要求6所述的方法,确定相应的单词模式重叠率进一步包括:

8.根据权利要求7所述的方法,确定相应单词模式重叠率进一步包括:

9.根据权利要求8所述的方法,确定相应的重叠长度进一步包括:

10.根据权利要求6所述的方法,将自然语言答案中的至少一个句子标记为幻觉内容进一步包括:

11.根据权利要求2所述的方法,检测幻觉内容进一步包括:

12.根据权利要求1所述的方法,进一步包括:

【专利技术属性】
技术研发人员:周正宇A·甘德鲁
申请(专利权)人:罗伯特·博世有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1