基于自洽投票的大语言模型幻觉检测器自我迭代训练方法技术

技术编号:43139839 阅读:25 留言:0更新日期:2024-10-29 17:43
本发明专利技术涉及一种基于自洽投票的大语言模型幻觉检测器自我迭代训练方法,包括:获取原始的幻觉数据集并转换为预设的数据格式,基于转换后的幻觉数据集对大语言模型幻觉检测器进行第一阶段的训练;以输入数据中的问题信息作为多个不同的大语言模型的输入,采集对应的回答信息,构建新的输入数据,实现新的输入数据的标注并加入幻觉数据集中,对型幻觉检测器进行第二阶段的训练;以基于多种话题生成的多个问题信息作为多个不同的大语言模型的输入,采集对应的回答信息,构建新的输入数据,实现新的输入数据的标注并加入幻觉数据集中,对幻觉检测器进行第三阶段的训练。与现有技术相比,本发明专利技术实现了数据集规模和检测器精度的同时提升。

【技术实现步骤摘要】

本专利技术涉及模型幻觉检测,尤其是涉及一种基于自洽投票的大语言模型幻觉检测器自我迭代训练方法


技术介绍

1、大语言模型的幻觉检测是指利用一定技术手段检测大语言模型回复中的幻觉现象。这些幻觉可能是误导性信息、不准确的描述、误解或歧义等,可能对信息的理解和传播造成负面影响。目前,大语言模型普遍存在“幻觉”问题,即在回答用户问题时,尤其是在回答那些需要大量知识的问题时,模型会产生听起来可信但不真实或无意义的信息,这极大地阻碍了大语言模型在现实世界中的应用。

2、现有技术的缺点均体现在幻觉检测能力较弱这一问题上,其内部原因在于缺少一个较大规模的训练数据集,但由于纯靠人工标注的成本是不可承受的,构建一个庞大的幻觉数据集需要一个强大的幻觉检测器。如此就陷入了一个死循环,即如果需要扩大数据集规模,就需要更强的幻觉检测器,而要训练出更强的幻觉检测器,就需要更大的数据集。

3、综上,当前缺少一种大语言模型幻觉检测器训练方法,以解决或部分解决幻觉数据集规模和检测器精度难以同时提升的问题。


技术实现思路</b>

本文档来自技高网...

【技术保护点】

1.一种基于自洽投票的大语言模型幻觉检测器自我迭代训练方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的一种基于自洽投票的大语言模型幻觉检测器自我迭代训练方法,其特征在于,所述的输入数据的标注过程包括如下步骤:

3.根据权利要求2所述的一种基于自洽投票的大语言模型幻觉检测器自我迭代训练方法,其特征在于,所述的通过自洽投票筛选得到三元组形式的最终输出数据包括如下步骤:

4.根据权利要求3所述的一种基于自洽投票的大语言模型幻觉检测器自我迭代训练方法,其特征在于,所述的幻觉类型包括无幻觉、无法验证、无事实和矛盾。

5.根据权利要求2所述的...

【技术特征摘要】

1.一种基于自洽投票的大语言模型幻觉检测器自我迭代训练方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的一种基于自洽投票的大语言模型幻觉检测器自我迭代训练方法,其特征在于,所述的输入数据的标注过程包括如下步骤:

3.根据权利要求2所述的一种基于自洽投票的大语言模型幻觉检测器自我迭代训练方法,其特征在于,所述的通过自洽投票筛选得到三元组形式的最终输出数据包括如下步骤:

4.根据权利要求3所述的一种基于自洽投票的大语言模型幻觉检测器自我迭代训练方法,其特征在于,所述的幻觉类型包括无幻觉、无法验证、无事实和矛盾。

5.根据权利要求2所述的一种基于自洽投票的大语言模型幻觉检测器自我迭代训练方法,其特征在于,所述的输入数据包括问题信息、回答信息和参考文献信息。

6.根据权利要求5所述的一种基于自洽投票的大语言模型幻觉检测器自我迭代训练方法,其特征在于,生成三元组形...

【专利技术属性】
技术研发人员:张文蔚顾宇喆季紫薇吕成器林达华陈恺
申请(专利权)人:上海人工智能创新中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1