【技术实现步骤摘要】
本专利技术涉及模型幻觉检测,尤其是涉及一种基于自洽投票的大语言模型幻觉检测器自我迭代训练方法。
技术介绍
1、大语言模型的幻觉检测是指利用一定技术手段检测大语言模型回复中的幻觉现象。这些幻觉可能是误导性信息、不准确的描述、误解或歧义等,可能对信息的理解和传播造成负面影响。目前,大语言模型普遍存在“幻觉”问题,即在回答用户问题时,尤其是在回答那些需要大量知识的问题时,模型会产生听起来可信但不真实或无意义的信息,这极大地阻碍了大语言模型在现实世界中的应用。
2、现有技术的缺点均体现在幻觉检测能力较弱这一问题上,其内部原因在于缺少一个较大规模的训练数据集,但由于纯靠人工标注的成本是不可承受的,构建一个庞大的幻觉数据集需要一个强大的幻觉检测器。如此就陷入了一个死循环,即如果需要扩大数据集规模,就需要更强的幻觉检测器,而要训练出更强的幻觉检测器,就需要更大的数据集。
3、综上,当前缺少一种大语言模型幻觉检测器训练方法,以解决或部分解决幻觉数据集规模和检测器精度难以同时提升的问题。
技术实现思路<
本文档来自技高网...
【技术保护点】
1.一种基于自洽投票的大语言模型幻觉检测器自我迭代训练方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的一种基于自洽投票的大语言模型幻觉检测器自我迭代训练方法,其特征在于,所述的输入数据的标注过程包括如下步骤:
3.根据权利要求2所述的一种基于自洽投票的大语言模型幻觉检测器自我迭代训练方法,其特征在于,所述的通过自洽投票筛选得到三元组形式的最终输出数据包括如下步骤:
4.根据权利要求3所述的一种基于自洽投票的大语言模型幻觉检测器自我迭代训练方法,其特征在于,所述的幻觉类型包括无幻觉、无法验证、无事实和矛盾。
5.
...【技术特征摘要】
1.一种基于自洽投票的大语言模型幻觉检测器自我迭代训练方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的一种基于自洽投票的大语言模型幻觉检测器自我迭代训练方法,其特征在于,所述的输入数据的标注过程包括如下步骤:
3.根据权利要求2所述的一种基于自洽投票的大语言模型幻觉检测器自我迭代训练方法,其特征在于,所述的通过自洽投票筛选得到三元组形式的最终输出数据包括如下步骤:
4.根据权利要求3所述的一种基于自洽投票的大语言模型幻觉检测器自我迭代训练方法,其特征在于,所述的幻觉类型包括无幻觉、无法验证、无事实和矛盾。
5.根据权利要求2所述的一种基于自洽投票的大语言模型幻觉检测器自我迭代训练方法,其特征在于,所述的输入数据包括问题信息、回答信息和参考文献信息。
6.根据权利要求5所述的一种基于自洽投票的大语言模型幻觉检测器自我迭代训练方法,其特征在于,生成三元组形...
【专利技术属性】
技术研发人员:张文蔚,顾宇喆,季紫薇,吕成器,林达华,陈恺,
申请(专利权)人:上海人工智能创新中心,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。