基于自洽投票的大语言模型幻觉检测器自我迭代训练方法技术

技术编号：43139839 阅读：25 留言：0更新日期：2024-10-29 17:43

本发明专利技术涉及一种基于自洽投票的大语言模型幻觉检测器自我迭代训练方法，包括：获取原始的幻觉数据集并转换为预设的数据格式，基于转换后的幻觉数据集对大语言模型幻觉检测器进行第一阶段的训练；以输入数据中的问题信息作为多个不同的大语言模型的输入，采集对应的回答信息，构建新的输入数据，实现新的输入数据的标注并加入幻觉数据集中，对型幻觉检测器进行第二阶段的训练；以基于多种话题生成的多个问题信息作为多个不同的大语言模型的输入，采集对应的回答信息，构建新的输入数据，实现新的输入数据的标注并加入幻觉数据集中，对幻觉检测器进行第三阶段的训练。与现有技术相比，本发明专利技术实现了数据集规模和检测器精度的同时提升。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及模型幻觉检测，尤其是涉及一种基于自洽投票的大语言模型幻觉检测器自我迭代训练方法。

技术介绍

1、大语言模型的幻觉检测是指利用一定技术手段检测大语言模型回复中的幻觉现象。这些幻觉可能是误导性信息、不准确的描述、误解或歧义等，可能对信息的理解和传播造成负面影响。目前，大语言模型普遍存在“幻觉”问题，即在回答用户问题时，尤其是在回答那些需要大量知识的问题时，模型会产生听起来可信但不真实或无意义的信息，这极大地阻碍了大语言模型在现实世界中的应用。

2、现有技术的缺点均体现在幻觉检测能力较弱这一问题上，其内部原因在于缺少一个较大规模的训练数据集，但由于纯靠人工标注的成本是不可承受的，构建一个庞大的幻觉数据集需要一个强大的幻觉检测器。如此就陷入了一个死循环，即如果需要扩大数据集规模，就需要更强的幻觉检测器，而要训练出更强的幻觉检测器，就需要更大的数据集。

3、综上，当前缺少一种大语言模型幻觉检测器训练方法，以解决或部分解决幻觉数据集规模和检测器精度难以同时提升的问题。

技术实现思路</b>

本文档来自技高网...

【技术保护点】

1.一种基于自洽投票的大语言模型幻觉检测器自我迭代训练方法，其特征在于，包括如下步骤：
2.根据权利要求1所述的一种基于自洽投票的大语言模型幻觉检测器自我迭代训练方法，其特征在于，所述的输入数据的标注过程包括如下步骤：
3.根据权利要求2所述的一种基于自洽投票的大语言模型幻觉检测器自我迭代训练方法，其特征在于，所述的通过自洽投票筛选得到三元组形式的最终输出数据包括如下步骤：
4.根据权利要求3所述的一种基于自洽投票的大语言模型幻觉检测器自我迭代训练方法，其特征在于，所述的幻觉类型包括无幻觉、无法验证、无事实和矛盾。
5.根据权利要求2所述的...

【技术特征摘要】

1.一种基于自洽投票的大语言模型幻觉检测器自我迭代训练方法，其特征在于，包括如下步骤：
2.根据权利要求1所述的一种基于自洽投票的大语言模型幻觉检测器自我迭代训练方法，其特征在于，所述的输入数据的标注过程包括如下步骤：
3.根据权利要求2所述的一种基于自洽投票的大语言模型幻觉检测器自我迭代训练方法，其特征在于，所述的通过自洽投票筛选得到三元组形式的最终输出数据包括如下步骤：
4.根据权利要求3所述的一种基于自洽投票的大语言模型幻觉检测器自我迭代训练方法，其特征在于，所述的幻觉类型包括无幻觉、无法验证、无事实和矛盾。
5.根据权利要求2所述的一种基于自洽投票的大语言模型幻觉检测器自我迭代训练方法，其特征在于，所述的输入数据包括问题信息、回答信息和参考文献信息。
6.根据权利要求5所述的一种基于自洽投票的大语言模型幻觉检测器自我迭代训练方法，其特征在于，生成三元组形...

【专利技术属性】
技术研发人员：张文蔚，顾宇喆，季紫薇，吕成器，林达华，陈恺，
申请(专利权)人：上海人工智能创新中心，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人

上一篇：一种便捷式测量工装制造技术
下一篇：一种钢筋桁架模板制造技术

相关技术

基于多模态检索增强和指南引导的医疗诊...

多模态大模型分层自适应冻结微调方法及...

一种面向视觉语言慢思考推理的半离线策...

一种基于分层三维高斯表示的建模与渲染...

基于图灵机思想的大语言模型长度泛化数...

基于上下文学习模型表征的大语言模型动...

一种基于特征校正的图像描述训练方法、...

应用于智慧观赛的冰壶运动采集感知与策...

语言推理服务器、用于语言推理的方法、...

一种基于3D人体骨架的群体行为识别方...

网友询问留言已有0条评论

还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1

发布您的意见

相关领域技术

基于卷积神经网络的珍珠品质分类方法技...

一种拖轮作业能耗预测方法、系统、设备...

一种基于优化鼠群算法的儿童脑部MRI...

智能数据分析方法、智能数据分析装置和...

微网运行成本优化方法技术

基于图像处理的鸟种类和位置检测方法及...

一种短途运输航线适宜性综合评估方法技...

混凝土温度场的模拟方法、相关装置及计...