【技术实现步骤摘要】
本专利技术涉及人工智能,特别涉及一种应答数据推理方法、装置、电子设备及存储介质。
技术介绍
1、随着深度学习技术的不断发展,用于处理自然语言的大语言模型(l ar g elanguage model,llm)得到了越来越广泛的应用,现代大语言模型主要依赖于生成式的训练方式,通过建模语料数据库的分布来进行知识的学习和逻辑的建立。在进行问答推理时,大语言模型通过在输出空间采样生成回复。然而,这种数据分布的建模难以衡量模型对既定知识的确定性,也不能泛化到时事等全新的话题领域。这导致语言模型的输出可能存在大量幻觉,即,输出内容违背事实或存在捏造、虚构的成分,极大地阻碍了问答大语言模型的实际使用。因此,如何有效抑制大语言模型的幻觉问题是现有技术体系下的一个核心问题。
2、目前解决模型幻觉问题的方法主要有以下几类:1)数据方法,通过构建大量知识性数据集和不断增加时事性数据,持续增强模型的通用知识;2)输出后处理方法,通过对模型的输出结果进行自检验或外部工具检验,判断是否输出存在幻觉;3)在问题解析之后,输出答复前,借助外部数据库或工具,
...【技术保护点】
1.一种应答数据推理方法,其特征在于,包括:
2.如权利要求1所述的方法,其特征在于,所述利用大语言模型根据链式思维推理策略对所述待处理问题进行拆解,获得至少两个推理任务,以及每个推理任务对应的第一关联知识,包括:
3.如权利要求1所述的方法,其特征在于,所述利用所述大语言模型对每个推理任务所对应的第一关联知识的置信度进行判断,根据相应的置信度判断结果确定对相应的推理任务的处理是否需要调用辅助任务处理接口,如否,基于所述大语言模型进行推理以获取相应的推理任务的推理结果,如是,调用所述辅助任务处理接口辅助所述大语言模型进行推理以获取相应的推理任务
...【技术特征摘要】
1.一种应答数据推理方法,其特征在于,包括:
2.如权利要求1所述的方法,其特征在于,所述利用大语言模型根据链式思维推理策略对所述待处理问题进行拆解,获得至少两个推理任务,以及每个推理任务对应的第一关联知识,包括:
3.如权利要求1所述的方法,其特征在于,所述利用所述大语言模型对每个推理任务所对应的第一关联知识的置信度进行判断,根据相应的置信度判断结果确定对相应的推理任务的处理是否需要调用辅助任务处理接口,如否,基于所述大语言模型进行推理以获取相应的推理任务的推理结果,如是,调用所述辅助任务处理接口辅助所述大语言模型进行推理以获取相应的推理任务的推理结果,包括:
4.如权利要求3所述的方法,其特征在于,所述关联知识置信度提示词包括:判断要求、判断规则和输出规范,其中,所述判断要求用于让所述大语言模型进行置信度判断,所述判断规则是所述大语言模型进行置信度...
【专利技术属性】
技术研发人员:韩琦,蔡宇轩,
申请(专利权)人:上海阶跃星辰智能科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。