System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本公开涉及计算机,具体涉及利用大语言模型进行数学推理的方法、装置、电子及介质。
技术介绍
1、相关技术中,为使预先训练好的大语言模型具备问题推理的能力,是采用数据样本扩增的方式,将预先准备好的问题数据样本输入对大语言模型中,通过采用重新训练的方式,使大语言模型能够执行问题推理任务,从而得到待推理问题的推理结果。
2、但采用该种方式增强大语言模型的问题推理能力,会降低大语言模型在实践中的应用价值。
技术实现思路
1、有鉴于此,本公开提供了一种利用大语言模型进行数学推理的方法,以解决大语言模型进行问题推理的准确性的问题。
2、第一方面,本公开提供了一种利用大语言模型进行数学推理的方法,方法包括:
3、获取待处理的数学推理问题;
4、对数学推理问题进行问题推理,得到初始推理结果;
5、基于初始推理结果的评估结果,确定数学推理问题的推理结果;
6、其中,初始推理结果由大语言模型推理得到;评估结果基于预设能量函数得到,预设能量函数用于校准大语言模型的输出分布概率。
7、第二方面,本公开提供了一种问题推理装置,装置包括:
8、获取模块,用于获取待处理的数学推理问题;
9、推理模块,用于对数学推理问题进行问题推理,得到初始推理结果;
10、校正模块,用于基于初始推理结果的评估结果,确定数学推理问题的推理结果;
11、其中,初始推理结果由大语言模型推理得到;评估结果基
12、第三方面,本公开提供了一种电子设备,包括:存储器和处理器,存储器和处理器之间互相通信连接,存储器中存储有计算机指令,处理器通过执行计算机指令,从而执行上述第一方面或其对应的任一实施方式的利用大语言模型进行数学推理的方法。
13、第四方面,本公开提供了一种计算机可读存储介质,该计算机可读存储介质上存储有计算机指令,计算机指令用于使计算机执行上述第一方面或其对应的任一实施方式的利用大语言模型进行数学推理的方法。
14、本公开实施例提供的利用大语言模型进行数学推理的方法,能够在得到待处理的数学推理问题的初始推理结果后,先对该初始推理结果进行评估,以基于该初始推理结果的评估结果,确定数学推理问题的推理结果,进而在不对大语言模型进行重训练的情况下,可以达到提高推理结果的准确性的目的。
本文档来自技高网...【技术保护点】
1.一种利用大语言模型进行数学推理的方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述预设能量函数的确定方式包括:
3.根据权利要求2所述的方法,其特征在于,所述预设能量函数的确定方式,还包括:
4.根据权利要求2或3所述的方法,其特征在于,所述预设能量函数的确定方式,还包括:
5.根据权利要求4所述的方法,其特征在于,所述基于各所述第二推理结果的输出概率值,更新所述第二问题数据集,包括:
6.根据权利要求1所述的方法,其特征在于,所述基于所述初始推理结果的评估结果,确定所述数学推理问题的推理结果,包括:
7.根据权利要求6所述的方法,其特征在于,所述基于所述预设能量函数对所述中间推理路径的评估结果,调节所述初始推理结果,得到所述数学推理问题的推理结果,包括:
8.一种利用大语言模型进行数学推理的装置,其特征在于,所述装置包括:
9.一种电子设备,其特征在于,包括:
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机
...【技术特征摘要】
1.一种利用大语言模型进行数学推理的方法,其特征在于,所述方法包括:
2.根据权利要求1所述的方法,其特征在于,所述预设能量函数的确定方式包括:
3.根据权利要求2所述的方法,其特征在于,所述预设能量函数的确定方式,还包括:
4.根据权利要求2或3所述的方法,其特征在于,所述预设能量函数的确定方式,还包括:
5.根据权利要求4所述的方法,其特征在于,所述基于各所述第二推理结果的输出概率值,更新所述第二问题数据集,包括:
6.根据权利要求1所述的方法,其特征在于,所述基于所述初始推理...
【专利技术属性】
技术研发人员:许皓天,
申请(专利权)人:北京字跳网络技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。