【技术实现步骤摘要】
本说明书涉及计算机,尤其涉及一种基于公式学习的大模型微调方法、装置及存储介质。
技术介绍
1、大模型(large language model,llm)指具有大规模参数和复杂计算结构的机器学习模型,具有强大的数据生成能力,在问答任务中应用广泛。
2、目前,主要通过普通文本数据对大模型进行训练,由于公式中的变量通常具有特定的含义,大模型仅仅通过普通文本数据中变量本身的字符表示,难以确定变量的含义,以至于通用的大模型对于涉及公式计算的数学、物理等理科问题,往往很难给出准确的答案。
3、基于此,本说明书提供一种基于公式学习的大模型微调方法。
技术实现思路
1、本说明书提供一种基于公式学习的大模型微调方法、装置、存储介质及电子设备,以至少部分地解决现有技术存在的上述问题。
2、本说明书采用下述技术方案:
3、本说明书提供了一种基于公式学习的大模型微调方法,包括:
4、获取包含公式的原始文本,识别所述原始文本中的公式,以及识别所述原始文本中
...【技术保护点】
1.一种基于公式学习的大模型微调方法,其特征在于,包括:
2.如权利要求1所述的方法,其特征在于,识别所述原始文本中的公式,以及识别所述原始文本中公式的候选变量,具体包括:
3.如权利要求1所述的方法,其特征在于,根据该公式的上下文内容,确定该公式对应的目标文本,具体包括:
4.如权利要求1所述的方法,其特征在于,确定所述目标文本中的候选变量,并在该公式中确定与所述候选变量一致的匹配变量,具体包括:
5.如权利要求1所述的方法,其特征在于,在该公式中确定与所述候选变量一致的匹配变量,具体包括:
6.如权利要求
...【技术特征摘要】
1.一种基于公式学习的大模型微调方法,其特征在于,包括:
2.如权利要求1所述的方法,其特征在于,识别所述原始文本中的公式,以及识别所述原始文本中公式的候选变量,具体包括:
3.如权利要求1所述的方法,其特征在于,根据该公式的上下文内容,确定该公式对应的目标文本,具体包括:
4.如权利要求1所述的方法,其特征在于,确定所述目标文本中的候选变量,并在该公式中确定与所述候选变量一致的匹配变量,具体包括:
5.如权利要求1所述的方法,其特征在于,在该公式中确定与所述候选变量一致的匹配变量,具体包括:
...
【专利技术属性】
技术研发人员:王海平,高枫,邹常青,龙沁沁,王军,魏一雄,
申请(专利权)人:之江实验室,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。