System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及人工智能,特别是涉及一种大模型训练方法及相关方法、装置、设备和介质。
技术介绍
1、近年来,生成式超大规模语言模型在众多领域取得了引人注目的进展。其出色的语言理解、语言生成和逻辑推理能力,如在医疗领域的应用得到广泛关注。
2、由于大语言模型通常具有数以亿计,乃至千亿、万亿级的网络参数,在为大语言模型带来出色能力的同时,也为其在特定领域的迁移学习带来困难。有鉴于此,如何尽可能地降低训练医疗大模型的计算量,以提升医疗大模型的训练效率,成为亟待解决的问题。
技术实现思路
1、本申请提供一种大模型训练方法及相关方法、装置、设备和介质。
2、本申请第一方面提供了一种大模型训练方法,包括:获取第一样本医疗问题;基于医疗大模型对第一样本医疗问题进行分析,得到第一样本医疗问题的多个第一样本医疗回答;基于医疗回答检测模型分别对各个第一样本医疗回答进行检测,得到表征第一样本医疗回答优劣程度的第一检测分值;基于由第一检测分值所确定的学习率,调整医疗大模型的网络参数。
3、因此,获取第一样本医疗问题,从而基于医疗大模型对第一根本医疗问题进行分析,得到第一样本医疗问题的多个第一样本医疗回答,并基于医疗回答检测模型分别对各个第一样本医疗回答进行检测,得到表征第一样本医疗回答优劣程度的第一检测分值,进而基于由第一检测分值所确定的学习率,调整医疗大模型的网络参数,一方面由于在医疗大模型训练过程中仅需保留医疗大模型和医疗回答检测模型,相较于诸如强化学习等传统大模型训练方
4、其中,基于由第一检测分值所确定的学习率,调整医疗大模型的网络参数,包括:基于各个第一样本医疗回答的第一检测分值进行归一化,得到对应第一样本医疗回答的归一化分值;基于各个第一样本医疗回答的归一化分值,从多个第一样本医疗回答中筛选出第一样本医疗问题的样本优秀医疗回答;基于由样本优秀医疗回答的归一化分值所确定的学习率,调整医疗大模型的网络参数。
5、因此,在对医疗大模型进行调参时,先基于各个第一样本医疗回答的第一检测分值进行归一化,得到对应第一样本医疗回答的归一化分值,再基于各个第一样本医疗回答的归一化分值,从多个第一样本医疗回答中筛选出第一样本医疗问题的样本优秀回答,从而基于由样本优秀医疗回答的归一化分值所确定的学习率,调整医疗大模型的网络参数,进而能够在通过归一化分值准确度量多个第一样本医疗回答中的样本优秀医疗回答之后,使医疗大模型根据归一化分值所确定的学习率,向样本优秀医疗回答进行生成式学习,有助于提升医疗大模型的回答准确性。
6、其中,基于由样本优秀医疗回答的归一化分值所确定的学习率,调整医疗大模型的网络参数,包括:选择样本优秀医疗回答的归一化分值作为权重;基于权重获取医疗大模型对样本优秀医疗回答进行生成式学习的学习率;基于学习率,调整医疗大模型的网络参数。
7、因此,先选择样本优秀医疗回答的归一化分值作为权重,再基于权重获取医疗大模型对样本优秀医疗回答进行生成式学习的学习率,以基于学习率,调整医疗大模型的网络参数,故能够在医疗大模型的训练过程中,根据优劣程度来不同程度地对样本优秀医疗回答进行生成式学习,有助于提升医疗大模型的回答准确性。
8、其中,在基于医疗回答检测模型分别对各个第一样本医疗回答进行检测,得到表征第一样本医疗回答优劣程序的第一检测分值之前,方法还包括:获取第二样本医疗问题和第二样本医疗问题的多个第二样本医疗回答;其中,第二样本医疗问题标注有多个第二样本医疗回答关于优劣程度的样本排序信息;将第二样本医疗回答和回答检测提示输入至医疗回答检测模型,得到表征第二样本医疗回答优劣程度的第二检测分值;其中,回答检测提示用于指示医疗回答检测模型检测第二样本医疗回答的优劣程度;基于样本排序信息和第二检测分值,调整医疗回答检测模型的网络参数。
9、因此,在利用医疗回答检测模型进行检测之前,先获取第二样本医疗问题和第二样本医疗问题的多个第二样本医疗回答,且第二样本医疗问题标注有多个第二样本医疗回答关于优劣程度的样本排序信息,再将第二样本医疗回答和回答检测提示输入至医疗回答检测模型,得到表征第二样本医疗回答优劣程度的第二检测分值,且回答检测提示用于指示医疗大模型检测第二样本医疗回答的优劣程度,从而基于样本排序信息和第二检测分值,调整医疗回答检测模型的网络参数,进而能够通过模型反思的自然语言形式,利用模型自身知识进行回答评价,有助于提升准确性。
10、其中,将第二样本医疗回答和回答检测提示输入至医疗回答检测模型,得到表征第二样本医疗回答优劣程度的第二检测分值,包括:将第二样本医疗回答和回答检测提示输入至医疗回答检测模型,得到医疗回答检测模型输出的第一概率和第二概率;其中,第一概率表征第二样本医疗回答检测为优秀的可能性,第二概率表征第二样本医疗回答检测为拙劣的可能性;基于第一概率和第二概率,得到第二样本医疗回答的第二检测分值。
11、因此,将第二样本医疗回答和回答检测提示输入至医疗回答检测模型,得到医疗回答检测模型输出的第一概率和第二概率,且第一概率表征第二样本医疗回答检测为优秀的可能性,第二概率表征第二样本医疗回答检测为拙劣的可能性,再基于第一概率和第二概率,得到第二样本医疗回答的第二检测分值,故能够基于医疗回答检测模型对第二样本医疗回答评价为不同结果的概率度量得到表征其优劣程度的检测分值,有助于提升回答检测的准确性。
12、其中,基于样本排序信息和第二检测分值,调整医疗回答检测模型的网络参数,包括:基于样本排序信息,将多个第二样本医疗回答划分至正例回答集合和负例回答集合;基于正例回答集合中第二样本医疗回答的第二检测分值,得到第一子损失,并基于负例回答集合中第二样本医疗回答的第二检测分值,得到第二子损失;基于第一子损失和第二子损失,调整医疗回答检测模型的网络参数;其中,第一子损失负相关于正例回答集合中第二样本医疗回答的第二检测分值,第二子损失正相关于负例回答集合中第二样本医疗回答的第二检测分值。
13、因此,基于样本排序信息,将多个第二样本医疗回答划分至正例回答集合和负例回答集合,再基于正例回答集合中第二样本医疗回答的第二检测分值,得到第一子损失,并基于负例回答集合中第二样本医疗回答的第二检测分值,得到第二子损失,从而基于第一子损失和第二子损失,调整医疗回答检测模型的网络损失,且第一子损失负相关于正例回答集合中第二样本医疗回答的第二检测分值,第二子损失正相关于负例回答集合中第二样本医疗回答的第二检测分值,进而能够通过约束第一子损失本文档来自技高网...
【技术保护点】
1.一种大模型训练方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述基于由所述第一检测分值所确定的学习率,调整所述医疗大模型的网络参数,包括:
3.根据权利要求2所述的方法,其特征在于,所述基于由所述样本优秀医疗回答的归一化分值所确定的学习率,调整所述医疗大模型的网络参数,包括:
4.根据权利要求1至3任一项所述的方法,其特征在于,在所述基于医疗回答检测模型分别对各个所述第一样本医疗回答进行检测,得到表征所述第一样本医疗回答优劣程序的第一检测分值之前,所述方法还包括:
5.根据权利要求4所述的方法,其特征在于,所述将所述第二样本医疗回答和回答检测提示输入至所述医疗回答检测模型,得到表征所述第二样本医疗回答优劣程度的第二检测分值,包括:
6.根据权利要求4所述的方法,其特征在于,所述基于所述样本排序信息和所述第二检测分值,调整所述医疗回答检测模型的网络参数,包括:
7.根据权利要求6所述的方法,其特征在于,在所述基于所述第一子损失和第二子损失,调整所述医疗回答检测模型的网络参数之前,所述方
8.根据权利要求4所述的方法,其特征在于,所述获取第二样本医疗问题和所述第二样本医疗问题的多个第二样本医疗回答,包括:
9.根据权利要求8所述的方法,其特征在于,所述基于所述校验结果,确定是否提示修改所述标注排序信息,至少包括:
10.一种医疗问题回答方法,其特征在于,包括:
11.一种大模型训练装置,其特征在于,包括:
12.一种医疗问题回答装置,其特征在于,包括:
13.一种电子设备,其特征在于,包括相互耦接的存储器和处理器,所述处理器用于执行所述存储器中存储的程序指令,以实现权利要求1至9任一项所述的大模型训练方法,或权利要求10所述的医疗问题回答方法。
14.一种计算机可读存储介质,其上存储有程序指令,其特征在于,所述程序指令被处理器执行时实现权利要求1至9任一项所述的大模型训练方法,或权利要求10所述的医疗问题回答方法。
...【技术特征摘要】
1.一种大模型训练方法,其特征在于,包括:
2.根据权利要求1所述的方法,其特征在于,所述基于由所述第一检测分值所确定的学习率,调整所述医疗大模型的网络参数,包括:
3.根据权利要求2所述的方法,其特征在于,所述基于由所述样本优秀医疗回答的归一化分值所确定的学习率,调整所述医疗大模型的网络参数,包括:
4.根据权利要求1至3任一项所述的方法,其特征在于,在所述基于医疗回答检测模型分别对各个所述第一样本医疗回答进行检测,得到表征所述第一样本医疗回答优劣程序的第一检测分值之前,所述方法还包括:
5.根据权利要求4所述的方法,其特征在于,所述将所述第二样本医疗回答和回答检测提示输入至所述医疗回答检测模型,得到表征所述第二样本医疗回答优劣程度的第二检测分值,包括:
6.根据权利要求4所述的方法,其特征在于,所述基于所述样本排序信息和所述第二检测分值,调整所述医疗回答检测模型的网络参数,包括:
7.根据权利要求6所述的方法,其特征在于,在所述...
【专利技术属性】
技术研发人员:张少霆,
申请(专利权)人:上海商汤善萃医疗科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。