大模型训练方法、系统、终端及存储介质技术方案

技术编号：40540542 阅读：4 留言：0更新日期：2024-03-05 18:56

本发明专利技术提供了一种大模型训练方法、系统、终端及存储介质，该方法包括：获取任务描述和上下文示例，并根据上下文示例确定医嘱样本；将各医嘱样本输入医嘱分类大模型，并根据医嘱分类大模型分别提取各医嘱样本的关键字样本和短语样本；控制医嘱分类大模型根据各医嘱样本、关键字样本和短语样本确定分类推理过程；控制医嘱分类大模型根据各医嘱样本、关键字样本和分类推理过程确定目标医嘱类别，并根据目标医嘱类别和各医嘱样本的样本标签确定模型损失；根据模型损失对医嘱分类大模型进行参数更新，直至医嘱分类大模型收敛。本发明专利技术基于分类推理过程使得训练后的医嘱分类大模型能有效理解医嘱样本表达的含义，提高了训练后医嘱分类大模型的性能。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及智慧医疗，尤其涉及一种大模型训练方法、系统、终端及存储介质。

技术介绍

1、医嘱是医生根据病人的病情以及治疗需要，在病人的用药、化验、饮食等方面做出的指示，即医生在医疗活动中下达的医学指令。通常情况下，每项医嘱仅包括一个内容，即每项医嘱仅对应于一种执行方式下的一种具体实施方式，并且其中注明了此项医嘱的下达时间以及执行时间。

2、现有的医疗数据管理过程中，一般基于人工标注数据对医嘱分类大模型进行训练，使用训练后的医嘱分类大模型进行医嘱分类，基于人工标注的方式进行医嘱分类大模型训练时，医嘱分类大模型不能有效理解医嘱样本表达的含义，使得训练后的医嘱分类大模型性能较差，降低了医嘱分类的准确性。

技术实现思路

1、本专利技术实施例的目的在于提供一种大模型训练方法、系统、终端及存储介质，旨在解决现有的医嘱分类大模型性能较差的问题。

2、本专利技术实施例是这样实现的，一种大模型训练方法，所述方法包括：

3、获取任务描述和上下文示例，并根据所述上下文示例确定医嘱样本；

4、将各医嘱样本输入医嘱分类大模型，并根据所述医嘱分类大模型分别提取各医嘱样本的关键字样本和短语样本；

5、控制所述医嘱分类大模型根据各医嘱样本、所述关键字样本和所述短语样本确定分类推理过程；

6、控制所述医嘱分类大模型根据各医嘱样本、所述关键字样本和所述分类推理过程确定目标医嘱类别，并根据所述目标医嘱类别和各医嘱样本的样本标签确定模型损失；>

7、根据所述模型损失对所述医嘱分类大模型进行参数更新，直至所述医嘱分类大模型收敛。

8、优选的，控制所述医嘱分类大模型根据各医嘱样本、所述关键字样本和所述短语样本确定分类推理过程，包括：

9、根据所述医嘱分类大模型分别获取各医嘱样本、所述关键字样本和所述短语样本的语义，得到医嘱语义、关键字语义和短语语义；

10、根据所述医嘱语义、所述关键字语义和所述短语语义确定推理决策，并根据所述推理决策、所述医嘱语义、所述关键字语义和所述短语语义确定所述分类推理过程。

11、优选的，根据所述医嘱语义、所述关键字语义和所述短语语义确定推理决策，包括：

12、将所述医嘱语义、所述关键字语义和所述短语语义的语义编码进行组合，得到语义编码组；

13、根据所述语义编码组确定语义编码向量，并根据所述语义编码向量确定候选决策；

14、若所述候选决策的数量小于数量阈值，则将所述候选决策确定为所述推理决策；

15、若所述候选决策的数量大于或等于数量阈值，则分别查询各候选决策的决策语义场景，并获取当前所述医嘱语义的医嘱语义场景；

16、分别计算所述医嘱语义场景与各决策语义场景之间的场景相似度，并将最大所述场景相似度对应的所述候选决策确定为所述推理决策。

17、优选的，根据所述上下文示例确定医嘱样本，包括：

18、对医嘱库中的医嘱进行编码，得到医嘱编码集合，并分别计算所述上下文示例与所述医嘱编码集合中的各医嘱的欧式距离；

19、根据所述欧式距离对所述医嘱编码集合中的各医嘱进行升序排列，得到医嘱排列表，并将所述医嘱排列中前预设位数的医嘱确定为所述医嘱样本。

20、优选的，根据所述欧式距离对所述医嘱编码集合中的各医嘱进行升序排列，得到医嘱排列表之后，还包括：

21、分别提取所述医嘱排列中前预设位数的医嘱，并分别获取提取到的各医嘱的文本特征；

22、分别获取各文本特征的协方差矩阵，并根据所述协方差矩阵对提取到的各医嘱进行筛选，并将筛选后的各医嘱确定为所述医嘱样本。

23、优选的，根据所述协方差矩阵对提取到的各医嘱进行筛选，包括：

24、根据所述协方差矩阵确定各文本特征在不同特征维度上的离散程度；

25、针对各文本特征，将最大离散程度对应的特征维度确定为目标维度；

26、根据各文本特征的目标维度对提取到的各医嘱进行筛选。

27、本专利技术实施例的另一目的在于提供一种大模型训练系统，所述系统包括：

28、医嘱确定模块，用于获取任务描述和上下文示例，并根据所述上下文示例确定医嘱样本；

29、关键字提取模块，用于将各医嘱样本输入医嘱分类大模型，并根据所述医嘱分类大模型分别提取各医嘱样本的关键字样本和短语样本；

30、分类推理模块，用于控制所述医嘱分类大模型根据各医嘱样本、所述关键字样本和所述短语样本确定分类推理过程；

31、损失确定模块，用于控制所述医嘱分类大模型根据各医嘱样本、所述关键字样本和所述分类推理过程确定目标医嘱类别，并根据所述目标医嘱类别和各医嘱样本的样本标签确定模型损失；

32、模型训练模块，用于根据所述模型损失对所述医嘱分类大模型进行参数更新，直至所述医嘱分类大模型收敛。

33、优选的，所述分类推理模块还用于：

34、根据所述医嘱分类大模型分别获取各医嘱样本、所述关键字样本和所述短语样本的语义，得到医嘱语义、关键字语义和短语语义；

35、根据所述医嘱语义、所述关键字语义和所述短语语义确定推理决策，并根据所述推理决策、所述医嘱语义、所述关键字语义和所述短语语义确定所述分类推理过程。

36、本专利技术实施例的另一目的在于提供一种终端设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，所述处理器执行所述计算机程序时实现如上述方法的步骤。

37、本专利技术实施例的另一目的在于提供一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，所述计算机程序被处理器执行时实现上述方法的步骤。

38、本专利技术实施例，通过获取任务描述和上下文示例，基于上下文示例能有效地确定医嘱样本，通过提取各医嘱样本的关键字样本和短语样本，能有效地确定分类推理过程，基于分类推理过程使得训练后的医嘱分类大模型能有效理解医嘱样本表达的含义，从而提高了医嘱分类大模型在文本理解任务的能力，提高了训练后医嘱分类大模型的性能。

本文档来自技高网...

【技术保护点】

1.一种大模型训练方法，其特征在于，所述方法包括：

2.如权利要求1所述的大模型训练方法，其特征在于，控制所述医嘱分类大模型根据各医嘱样本、所述关键字样本和所述短语样本确定分类推理过程，包括：

3.如权利要求2所述的大模型训练方法，其特征在于，根据所述医嘱语义、所述关键字语义和所述短语语义确定推理决策，包括：

4.如权利要求1所述的大模型训练方法，其特征在于，根据所述上下文示例确定医嘱样本，包括：

5.如权利要求4所述的大模型训练方法，其特征在于，根据所述欧式距离对所述医嘱编码集合中的各医嘱进行升序排列，得到医嘱排列表之后，还包括：

6.如权利要求5所述的大模型训练方法，其特征在于，根据所述协方差矩阵对提取到的各医嘱进行筛选，包括：

7.一种大模型训练系统，其特征在于，所述系统包括：

8.如权利要求7所述的大模型训练系统，其特征在于，所述分类推理模块还用于：

9.一种终端设备，包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序，其特征在于，所述处理器执行所述计算

10.一种计算机可读存储介质，所述计算机可读存储介质存储有计算机程序，其特征在于，所述计算机程序被处理器执行时实现如权利要求1至6任一项所述方法的步骤。

...

【技术特征摘要】

1.一种大模型训练方法，其特征在于，所述方法包括：

3.如权利要求2所述的大模型训练方法，其特征在于，根据所述医嘱语义、所述关键字语义和所述短语语义确定推理决策，包括：

4.如权利要求1所述的大模型训练方法，其特征在于，根据所述上下文示例确定医嘱样本，包括：

5.如权利要求4所述的大模型训练方法，其特征在于，根据所述欧式距离对所述医嘱编码集合中的各医嘱进行升序排列，得到医嘱排列表之后，还包括：

6.如...

【专利技术属性】
技术研发人员：喇全亮，史亚飞，谢冠超，朱洪泽，
申请(专利权)人：云知声信阳数字科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人