训练大语言模型的方法、装置、电子设备制造方法及图纸

技术编号:41836329 阅读:20 留言:0更新日期:2024-06-27 18:19
本公开涉及一种训练大语言模型的方法及装置、一种医疗数据处理方法、电子设备和计算机可读存储介质。本公开通过在训练阶段,对输入至大语言模型的输入数据进行增强,从而提升大模型的训练效果。例如,所述大语言模型包括第一大语言模型和第二大语言模型。通过迭代地、交替地执行针对所述第一大语言模型的第一训练和针对所述第二大语言模型的第二训练,由此动态地更新了每次第一训练中的实际训练第一大语言模型的样本数据并更新了每次第二训练中的实际训练第二大语言模型的样本数据,显著地提升了第一大语言模型和第二大语言模型的性能,降低了不准确的输入数据对推理结果的干扰。

【技术实现步骤摘要】

本公开涉及人工智能领域,更具体地涉及一种训练大语言模型的方法及装置、一种医疗数据处理方法、电子设备和计算机可读存储介质。


技术介绍

1、医疗资源匮乏是一个全球性的公共卫生挑战。目前,专业医疗人力资源仍处于严重短缺的状态,同时医疗设施和基础设施分布不均,并且医疗费用高昂。

2、随着人口老龄化和慢性病患病率上升,对医疗资源的需求与日俱增。医生和护理人员的工作负荷日益加重,面临着巨大的工作压力。如何有效分配有限的医疗资源,满足不断增长的医疗需求,成为当务之急。

3、医疗信息化被视为解决这一难题的关键途径之一。在此背景下,人工智能在医疗领域的应用备受关注。其中,大模型技术有望协助医生开展基础工作,提高工作效率。通过对海量医疗数据进行训练和调整,大模型可用于辅助病历书写、影像分析、辅助诊断等,减轻医生的工作负担。利用ai赋能医疗服务有望提高资源的利用效率,扩大服务覆盖面。

4、然而,目前的医疗ai仍存在推理的准确性和可靠性都较低的技术问题,需要进一步改进。


技术实现思路>

1、本公开实本文档来自技高网...

【技术保护点】

1.一种训练大语言模型的方法,所述大语言模型包括第一大语言模型和第二大语言模型,所述方法包括:

2.如权利要求1所述的方法,其中,

3.如权利要求1所述的方法,其中,

4.如权利要求1所述的方法,其中,

5.如权利要求1所述的方法,其中,

6. 如权利要求1所述的方法,其中,所述基于所述第一度量数据、所述第二度量数据、所述原始训练样本、和所述调整后的训练样本,对所述第二大语言模型进行第二训练包括:

7. 一种医疗数据处理方法,包括:

8. 一种训练大语言模型的装置,所述大语言模型包括第一大语言模型和第二大...

【技术特征摘要】

1.一种训练大语言模型的方法,所述大语言模型包括第一大语言模型和第二大语言模型,所述方法包括:

2.如权利要求1所述的方法,其中,

3.如权利要求1所述的方法,其中,

4.如权利要求1所述的方法,其中,

5.如权利要求1所述的方法,其中,

6. 如权利要求1所述的方法,其中,所述基于所述第一度量数据、所述第二度量数据、所述原始训练样...

【专利技术属性】
技术研发人员:刘晓华张程剀刘泽恩左赛陈小梅
申请(专利权)人:北京壹永科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1