基于大模型的医学文本摘要模型语境蒸馏方法技术

技术编号:41580903 阅读:27 留言:0更新日期:2024-06-06 23:57
一种基于大模型的医学文本摘要模型语境蒸馏方法,在离线阶段构建医学文本摘要语言模型,并采用基于大模型的医学文本摘要数据对其进行训练;在在线阶段基于训练后的医学文本摘要语言模型进行实时文本摘要提取。本发明专利技术能够显著降低人工标注医学文本摘要任务数据的成本,并能高效地迁移大模型的知识到更小规模的模型中。

【技术实现步骤摘要】

本专利技术涉及的是一种自然语言处理领域的技术,具体是一种基于大模型的医学文本摘要模型语境蒸馏方法


技术介绍

1、在医学领域,现有大模型如med-palm进行医学文本摘要的成本较高,导致难以满足实际需求。这一问题阻碍大模型在医学领域广泛应用的进程。而医学摘要数据匮乏又导致难以训练专用医学摘要消息模型。


技术实现思路

1、本专利技术针对医学领域文本摘要任务难以获取大量高质量、信息丰富的样本微调小型语言模型的问题,提出一种基于大模型的医学文本摘要模型语境蒸馏方法,能够显著降低人工标注医学文本摘要任务数据的成本,并能高效地迁移大模型的知识到更小规模的模型中。

2、本专利技术是通过以下技术方案实现的:

3、本专利技术涉及一种基于大模型的医学文本摘要模型语境蒸馏方法,在离线阶段构建医学文本摘要语言模型,并采用基于大模型的医学文本摘要数据对其进行训练;在在线阶段基于训练后的医学文本摘要语言模型进行实时文本摘要提取。

4、所述的医学文本摘要语言模型包括:教师模型指令构建单元、教师模型输出本文档来自技高网...

【技术保护点】

1.一种基于大模型的医学文本摘要模型语境蒸馏方法,其特征在于,在离线阶段构建医学文本摘要语言模型,并采用基于大模型的医学文本摘要数据对其进行训练;在在线阶段基于训练后的医学文本摘要语言模型进行实时文本摘要提取;

2.根据权利要求1所述的基于大模型的医学文本摘要模型语境蒸馏方法,其特征是,所述的基于大模型的医学文本摘要数据,通过以下方式得到:

3.根据权利要求1所述的基于大模型的医学文本摘要模型语境蒸馏方法,其特征是,所述的训练,具体包括:

4.根据权利要求1所述的基于大模型的医学文本摘要模型语境蒸馏方法,其特征是,所述的教师模型指令中,每个指令由任务描...

【技术特征摘要】

1.一种基于大模型的医学文本摘要模型语境蒸馏方法,其特征在于,在离线阶段构建医学文本摘要语言模型,并采用基于大模型的医学文本摘要数据对其进行训练;在在线阶段基于训练后的医学文本摘要语言模型进行实时文本摘要提取;

2.根据权利要求1所述的基于大模型的医学文本摘要模型语境蒸馏方法,其特征是,所述的基于大模型的医学文本摘要数据,通过以下方式得到:

3.根据权利要求1所述的基于大模型的医学文本摘要模型语境蒸馏方法,其特征是,所述的训练,具体包括:

4.根据权利要求1所述的基于大模型的医学文本摘要模...

【专利技术属性】
技术研发人员:谢佳文张晓凡
申请(专利权)人:上海交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1