信息抽取模型训练方法、装置、电子设备及存储介质制造方法及图纸

技术编号:36869601 阅读:64 留言:0更新日期:2023-03-15 19:39
本发明专利技术公开了一种信息抽取模型训练方法、装置、电子设备及存储介质。该方法包括:获取已完成预训练的信息抽取统一模型;获取训练样本数据,其中,所述训练样本数据包括药品说明文本和所述药品说明文本对应的关联症状标注数据;基于所述药品说明文本和所述药品说明文本对应的关联症状标注数据,对所述已完成预训练的信息抽取统一模型进行训练,得到目标信息抽取模型,其中,所述目标信息抽取模型抽取药品说明文本中的关联症状。上述技术方案,在预训练模型基础上进行微调训练,可减少训练样本的使用,从而减少样本标注时间,降低模型训练成本。本。本。

【技术实现步骤摘要】
信息抽取模型训练方法、装置、电子设备及存储介质


[0001]本专利技术涉及自然语言处理
,尤其涉及一种信息抽取模型训练方法、装置、电子设备及存储介质。

技术介绍

[0002]药品说明书作为选用药品的指南,包含大量的医疗实体,抽取其中的医疗实体关系可以为用药信息检索提供数据基础,对医疗行业有极大的应用价值。
[0003]在实现本专利技术的过程中,专利技术人发现现有技术中至少存在以下技术问题:现有药品说明书实体抽取方案,依赖大规模标注,存在耗时长、成本高的问题。

技术实现思路

[0004]本专利技术提供了一种信息抽取模型训练方法、装置、电子设备及存储介质,以减少对标注样本的使用,从而减少标注时间,降低模型训练成本。
[0005]根据本专利技术的一方面,提供了一种信息抽取模型训练方法,包括:
[0006]获取已完成预训练的信息抽取统一模型;
[0007]获取训练样本数据,其中,所述训练样本数据包括药品说明文本和所述药品说明文本对应的关联症状标注数据;
[0008]基于所述药品说明文本和所述本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种信息抽取模型训练方法,其特征在于,包括:获取已完成预训练的信息抽取统一模型;获取训练样本数据,其中,所述训练样本数据包括药品说明文本和所述药品说明文本对应的关联症状标注数据;基于所述药品说明文本和所述药品说明文本对应的关联症状标注数据,对所述已完成预训练的信息抽取统一模型进行训练,得到目标信息抽取模型,其中,所述目标信息抽取模型抽取药品说明文本中的关联症状。2.根据权利要求1所述的方法,其特征在于,所述训练样本数据为小于预设数量的样本数据。3.根据权利要求1所述的方法,其特征在于,所述药品说明文本对应的关联症状标注数据包括药品

适应症标注数据和/或药品

禁忌症标注数据。4.根据权利要求3所述的方法,其特征在于,所述基于所述药品说明文本和所述药品说明文本对应的关联症状标注数据,对所述已完成预训练的信息抽取统一模型进行训练,得到目标信息抽取模型,包括:在所述药品说明文本对应的关联症状标注数据为药品

适应症标注数据的情况下,基于所述药品说明文本和所述药品说明文本对应的药品

适应症标注数据,对所述已完成预训练的信息抽取统一模型进行训练,得到目标信息抽取模型;其中,所述目标信息抽取模型用于对药品说明书中的适应症进行抽取。5.根据权利要求3所述的方法,其特征在于,所述基于所述药品说明文本和所述药品说明文本对应的关联症状标注数据,对所述已完成预训练的信息抽取统一模型进行训练,得到目标信息抽取模型,包括:在所述药品说明文本对应的关联症状标注数据为药品

禁忌症标注数据的情况下,基于所述药品说明文本和所述药品说明文本对应的药品

禁忌症标注数据,对所述已完成预训练的信息抽取统一模型进行训练,得到目标信息抽取模型;其中,所述目标信息抽取模型用于对药品说明书中的禁忌症进行抽取。6.根据权利要求3所述的方法,其特征在于,所述基于所述药品说明文本和所述药品说明文本对应的关联症状标注数据,对所述已...

【专利技术属性】
技术研发人员:刘霄晨肖劲罗永贵
申请(专利权)人:联仁健康医疗大数据科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1