医疗实体识别模型的训练方法、医疗实体识别方法及装置制造方法及图纸

技术编号:36193121 阅读:13 留言:0更新日期:2022-12-31 21:13
本申请公开了一种医疗实体识别模型的训练方法,医疗实体识别方法及相关产品。医疗实体识别模型的训练方法中,包括:获取待训练数据;获取目标实体属性信息,所述目标实体属性信息用于指示实体的属性;根据目标实体属性信息,利用所述训练数据训练实体识别模型,所述实体识别模型用于对属性与所述目标实体类型信息所指示的属性相匹配的实体的进行识别。本申请在模型训练阶段,通过引入目标实体属性信息,可以复用在不同任务中,有效利用不同任务下的各种标注数据,提升数据使用效率,并且提高模型在不同任务中识别新类型实体的能力。高模型在不同任务中识别新类型实体的能力。高模型在不同任务中识别新类型实体的能力。

【技术实现步骤摘要】
医疗实体识别模型的训练方法、医疗实体识别方法及装置


[0001]本申请涉及信息处理
,特别是涉及一种医疗实体识别模型的训练方法、医疗实体识别方法及装置。

技术介绍

[0002]随着医疗领域检测技术和疾病诊断方式的发展,日益增长的医疗数据规模使得对于医疗数据的分析处理技术需求愈加迫切。因此,医疗实体识别技术得到了越来越多的关注。医疗实体识别技术是指从医疗数据中提取医疗实体的技术。其中,医疗数据包括电子病历、医学文献、客户咨询等医疗过程中产生的非结构数据,医疗实体是指对于病情诊断有较大价值的相关信息,例如可以包括疾病名称、手术名称、药品名称和检验检查名称等。
[0003]医疗实体识别技术依赖医疗实体识别模型实现。目前,医疗实体识别模型需要通过特定的训练数据进行训练得到。特定的训练数据是指由医疗领域的技术人员进行了标注的医疗数据。
[0004]但是,对于不同的应用任务,需要识别的医疗实体可能并不相同。为此,就需要针对不同的应用任务训练不同的医疗实体识别模型。显然,训练大量的医疗实体识别模型存在效率低、成本高和数据利用率低等问题。

技术实现思路

[0005]基于上述问题,本申请提供了一种医疗实体识别模型的训练方法、医疗实体识别方法及装置,可以有效利用不同任务下的各种标注数据。
[0006]第一方面,本申请公开了一种医疗实体识别模型的训练方法,其特征在于,所述方法包括:
[0007]获取待训练数据;
[0008]获取目标实体属性信息,所述目标实体属性信息用于指示实体的属性;
[0009]根据目标实体属性信息,利用所述训练数据训练实体识别模型,所述实体识别模型用于对属性与所述目标实体类型信息所指示的属性相匹配的实体的进行识别。
[0010]可选地,所述目标实体属性信息,包括以下任意一项或多项:
[0011]实体类型、实体类型的定义和实体类型的样例。
[0012]可选地,所述根据目标实体属性信息,利用所述训练数据训练实体识别模型,包括:
[0013]根据目标实体属性信息对所述待训练数据进行数据格式转换,得到数据格式转换后的待训练数据;所述数据格式转换后的待训练数据为多条具有不同目标实体属性信息标注的待训练数据;
[0014]利用所述格式转换后的待训练数据训练实体识别模型。
[0015]可选地,所述利用所述格式转换后的待训练数据训练实体识别模型,包括:
[0016]利用所述格式转换后的待训练数据,对于待训练数据中不存在的目标实体属性信
息对应实体,训练医疗实体识别模型生成基于目标实体属性信息识别的负样本。
[0017]第二方面,本申请公开了一种医疗实体识别方法,所述方法包括:
[0018]获取待处理的文本数据;
[0019]获取目标实体属性信息,所述目标实体属性信息用于指示实体的属性;
[0020]根据实体识别模型,基于所述目标实体属性信息,对所述待处理的文本数据进行识别,得到实体识别结果,所述实体识别结果对应的实体的属性与所述目标实体属性信息所指示的属性相匹配。
[0021]第三方面,本申请公开了一种医疗实体识别模型的训练装置,包括:
[0022]第一获取模块,获取待训练数据;
[0023]第二获取模块,获取目标实体属性信息,所述目标实体属性信息用于指示实体的属性;
[0024]训练模块,根据目标实体属性信息,利用所述训练数据训练实体识别模型,所述实体识别模型用于对属性与所述目标实体类型信息所指示的属性相匹配的实体的进行识别。
[0025]可选地,所述装置包括:
[0026]转换单元,根据目标实体属性信息对所述待训练数据进行数据格式转换,得到数据格式转换后的待训练数据;所述数据格式转换后的待训练数据为多条具有不同目标实体属性信息标注的待训练数据;
[0027]第一训练单元,利用所述格式转换后的待训练数据训练实体识别模型。
[0028]第四方面,本申请公开了一种医疗实体识别装置,包括:
[0029]第三获取模块,获取待处理的文本数据;
[0030]第四获取模块,获取目标实体属性信息,所述目标实体属性信息用于指示实体的属性;
[0031]识别模块,根据实体识别模型,基于所述目标实体属性信息,对所述待处理的文本数据进行识别,得到实体识别结果,所述实体识别结果对应的实体的属性与所述目标实体属性信息所指示的属性相匹配。
[0032]第五方面,本申请公开了一种电子设备,其特征在于,包括:处理器、存储器、系统总线;
[0033]所述处理器以及所述存储器通过所述系统总线相连;
[0034]所述存储器用于存储一个或多个程序,所述一个或多个程序包括指令,所述指令当被所述处理器执行时使所述处理器执行上述医疗实体识别模型的训练方法的任一实现方式,或者,所述处理器执行上述医疗实体识别方法任一实现方式。
[0035]第六方面,本申请公开了一种计算机可读存储介质,其特征在于,所述计算机可读存储介质中存储有指令,当所述指令在终端设备上运行时,使得所述终端设备执行上述医疗实体识别模型的训练方法的任一实现方式,或者,使得所述终端设备执行上述医疗实体识别方法的任一实现方式。
[0036]相较于现有技术,本申请具有以下有益效果:
[0037]本申请公开了一种医疗实体识别模型的训练方法。所述训练方法包括:获取待训练数据;获取目标实体属性信息,所述目标实体属性信息用于指示实体的属性;根据目标实体属性信息,利用所述训练数据训练实体识别模型,所述实体识别模型用于对属性与所述
目标实体类型信息所指示的属性相匹配的实体的进行识别。本申请在模型训练阶段,通过引入目标实体属性信息,并且在不同任务中复用待训练数据,使得同一套训练数据可以被不同的任务使用,提升数据使用效率,并且提高模型在不同任务中识别新类型实体的能力。
附图说明
[0038]为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0039]图1为本申请现有技术中模型训练的示意图;
[0040]图2为本申请实施例提供的一种医疗实体识别模型的训练方法的流程图;
[0041]图3为本申请实施例模型训练的一种示意图;
[0042]图4为本申请实施例步骤103一种可选的实现方式流程图;
[0043]图5为本申请实施例提供的一种医疗实体识别方法的流程图;
[0044]图6是本申请实施例提供的一种医疗实体识别模型的训练装置结构示意图;
[0045]图7是本申请实施例提供的一种医疗实体识别装置结构示意图。
具体实施方式
[0046]为了使本
的人员更好地理解本申请方案,下本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种医疗实体识别模型的训练方法,其特征在于,所述方法包括:获取待训练数据;获取目标实体属性信息,所述目标实体属性信息用于指示实体的属性;根据目标实体属性信息,利用所述训练数据训练实体识别模型,所述实体识别模型用于对属性与所述目标实体类型信息所指示的属性相匹配的实体的进行识别。2.根据权利要求1所述的方法,其特征在于,所述目标实体属性信息,包括以下任意一项或多项:实体类型、实体类型的定义和实体类型的样例。3.根据权利要求1所述的方法,其特征在于,所述根据目标实体属性信息,利用所述训练数据训练实体识别模型,包括:根据目标实体属性信息对所述待训练数据进行数据格式转换,得到数据格式转换后的待训练数据;所述数据格式转换后的待训练数据为多条具有不同目标实体属性信息标注的待训练数据;利用所述格式转换后的待训练数据训练实体识别模型。4.根据权利要求3所述的方法,其特征在于,所述利用所述格式转换后的待训练数据训练实体识别模型,包括:利用所述格式转换后的待训练数据,对于待训练数据中不存在的目标实体属性信息对应实体,训练医疗实体识别模型生成基于目标实体属性信息识别的负样本。5.一种医疗实体识别方法,其特征在于,所述方法包括:获取待处理的文本数据;获取目标实体属性信息,所述目标实体属性信息用于指示实体的属性;根据实体识别模型,基于所述目标实体属性信息,对所述待处理的文本数据进行识别,得到实体识别结果,所述实体识别结果对应的实体的属性与所述目标实体属性信息所指示的属性相匹配。6.一种医疗实体识别模型的训练装置,其特征在于,包括:第三获取模块,获取待训练数据;第四获取模块,获取目标实体属性信息,所述目标实体属性信息用于指示实体的属...

【专利技术属性】
技术研发人员:袁晟君吴汇哲
申请(专利权)人:太保科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1