电子病历词性标注方法、模型训练方法及相关装置制造方法及图纸

技术编号:22565181 阅读:16 留言:0更新日期:2019-11-16 12:03
本申请提出一种电子病历词性标注方法、模型训练方法及相关装置,涉及自然语言处理技术领域,利用循环神经网络初步学习训练分词序列的语义信息得到循环网络输出序列后,利用语义连接网络对循环网络输出序列进行处理,以通过对训练分词序列进行多次学习处理的方式,学习训练分词序列的深层语义信息;进而将语义标注序列作为词性标注模型中词性预测网络的输入,从而得到训练词性序列对应的预测词性标注结果,进而基于该预测词性标注结果及训练分词序列对应的训练词性标注结果计算得到的损失函数,更新词性标注模型的模型参数,相比于现有技术,使词性标注模型能够充分学习到样本序列的深层语义信息及长距离特征信息,能够提升词性标注的准确度。

Part of speech tagging method, model training method and related devices of EMR

This application proposes a part of speech tagging method, model training method and related devices for electronic medical records, which relates to the field of natural language processing technology. After learning and training the semantic information of the segmentation sequence by using the cyclic neural network to get the output sequence of the cyclic network, the output sequence of the cyclic network is processed by using the semantic connection network, so as to learn the training segmentation sequence multiple times The method of processing is to learn the deep semantic information of the training segmentation sequence, and then take the semantic annotation sequence as the input of the part of speech prediction network in the part of speech tagging model, so as to obtain the predicted part of speech tagging results corresponding to the training part of speech sequence, and then update the words based on the loss function calculated from the predicted part of speech tagging results and the training part of speech tagging results corresponding to the training segmentation sequence Compared with the existing technology, the part of speech tagging model can fully learn the deep semantic information and long-distance feature information of the sample sequence, and can improve the accuracy of part of speech tagging.

【技术实现步骤摘要】
电子病历词性标注方法、模型训练方法及相关装置
本申请涉及自然语言处理
,具体而言,涉及一种电子病历词性标注方法、模型训练方法及相关装置。
技术介绍
序列标注任务是机器学习常见的一类任务,比如分词任务、实体识别任务、时间序列分析、词性标注任务等等。常见的一些解决序列标注任务的算法包括隐马尔可夫模型(HiddenMarkovModel,HMM)、条件随机场(conditionalrandomfield,CRF)等等。随着电子化医疗系统的迅速普及,大量医疗相关的信息以电子病历(ElectronicMedicalRecords,EMR)的形式被保存下来;利用机器学习技术,通过对电子病历进行分析和挖掘,比如对电子病历进行分词、词性标注、命名实体识别、实体关系抽取等等,可以从电子病历中获取大量的医疗知识,并被用于例如医学词典中,以辅助医生进行诊断等。但目前对于词性标注的方法中,由于需要手工的寻找特征,并添加部分外部特征,导致词性标注的准确度较低。
技术实现思路
本申请的目的在于提供一种电子病历词性标注方法、模型训练方法及相关装置,能够提升词性标注的准确度。为了实现上述目的,本申请实施例采用的技术方案如下:第一方面,本申请实施例提供一种词性标注模型训练方法,所述方法包括:获得训练分词序列及所述训练分词序列对应的训练词性标注结果;利用循环神经网络对所述训练分词序列进行处理,得到循环网络输出序列;利用语义连接网络对所述循环网络输出序列进行处理,得到语义标注序列,其中,所述语义标注序列表征对所述训练分词序列进行多次学习处理后得到的语义结果;将所述语义标注序列作为所述词性标注模型中词性预测网络的输入,得到所述训练分词序列对应的预测词性标注结果;基于所述预测词性标注结果及所述训练词性标注结果计算得到的损失函数,更新所述词性标注模型的模型参数。第二方面,本申请实施例提供一种电子病历词性标注方法,所述方法包括:接收待标注电子病历;利用循环神经网络对所述待标注电子病历进行处理,得到所述待标注电子病历对应的循环网络输出序列;利用语义连接网络对所述循环网络输出序列进行处理,得到语义标注序列,其中,所述语义标注序列表征对所述待标注电子病历进行多次学习处理后得到的语义结果;将所述语义标注序列作为词性预测网络的输入,得到所述待标注电子病历对应的预测词性标注结果;其中,所述词性预测网络被训练为根据所述语义标注序列输出多个预测词性标注序列以及每一所述预测词性标注序列各自对应的词性标注序列得分;所述待标注电子病历对应的预测词性标注结果为所述多个预测词性标注序列中,对应的词性标注序列得分最大的预测词性标注序列。第三方面,本申请实施例提供一种词性标注模型训练装置,所述装置包括:第一预处理模块,用于获得训练分词序列及所述训练分词序列对应的训练词性标注结果;所述第一预处理模块还用于,利用循环神经网络对所述训练分词序列进行处理,得到循环网络输出序列;所述第一预处理模块还用于,利用语义连接网络对所述循环网络输出序列进行处理,得到语义标注序列,其中,所述语义标注序列表征对所述训练分词序列进行多次学习处理后得到的语义结果;所述第一预处理模块还用于,将所述语义标注序列作为所述词性标注模型中词性预测网络的输入,得到所述训练分词序列对应的预测词性标注结果;参数更新模块,用于基于所述预测词性标注结果及所述训练词性标注结果计算得到的损失函数,更新所述词性标注模型的模型参数。第四方面,本申请实施例提供一种电子病历词性标注装置,所述装置包括:接收模块,用于接收待标注电子病历;第二预处理模块,用于利用循环神经网络对所述待标注电子病历进行处理,得到所述待标注电子病历对应的循环网络输出序列;所述第二预处理模块还用于,利用语义连接网络对所述循环网络输出序列进行处理,得到语义标注序列,其中,所述语义标注序列表征对所述待标注电子病历进行多次学习处理后得到的语义结果;标注预测模块,用于将所述语义标注序列作为词性预测网络的输入,得到所述待标注电子病历对应的预测词性标注结果;其中,所述词性预测网络被训练为根据所述语义标注序列输出多个预测词性标注序列以及每一所述预测词性标注序列各自对应的词性标注序列得分;所述待标注电子病历对应的预测词性标注结果为所述多个预测词性标注序列中,词性标注序列得分最大的预测词性标注序列。第五方面,本申请实施例提供一种电子设备,所述电子设备包括存储器,用于存储一个或多个程序;处理器。当所述一个或多个程序被所述处理器执行时,实现上述的词性标注模型训练方法或电子病历词性标注方法。第六方面,本申请实施例提供一种计算机可读存储介质,其上存储有计算机程序,该计算机程序被处理器执行时实现上述的词性标注模型训练方法或电子病历词性标注方法。本申请实施例提供的一种电子病历词性标注方法、模型训练方法及相关装置,利用循环神经网络对训练分词序列进行处理得到循环网络输出序列,初步学习训练分词序列的语义信息,并利用语义连接网络对循环网络输出序列进行处理,以通过对训练分词序列进行多次学习处理的方式,学习训练分词序列的深层语义信息后,将得到的语义标注序列作为词性标注模型中词性预测网络的输入,从而得到训练词性序列对应的预测词性标注结果,进而基于该预测词性标注结果及训练分词序列对应的训练词性标注结果计算得到的损失函数,更新词性标注模型的模型参数,相比于现有技术,使词性标注模型能够充分学习到样本序列的深层语义信息及长距离特征信息,能够提升词性标注的准确度。为使本申请的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。附图说明为了更清楚地说明本申请实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本申请的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它相关的附图。图1为本申请一实施例提供的电子设备的一种示意性结构框图;图2为本申请一实施例提供的词性标注模型训练方法的一种示意性流程图;图3为一种词性标注模型的示意性结构图;图4为图3中语义连接网络的一种网络架构示意图;图5为图4中自匹配注意力层的一种网络架构示意图;图6为图2中S209的子步骤的一种示意性流程图;图7为图6中S209-2的子步骤的一种示意性流程图;图8为本申请一实施例提供的电子病历词性标注方法的一种示例性流程图;图9为本申请一实施例提供的词性标注模型训练装置的一种示意性结构图;图10为本申请一实施例提供的电子病历词性标注装置的一种示意性结构图。图中:100-电子设备;101-存储器;102-处理器;103-通信接口;400-词性标注模型训练装置;401-第一预处理模块;402-参数更新模块;本文档来自技高网...

【技术保护点】
1.一种词性标注模型训练方法,其特征在于,所述方法包括:/n获得训练分词序列及所述训练分词序列对应的训练词性标注结果;利用循环神经网络对所述训练分词序列进行处理,得到循环网络输出序列;/n利用语义连接网络对所述循环网络输出序列进行处理,得到语义标注序列,其中,所述语义标注序列表征对所述训练分词序列进行多次学习处理后得到的语义结果;/n将所述语义标注序列作为所述词性标注模型中词性预测网络的输入,得到所述训练分词序列对应的预测词性标注结果;/n基于所述预测词性标注结果及所述训练词性标注结果计算得到的损失函数,更新所述词性标注模型的模型参数。/n

【技术特征摘要】
1.一种词性标注模型训练方法,其特征在于,所述方法包括:
获得训练分词序列及所述训练分词序列对应的训练词性标注结果;利用循环神经网络对所述训练分词序列进行处理,得到循环网络输出序列;
利用语义连接网络对所述循环网络输出序列进行处理,得到语义标注序列,其中,所述语义标注序列表征对所述训练分词序列进行多次学习处理后得到的语义结果;
将所述语义标注序列作为所述词性标注模型中词性预测网络的输入,得到所述训练分词序列对应的预测词性标注结果;
基于所述预测词性标注结果及所述训练词性标注结果计算得到的损失函数,更新所述词性标注模型的模型参数。


2.如权利要求1所述的方法,其特征在于,所述语义连接网络包括M个依次串联的自匹配注意力层;
根据语义连接网络对所述循环网络输出序列进行处理,得到语义标注序列的步骤,包括:
将第N个自匹配注意力层之前的N-1个自匹配注意力层各自的自匹配注意力输出序列进行合并后得到的集合,作为所述第N个自匹配注意力层的自匹配注意力输入序列并进行处理,得到所述第N个自匹配注意力层的自匹配注意力输出序列;
其中,N小于或等于M,M和N均为大于1的整数,且所述M个依次串联的自匹配注意力层中,第一个自匹配注意力层的自匹配注意力输入序列为所述循环网络输出序列;所有自匹配注意力层各自的自匹配注意力输出序列合并后得到的集合为所述语义标注序列。


3.如权利要求2所述的方法,其特征在于,所述自匹配注意力层包括注意力Attention层和双向长短期记忆网络BiLSTM层;
所述Attention层用于对所述自匹配注意力输入序列进行处理,得到注意力输出序列;
所述BiLSTM层用于对所述注意力输出序列与所述自匹配注意力输入序列合并后得到的集合进行处理,得到所述自匹配注意力输出序列。


4.如权利要求1所述的方法,其特征在于,所述词性预测网络包含前馈神经网络层和概率转移矩阵,所述概率转移矩阵中的数值表征将第一标注标签转移至第二标注标签的概率;
所述预测词性标注结果包括多个预测词性标注序列,以及与每一预测词性标注序列对应的词性标注序列得分;
将所述语义标注序列作为所述词性标注模型中词性预测网络的输入,得到所述训练分词序列对应的预测词性标注结果的步骤,包括:
将所述语义标注序列作为所述前馈神经网络层的输入,得到所述多个预测词性标注序列,以及与每一预测词性标注序列对应的初始序列得分,其中,所述初始序列得分为每一所述预测词性标注序列中所有的预测标注标签对应的概率之和;
根据所述概率转移矩阵对每一所述初始序列得分进行更新,得到每一所述预测词性标注序列对应的所述词性标注序列得分。


5.如权利要求4所述的方法,其特征在于,所述概率转移矩阵为二阶概率转移矩阵,所述二阶概率转移矩阵中的数值表征将两个标注标签的组合转移至其他标注标签的概率;
根据所述概率转移矩阵对每一所述初始序列得分进行更新,得到每一所述预测词性标注序列对应的所述词性标注序列得分的步骤,包括:
根据目标预测词性标注序列中每一预测标注标签以及与每一所述预测标注标签相邻的两个预测标注标签,在所述二阶概率转移矩阵中获得每一所述预测标注标签...

【专利技术属性】
技术研发人员:王李鹏
申请(专利权)人:新华三大数据技术有限公司
类型:发明
国别省市:河南;41

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1