【技术实现步骤摘要】
电子病历命名实体识别方法和装置、电子设备及存储介质
[0001]本申请涉及数字医疗
,尤其涉及一种电子病历命名实体识别方法和装置、电子设备及存储介质。
技术介绍
[0002]命名实体识别(Name Entity Recognition,NER)技术可用于识别文本中的特定实体信息,如人名、地名、组织名称等,命名实体识别广泛应用于信息抽取、信息检索、智能问答、机器翻译等领域。通常,命名实体识别任务被形式化为序列标记任务,并且通过预测每个单词或每个单词的标记来联合预测实体边界和实体类型。
[0003]在数字医疗领域,通过命名实体识别技术将电子病历文本数据中蕴含的与医疗相关的实体名称归类到预定的类别,能够对医学信息检索、智能会诊中的问答对话、疾病信息抽取等方面起到较大的推动作用。
[0004]目前,大多数的电子病历命名实体识别方法常常是通过引入医学词典来对电子病历数据中的实体特征进行识别,这一方式常常无法根据不同的医学场景选取合适的词汇,会导致对命名实体的边界判断错误,存在着实体识别的准确性不高的问题。 >
技术实现思路
...
【技术保护点】
【技术特征摘要】
1.一种电子病历命名实体识别方法,其特征在于,所述方法包括:获取电子病历数据;其中,所述电子病历数据包括病历文本数据;对所述病历文本数据进行分词处理,得到病历词语序列;通过预设的命名实体识别模型的第一分支网络对所述病历词语序列进行特征提取,得到病历文本特征,其中,所述命名实体识别模型包括特征融合网络、第二分支网络、以及识别网络;基于所述特征融合网络对所述病历文本特征和预先获取的词汇数据进行融合处理,得到融合文本特征;基于所述第二分支网络对所述融合文本特征进行实体抽取,得到融合文本实体特征;基于所述识别网络对所述融合文本实体特征进行实体识别,得到所述融合文本实体特征的实体类型。2.根据权利要求1所述的电子病历命名实体识别方法,其特征在于,所述通过预设的命名实体识别模型的第一分支网络对所述病历词语序列进行特征提取,得到病历文本特征,包括:通过所述第一分支网络对所述病历词语序列中的病历词语进行词嵌入处理,得到词嵌入向量;对所述词嵌入向量进行多头注意力计算,得到第一注意力计算结果;对所述第一注意力计算结果进行归一化处理,得到所述病历文本特征。3.根据权利要求1所述的电子病历命名实体识别方法,其特征在于,所述基于所述特征融合网络对所述病历文本特征和预先获取的词汇数据进行融合处理,得到融合文本特征,包括:基于所述特征融合网络对所述病历文本特征和所述词汇数据进行双线性注意力计算,得到第二注意力计算结果;基于所述病历文本特征对所述第二注意力计算结果进行语义增强,得到中间文本特征;对所述中间文本特征进行标准化处理,得到所述融合文本特征。4.根据权利要求3所述的电子病历命名实体识别方法,其特征在于,所述基于所述特征融合网络对所述病历文本特征和所述词汇数据进行双线性注意力计算,得到第二注意力计算结果,包括:对所述病历文本特征和所述词汇数据进行特征相乘,得到第一特征矩阵;对所述第一特征矩阵进行总和池化处理,得到第二特征矩阵;对所述第二特征矩阵进行向量化处理,得到双线性特征向量;对所述双线性特征向量进行归一化处理,得到归一化特征;基于预设函数对所述归一化特征进行注意力计算,得到所述第二注意力计算结果。5.根据权利要求1至4任一项所述的电...
【专利技术属性】
技术研发人员:张兆,
申请(专利权)人:中国平安人寿保险股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。