【技术实现步骤摘要】
中文电子病历命名实体识别方法和系统
[0001]本专利技术涉及中文命名实体识别
,具体涉及一种融合知识图谱和字词特性的中文电子病历命名实体识别方法和系统
。
技术介绍
[0002]电子病历主要包括患者在医疗机构中的病程记录
、
症状
、
检查方法
、
手术记录等数据
。
电子病历不仅仅局限于上述的静态数据,同时记录着个人终生健康状态和医疗的信息,在病人信息的记录
、
存储
、
传输
、
共享
、
利用的所有过程中电子病历都会贯穿始终
。
现阶段医疗机构大多数的电子病历均是以非结构化的文本方式存储,从电子病历文本中准确地提取实质性数据有助于医院临床医疗研究以及开展公益医疗事业
。
基于电子病历的命名实体识别可以挖掘各种病情之间以及体征与诊断之间的关联,有助于综合性病人的治疗,也可以为医生提供辅助性的决策意见,从而节省成本
。
[0003]中 ...
【技术保护点】
【技术特征摘要】 【专利技术属性】
1.
一种中文电子病历命名实体识别方法,其特征在于,包括:
S1、
获取中文电子病历数据集并进行预处理;
S2、
将中文电子病历知识图谱中与预处理后的中文电子病历数据集中数据相对应的三元组插入到原数据中,生成融合知识图谱的中文电子病历数据集;
S3、
通过融合知识图谱的中文电子病历数据集训练初始的
BiLSTM
模型;通过预处理后中文电子病历数据分别训练初始的
GAN
模型
、BiGRU
模型;通过训练好的
BiLSTM
模型
、GAN
模型
、BiGRU
模型的输出的数据对初始的
GAT
模型进行训练;通过训练好的
GAT
模型对初始
CRF
模型进行训练;
S4、
整合训练好的
BiLSTM
模型
、GAN
模型
、BiGRU
模型
、GAT
和
CRF
模型,得到中文电子病历命名实体识别模型,所述中文电子病历命名实体识别模型用于识别待测中文电子病历数据中的命名实体
。2.
如权利要求1所述的中文电子病历命名实体识别方法,其特征在于,所述
S2
包括:对于一个给定句子
s
=
[x1,x2,...,x
n
]
,查找其中的每一个词
x
i
,i∈(0,n)
是否在知识图谱中有对应的三元组,若有,则在相应位置插入三元组;若词
x
i
在知识图谱中三元组的表示形式为
K
=
[(x
i
,r
i0
,x
i0
)...,(x
i
,r
ik
,x
ik
)]
,原句变为一个融入知识图谱三元组的新句子,其形式为
s
=
[x0,x1,...,x
i
(r
i0
,x
i0
),...,(r
ik
,x
ik
),...,x
n
]。3.
如权利要求1或2所述的中文电子病历命名实体识别方法,其特征在于,所述
S3
包括:
S301、
通过中文电子病历数据集对初始的
GAN
模型进行训练和测试,得到训练好的
GAN
模型,通过训练好的
GAN
模型提取中文电子病历数据集中的含有字符特征的序列向量;通过中文电子病历数据集对初始的
BiGRU
模型进行训练和测试,得到训练好的
BiGRU
模型,通过训练好的
BiGRU
模型提取中文电子病历数据集中的含有词语特征的序列向量;将含有字符特征的序列向量和含有词语特征的序列向量进行拼接,得到含有字词特征的序列向量;
S302、
通过融合知识图谱的中文电子病历数据集对初始的
BiLSTM
模型进行训练和测试,得到训练好的
BiLSTM
模型,通过训练好的
BiLSTM
模型提取中文电子病历数据集中的包含知识图谱的含字符特征的序列向量;
S303、
通过含有字词特征的序列向量和包含知识图谱的含字符特征的序列向量训练初始的
GAT
模型,得到训练好的
GAT
模型,并通过训练好的
GAT
模型对含有字词特征的序列向量和包含含有字符特征的序列向量进行处理,得到含有上下文特征的序列向量;
S304、
根据含有上下文特征的序列向量训练初始的
CRF
模型,得到训练好的
CRF
模型
。4.
如权利要求3所述的中文电子病历命名实体识别方法,其特征在于,所述通过训练好的
GAT
模型对含有字词特征的序列向量和包含含有字符特征的序列向量进行处理,得到含有上下文特征的序列向量,包括:使用一个多头注意力机制计算权重,将含有字词特征的序列向量
h
i
和包含知识图谱的含字符特征的序列向量
h
j
分别映射到
K
个维度,并计算它们的相似度得分个维度,并计算它们的相似度得分其中,
LeakyReLU
是一个带有负斜率的
ReLU
函数,
‖
表示向量的拼接操作,
a
k
是一个可学习的权重向量;
使用
softmax
函数将得分归一化,得到注意力系数函数将得分归一化,得到注意力系数将注意力系数和邻居节点的特征向量进行加权求和,得到节点
i
的表示
h
i
′
:其中,
W
k
是第
k
个注意力头对应的可学习权重矩阵,
h
技术研发人员:张培龙,李华,马云潇,刘玉林,王显荣,
申请(专利权)人:内蒙古大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。