【技术实现步骤摘要】
基于字词读音融合特征模型的电子病历命名实体识别方法
本专利技术属于计算机
,涉及一种基于字词读音融合特征模型的电子病历命名实体识别方法。
技术介绍
随着我国社会经济的蓬勃发展及人民生活水平的日益提高,人们健康意识也日益增强,如何利用大量的医疗数据来构建智能医疗体系是目前社会的迫切需求。电子病历时医疗数据里数量最多,包含信息也最多的医疗数据文本,其具有其独特的专业性。很多智能医疗信息系统都是基于电子病历的信息来构建。在构建智能医疗信息系统和体系的过程中,命名实体识别对大量的医疗数据进行信息抽取的重要任务的基础,对各种医疗领域的信息处理和管理系统十分重要。目前基于动态结构融合词汇信息需要通过修改相应的特征抽取模型,这导致模型结构复杂和推断效率低的问题;此外国内的医疗文本记录体系不完善,医疗文本数据中存在储存时没有对数据中的命名实体进行标注,使得可用于命名实体识别任务所需的带标注信息的中文医疗文本数据更加缺乏,降低了电子病历的命名实体识别效果。
技术实现思路
针对上述问题,本专利技术提出了一种基于 ...
【技术保护点】
1.基于字词读音融合特征模型的电子病历命名实体识别方法,其特征在于,包括以下步骤:/n生成待识别命名实体的电子病历的字符序列对应的字符的字词向量的集合;/n生成所述字符序列对应的读音向量;/n将所述读音向量输入到第一神经网络进行处理,得到所述字符序列对应的读音加强字词向量;/n将读音加强字词向量经过词频权重和读音权重处理融合生成字词读音特征模型;/n将所述字词读音特征模型输入到第二神经网络中进行处理,得到所述电子病历的命名实体识别结果。/n
【技术特征摘要】
1.基于字词读音融合特征模型的电子病历命名实体识别方法,其特征在于,包括以下步骤:
生成待识别命名实体的电子病历的字符序列对应的字符的字词向量的集合;
生成所述字符序列对应的读音向量;
将所述读音向量输入到第一神经网络进行处理,得到所述字符序列对应的读音加强字词向量;
将读音加强字词向量经过词频权重和读音权重处理融合生成字词读音特征模型;
将所述字词读音特征模型输入到第二神经网络中进行处理,得到所述电子病历的命名实体识别结果。
2.根据权利要求1所述的基于字词读音融合特征模型的电子病历命名实体识别方法,其特征在于:所述字词向量的集合为BMES集合,通过Soft-lexicon构造模型生成,生成“B”、“M”、“E”、“S”四个词集,并且BMES集合中的字词向量表示如下:
e(B,M,E,S)=[v(B)+v(M)+v(E)+v(S)]
其中:“B”集合保存当前字为词首字的单词列表;“M”集合保...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。