罕见病电子病历中命名实体的识别方法、装置及设备制造方法及图纸

技术编号:43540268 阅读:19 留言:0更新日期:2024-12-03 12:22
本发明专利技术公开了一种罕见病电子病历中命名实体的识别方法、装置及设备,包括:基于罕见病的电子病历数据构建罕见病初始同义词词库;对罕见病初始同义词词库中的同义词进行替换增强,得到罕见病目标同义词词库;采用罕见病目标同义词词库进行中文医疗预训练模型训练,得到训练好的中文医疗预训练模型;在接收到罕见病电子病历的命名实体的识别请求时,采用训练好的中文医疗预训练模型基于请求中的罕见病电子病历生成词向量,并基于词向量进行特征提取,得到目标特征;使用条件随机场对目标特征进行识别,输出对应的实体命名标签。采用本发明专利技术提高了罕见病命名识别的准确率。

【技术实现步骤摘要】

本专利技术涉及自然语言处理,尤其涉及一种罕见病电子病历中命名实体的识别方法、装置及设备


技术介绍

1、随着人工智能技术的发展,越来越多的领域开始采用自然语言处理进行语义识别与处理。罕见病电子病历命名实体识别的目的是从一段非结构化的罕见病患者的电子病历中识别出命名实体,并将其归类到某个预定义的类别种。作为罕见病患者相关数据的重要来源,命名实体能够有效支撑诸多自然语言处理领域的下游应用,如疾病特征研究、病历分析、智能诊断和信息检索等。为了解决实际应用中罕见病电子病历相对于普通电子病历数量少,实体类别种类多,专业度高的问题,需要设计一种罕见病电子病历中命名实体的识别方法。

2、现有方式中,专利技术名称为电子病历中实体的识别,申请号为201980003795.2的专利文献公开了一种用于实体预测的方法、系统和装置,包括在计算机存储介质上编码的计算机程序。方法之一包括对要被预测的文本执行词语划分以获得多个词语。对于多个词语中的每个词语,就所述词语是否具有预训练词语向量进行确定。响应于确定词语具有预训练词语向量,获得该词语的预训练词语向量。响应于确定词语不本文档来自技高网...

【技术保护点】

1.一种罕见病电子病历中命名实体的识别方法,其特征在于,包括:

2.如权利要求1所述的罕见病电子病历中命名实体的识别方法,其特征在于,所述基于罕见病的电子病历数据构建罕见病初始同义词词库包括:

3.如权利要求1所述的罕见病电子病历中命名实体的识别方法,其特征在于,所述对所述罕见病初始同义词词库中的同义词进行替换增强,得到罕见病目标同义词词库包括:

4.如权利要求3所述的罕见病电子病历中命名实体的识别方法,其特征在于,所述从所述同义词词库中筛选待增强的同义词,作为第一数据集,并对所述第一数据集进行增强处理,得到第二数据集包括:

5.如权利要求...

【技术特征摘要】

1.一种罕见病电子病历中命名实体的识别方法,其特征在于,包括:

2.如权利要求1所述的罕见病电子病历中命名实体的识别方法,其特征在于,所述基于罕见病的电子病历数据构建罕见病初始同义词词库包括:

3.如权利要求1所述的罕见病电子病历中命名实体的识别方法,其特征在于,所述对所述罕见病初始同义词词库中的同义词进行替换增强,得到罕见病目标同义词词库包括:

4.如权利要求3所述的罕见病电子病历中命名实体的识别方法,其特征在于,所述从所述同义词词库中筛选待增强的同义词,作为第一数据集,并对所述第一数据集进行增强处理,得到第二数据集包括:

5.如权利要求1至4任一项所述的罕见病电子病历中命名实体的识别方法,其特征在于,所述基于所述词向量进行特征提取,得到目标特征包...

【专利技术属性】
技术研发人员:陈妍何志威冯嵩周国庆张船黄华
申请(专利权)人:湖南工商大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1