【技术实现步骤摘要】
本专利技术涉及自然语言处理,尤其涉及一种罕见病电子病历中命名实体的识别方法、装置及设备。
技术介绍
1、随着人工智能技术的发展,越来越多的领域开始采用自然语言处理进行语义识别与处理。罕见病电子病历命名实体识别的目的是从一段非结构化的罕见病患者的电子病历中识别出命名实体,并将其归类到某个预定义的类别种。作为罕见病患者相关数据的重要来源,命名实体能够有效支撑诸多自然语言处理领域的下游应用,如疾病特征研究、病历分析、智能诊断和信息检索等。为了解决实际应用中罕见病电子病历相对于普通电子病历数量少,实体类别种类多,专业度高的问题,需要设计一种罕见病电子病历中命名实体的识别方法。
2、现有方式中,专利技术名称为电子病历中实体的识别,申请号为201980003795.2的专利文献公开了一种用于实体预测的方法、系统和装置,包括在计算机存储介质上编码的计算机程序。方法之一包括对要被预测的文本执行词语划分以获得多个词语。对于多个词语中的每个词语,就所述词语是否具有预训练词语向量进行确定。响应于确定词语具有预训练词语向量,获得该词语的预训练词语向
...【技术保护点】
1.一种罕见病电子病历中命名实体的识别方法,其特征在于,包括:
2.如权利要求1所述的罕见病电子病历中命名实体的识别方法,其特征在于,所述基于罕见病的电子病历数据构建罕见病初始同义词词库包括:
3.如权利要求1所述的罕见病电子病历中命名实体的识别方法,其特征在于,所述对所述罕见病初始同义词词库中的同义词进行替换增强,得到罕见病目标同义词词库包括:
4.如权利要求3所述的罕见病电子病历中命名实体的识别方法,其特征在于,所述从所述同义词词库中筛选待增强的同义词,作为第一数据集,并对所述第一数据集进行增强处理,得到第二数据集包括:
...【技术特征摘要】
1.一种罕见病电子病历中命名实体的识别方法,其特征在于,包括:
2.如权利要求1所述的罕见病电子病历中命名实体的识别方法,其特征在于,所述基于罕见病的电子病历数据构建罕见病初始同义词词库包括:
3.如权利要求1所述的罕见病电子病历中命名实体的识别方法,其特征在于,所述对所述罕见病初始同义词词库中的同义词进行替换增强,得到罕见病目标同义词词库包括:
4.如权利要求3所述的罕见病电子病历中命名实体的识别方法,其特征在于,所述从所述同义词词库中筛选待增强的同义词,作为第一数据集,并对所述第一数据集进行增强处理,得到第二数据集包括:
5.如权利要求1至4任一项所述的罕见病电子病历中命名实体的识别方法,其特征在于,所述基于所述词向量进行特征提取,得到目标特征包...
【专利技术属性】
技术研发人员:陈妍,何志威,冯嵩,周国庆,张船,黄华,
申请(专利权)人:湖南工商大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。