一种医疗信息的归一化方法、装置、介质及电子设备制造方法及图纸

技术编号:20681252 阅读:22 留言:0更新日期:2019-03-27 18:59
本发明专利技术实施例提供了一种医疗信息的归一化方法,该方法包括:将所获取医疗文本信息的核心语义与预设的文本库进行关联,建立医疗文本信息的核心语义与文本库的第一逻辑映射关系;将预设的临床版标准词的核心语义与预设的文本库进行关联,建立临床版标准词的核心语义与文本库的第二逻辑映射关系;基于第一逻辑映射关系和第二逻辑映射关系实现医疗信息的归一化。本发明专利技术实施例的技术方案可以通过少量人工标注获取核心语义中的逻辑关系,并与ICD‑9标准编码手术操作名称产生映射,从而可以通过算法批量处理自然文本描述的医疗信息,减少了人工录入归一化处理的成本和错误率,大幅提高了医疗信息的可读性和可用性。

【技术实现步骤摘要】
一种医疗信息的归一化方法、装置、介质及电子设备
本专利技术涉及自然语言处理
,具体而言,涉及一种医疗信息的归一化方法、装置、介质及电子设备。
技术介绍
随着医疗系统信息化建立和完善,越来越多的医疗数据由人工记录的方式转为电子化录入,对于病历、医嘱、护理文书、检查报告等临床信息主要由医疗人员通过自然语言的方式书写而成,信息结构较为复杂,如何对大量这些信息进行处理、分析和挖掘是医疗信息化建设的一个重要问题。医疗数据中手术信息的分析处理并进行合理归一是一个较为复杂的问题,其中涉及解剖结构、组织结构、手术方式、手术范围、手术目的、疾病名称、入路等,如何将其中有效的信息识别出来并按照ICD-9的标准值进行归一化处理,是需解决的问题,目前的技术方案是在医生填写具体手术名称的同事要填写ICD-9标准名称,或者由病案室工作人员根据医生填写内容进行手动归一化处理;但是上述现有技术方案效率低下、错误率高,并且耗费了大量人力物力。需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本专利技术的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
本专利技术实施例的目的在于提供一种医疗信息的归一化方法,进而至少在一定程度上克服现有方案需要通过人工手动进行医疗数据的归一化所引起的效率低下、错误率高以及耗费大量人力物力的一个或多个问题。本专利技术的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本专利技术的实践而习得。根据本专利技术实施例的第一方面,提供了一种医疗信息的归一化方法,包括:将所获取医疗文本信息的核心语义与预设的文本库进行关联,建立医疗文本信息的核心语义与文本库的第一逻辑映射关系;将预设的临床版标准词的核心语义与预设的文本库进行关联,建立临床版标准词的核心语义与文本库的第二逻辑映射关系;基于第一逻辑映射关系和第二逻辑映射关系实现医疗信息的归一化。在本专利技术的一个实施例中,上述将所获取医疗文本信息的核心语义与预设的文本库进行关联之前,方法还包括:对医疗文本信息进行分词,获得医疗短文本信息;将医疗短文本信息中已停用的医疗短文本以及低频医疗短文本滤除,获得过滤后的医疗短文本信息;对过滤后的医疗短文本信息进行相关性分析,将相似度大于等于预设阈值的医疗短文本进行归并,获得医疗文本信息的核心语义。在本专利技术的一个实施例中,上述将所获取医疗文本信息的核心语义与预设的文本库进行关联,建立医疗文本信息的核心语义与文本库的第一逻辑映射关系,包括:预设的文本库至少包含有知识图谱库词条数据;将医疗文本信息的核心语义与知识图谱库中的词条进行关联,建立医疗文本信息的核心语义与知识图谱库中对应的词条的第一逻辑映射关系。在本专利技术的一个实施例中,上述将预设的临床版标准词的核心语义与预设的文本库进行关联,建立临床版标准词的核心语义与文本库的第二逻辑映射关系,包括:预设的文本库至少包含有知识图谱库词条数据;将临床版标准词的核心语义中手术操作名称的与知识图谱库中的词条进行关联,建立临床版标准词的核心语义与知识图谱库中对应的词条的第二逻辑映射关系。在本专利技术的一个实施例中,上述基于第一逻辑映射关系和第二逻辑映射关系实现医疗信息的归一化,包括:基于预设的标注规则、第一逻辑映射关系以及第二逻辑映射关系,建立医疗文本信息的核心语义与临床版标准词的核心语义中手术操作名称的第三逻辑映射关系;当获取到待归一化的医疗文本信息后,识别出待归一化的医疗文本信息中的有效信息;基于第三逻辑映射关系,将有效信息编码为符合临床版标准词的核心语义中手术操作名称格式的标准词。根据本专利技术实施例的第二方面,提供一种医疗信息的归一化装置,包括:第一关联模块,用于将所获取医疗文本信息的核心语义与预设的文本库进行关联,建立医疗文本信息的核心语义与文本库的第一逻辑映射关系;第二关联模块,用于将预设的临床版标准词的核心语义与预设的文本库进行关联,建立临床版标准词的核心语义与文本库的第二逻辑映射关系;编码模块,用于基于第一逻辑映射关系和第二逻辑映射关系实现医疗信息的归一化。在本专利技术的一个实施例中,上述装置还包括:核心语义提取模块,用于对医疗文本信息进行分词,获得医疗短文本信息;将医疗短文本信息中已停用的医疗短文本以及低频医疗短文本滤除,获得过滤后的医疗短文本信息;对过滤后的医疗短文本信息进行相关性分析,将相似度大于等于预设阈值的医疗短文本进行归并,获得医疗文本信息的核心语义。在本专利技术的一个实施例中,上述第一关联模块具体用于:预设的文本库至少包含有知识图谱库词条数据;将医疗文本信息的核心语义与知识图谱库中的词条进行关联,建立医疗文本信息的核心语义与知识图谱库中对应的词条的第一逻辑映射关系。在本专利技术的一个实施例中,上述第二关联模块具体用于:预设的文本库至少包含有知识图谱库词条数据;将临床版标准词的核心语义中手术操作名称的与知识图谱库中的词条进行关联,建立临床版标准词的核心语义与知识图谱库中对应的词条的第二逻辑映射关系。在本专利技术的一个实施例中,上述编码模块具体用于:基于预设的标注规则、第一逻辑映射关系以及第二逻辑映射关系,建立医疗文本信息的核心语义与临床版标准词的核心语义中手术操作名称的第三逻辑映射关系;当获取到待归一化的医疗文本信息后,识别出待归一化的医疗文本信息中的有效信息;基于第三逻辑映射关系,将有效信息编码为符合临床版标准词的核心语义中手术操作名称格式的标准词。根据本专利技术实施例的第三方面,提供了一种计算机可读介质,其上存储有计算机程序,程序被处理器执行时实现如上述实施例中第一方面的医疗信息的归一化方法。根据本专利技术实施例的第四方面,提供了一种电子设备,包括:一个或多个处理器;存储装置,用于存储一个或多个程序,当一个或多个程序被一个或多个处理器执行时,使得一个或多个处理器实现如上述实施例中第一方面的医疗信息的归一化方法。本专利技术实施例提供的技术方案可以包括以下有益效果:本专利技术实施例提供了一种医疗信息的归一化方法,该方法包括:将所获取医疗文本信息的核心语义与预设的文本库进行关联,建立医疗文本信息的核心语义与文本库的第一逻辑映射关系;将预设的临床版标准词的核心语义与预设的文本库进行关联,建立临床版标准词的核心语义与文本库的第二逻辑映射关系;基于第一逻辑映射关系和第二逻辑映射关系实现医疗信息的归一化。本专利技术实施例的技术方案可以通过少量人工标注获取核心语义中的逻辑关系,并与ICD-9标准编码手术操作名称产生映射,从而可以通过算法批量处理自然文本描述的医疗信息,减少了人工录入归一化处理的成本和错误率,大幅提高了医疗信息的可读性和可用性。应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本专利技术。附图说明此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本专利技术的实施例,并与说明书一起用于解释本专利技术的原理。显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。在附图中:图1示意性示出了根据本专利技术的一个实施例语义识别方法的流程图。图2示意性示出了根据本专利技术的一个实施例的医疗信息的归一化装置的框图。图3示出了适于用来实现本专利技术实施例的电子设备的计算机系统的结构示意图。具体实施本文档来自技高网...

【技术保护点】
1.一种医疗信息的归一化方法,其特征在于,包括:将所获取医疗文本信息的核心语义与预设的文本库进行关联,建立所述医疗文本信息的核心语义与所述文本库的第一逻辑映射关系;将预设的临床版标准词的核心语义与所述预设的文本库进行关联,建立所述临床版标准词的核心语义与所述文本库的第二逻辑映射关系;基于所述第一逻辑映射关系和所述第二逻辑映射关系实现医疗信息的归一化。

【技术特征摘要】
1.一种医疗信息的归一化方法,其特征在于,包括:将所获取医疗文本信息的核心语义与预设的文本库进行关联,建立所述医疗文本信息的核心语义与所述文本库的第一逻辑映射关系;将预设的临床版标准词的核心语义与所述预设的文本库进行关联,建立所述临床版标准词的核心语义与所述文本库的第二逻辑映射关系;基于所述第一逻辑映射关系和所述第二逻辑映射关系实现医疗信息的归一化。2.根据权利要求1所述的医疗信息的归一化方法,其特征在于,所述将所获取医疗文本信息的核心语义与预设的文本库进行关联之前,所述方法还包括:对所述医疗文本信息进行分词,获得医疗短文本信息;将所述医疗短文本信息中已停用的医疗短文本以及低频医疗短文本滤除,获得过滤后的医疗短文本信息;对所述过滤后的医疗短文本信息进行相关性分析,将相似度大于等于预设阈值的医疗短文本进行归并,获得所述医疗文本信息的核心语义。3.根据权利要求1所述的医疗信息的归一化方法,其特征在于,所述将所获取医疗文本信息的核心语义与预设的文本库进行关联,建立所述医疗文本信息的核心语义与所述文本库的第一逻辑映射关系,包括:所述预设的文本库至少包含有知识图谱库词条数据;将所述医疗文本信息的核心语义与所述知识图谱库中的词条进行关联,建立所述医疗文本信息的核心语义与所述知识图谱库中对应的词条的第一逻辑映射关系。4.根据权利要求1所述的医疗信息的归一化方法,其特征在于,所述将预设的临床版标准词的核心语义与所述预设的文本库进行关联,建立所述临床版标准词的核心语义与所述文本库的第二逻辑映射关系,包括:所述预设的文本库至少包含有知识图谱库词条数据;将所述临床版标准词的核心语义中手术操作名称的与所述知识图谱库中的词条进行关联,建立所述临床版标准词的核心语义与所述知识图谱库中对应的词条的第二逻辑映射关系。5.根据权利要求1所述的医疗信息的归一化方法,其特征在于,所述基于所述第一逻辑映射关系和所述第二逻辑映射关系实现医疗信息的归一化,包括:基于预设的标注规则、所述第一逻辑映射关系以及第二逻辑映射关系,建立所述医疗文本信息的核心语义与临床版标准词的核心语义中手术操作名称的第三逻辑映射关系;当获取到待归一化的医疗文本信息后,识别出所述待归一化的医疗文本信息中的有效信息;基于所述第三逻辑映射关系,将所述有效信息编码为符合所述临床版标准词的核心语义中手术操作名称格式的标准词。6.一种医疗信息的归一化装置,其特征在于,包括:第一关...

【专利技术属性】
技术研发人员:王琛季思伟张黎刘学梁刘旭
申请(专利权)人:天津开心生活科技有限公司天津新开心生活科技有限公司
类型:发明
国别省市:天津,12

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1