一种医疗信息的归一化方法、装置、介质及电子设备制造方法及图纸

技术编号：20681252 阅读：38 留言：0更新日期：2019-03-27 18:59

本发明专利技术实施例提供了一种医疗信息的归一化方法，该方法包括：将所获取医疗文本信息的核心语义与预设的文本库进行关联，建立医疗文本信息的核心语义与文本库的第一逻辑映射关系；将预设的临床版标准词的核心语义与预设的文本库进行关联，建立临床版标准词的核心语义与文本库的第二逻辑映射关系；基于第一逻辑映射关系和第二逻辑映射关系实现医疗信息的归一化。本发明专利技术实施例的技术方案可以通过少量人工标注获取核心语义中的逻辑关系，并与ICD‑9标准编码手术操作名称产生映射，从而可以通过算法批量处理自然文本描述的医疗信息，减少了人工录入归一化处理的成本和错误率，大幅提高了医疗信息的可读性和可用性。

全部详细技术资料下载

【技术实现步骤摘要】
一种医疗信息的归一化方法、装置、介质及电子设备
本专利技术涉及自然语言处理
，具体而言，涉及一种医疗信息的归一化方法、装置、介质及电子设备。
技术介绍
随着医疗系统信息化建立和完善，越来越多的医疗数据由人工记录的方式转为电子化录入，对于病历、医嘱、护理文书、检查报告等临床信息主要由医疗人员通过自然语言的方式书写而成，信息结构较为复杂，如何对大量这些信息进行处理、分析和挖掘是医疗信息化建设的一个重要问题。医疗数据中手术信息的分析处理并进行合理归一是一个较为复杂的问题，其中涉及解剖结构、组织结构、手术方式、手术范围、手术目的、疾病名称、入路等，如何将其中有效的信息识别出来并按照ICD-9的标准值进行归一化处理，是需解决的问题，目前的技术方案是在医生填写具体手术名称的同事要填写ICD-9标准名称，或者由病案室工作人员根据医生填写内容进行手动归一化处理；但是上述现有技术方案效率低下、错误率高，并且耗费了大量人力物力。需要说明的是，在上述
技术介绍
部分公开的信息仅用于加强对本专利技术的背景的理解，因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。
技术实现思路
本...

【技术保护点】
1.一种医疗信息的归一化方法，其特征在于，包括：将所获取医疗文本信息的核心语义与预设的文本库进行关联，建立所述医疗文本信息的核心语义与所述文本库的第一逻辑映射关系；将预设的临床版标准词的核心语义与所述预设的文本库进行关联，建立所述临床版标准词的核心语义与所述文本库的第二逻辑映射关系；基于所述第一逻辑映射关系和所述第二逻辑映射关系实现医疗信息的归一化。

【技术特征摘要】
1.一种医疗信息的归一化方法，其特征在于，包括：将所获取医疗文本信息的核心语义与预设的文本库进行关联，建立所述医疗文本信息的核心语义与所述文本库的第一逻辑映射关系；将预设的临床版标准词的核心语义与所述预设的文本库进行关联，建立所述临床版标准词的核心语义与所述文本库的第二逻辑映射关系；基于所述第一逻辑映射关系和所述第二逻辑映射关系实现医疗信息的归一化。2.根据权利要求1所述的医疗信息的归一化方法，其特征在于，所述将所获取医疗文本信息的核心语义与预设的文本库进行关联之前，所述方法还包括：对所述医疗文本信息进行分词，获得医疗短文本信息；将所述医疗短文本信息中已停用的医疗短文本以及低频医疗短文本滤除，获得过滤后的医疗短文本信息；对所述过滤后的医疗短文本信息进行相关性分析，将相似度大于等于预设阈值的医疗短文本进行归并，获得所述医疗文本信息的核心语义。3.根据权利要求1所述的医疗信息的归一化方法，其特征在于，所述将所获取医疗文本信息的核心语义与预设的文本库进行关联，建立所述医疗文本信息的核心语义与所述文本库的第一逻辑映射关系，包括：所述预设的文本库至少包含有知识图谱库词条数据；将所述医疗文本信息的核心语义与所述知识图谱库中的词条进行关联，建立所述医疗文本信息的核心语义与所述知识图谱库中对应的词条的第一逻辑映射关系。4.根据权利要求1所述的医疗信息的归一化方法，其特征在于，所述将预设的临床版标准词的核心语义与所述预设的文本库进行关联，建立所述临床版标准词的核心语义与所述文本库的第二逻辑映射关系，包括：所述预设的文本库至少包含有知识图谱库词条数据；将所述临床版标准词的核心语义中手术操作名称的与所述知识图谱库中的词条进行关联，建立所述临床版标准词的核心语义与所述知识图谱库中对应的词条的第二逻辑映射关系。5.根据权利要求1所述的医疗信息的归一化方法，其特征在于，所述基于所述第一逻辑映射关系和所述第二逻辑映射关系实现医疗信息的归一化，包括：基于预设的标注规则、所述第一逻辑映射关系以及第二逻辑映射关系，建立所述医疗文本信息的核心语义与临床版标准词的核心语义中手术操作名称的第三逻辑映射关系；当获取到待归一化的医疗文本信息后，识别出所述待归一化的医疗文本信息中的有效信息；基于所述第三逻辑映射关系，将所述有效信息编码为符合所述临床版标准词的核心语义中手术操作名称格式的标准词。6.一种医疗信息的归一化装置，其特征在于，包括：第一关...

【专利技术属性】
技术研发人员：王琛，季思伟，张黎，刘学梁，刘旭，
申请(专利权)人：天津开心生活科技有限公司，天津新开心生活科技有限公司，
类型：发明
国别省市：天津,12

全部详细技术资料下载我是这个专利的主人