当前位置: 首页 > 专利查询>北京大学专利>正文

电子病历结构化方法及计算机可读存储介质技术

技术编号:20871317 阅读:31 留言:0更新日期:2019-04-17 10:21
本发明专利技术提供了一种电子病历结构化方法及计算机可读存储介质。其中,该方法包括:载入第一医学知识库;对第一电子病历按照特殊符号进行分句,得到多个文本句子;利用匹配打分算法,对多个文本句子中每个文本句子匹配第一医学知识库中的属性;保存匹配结果。通过本发明专利技术,解决了相关技术中电子病历不能完全结构化的问题,实现了电子病历的完全结构化。

【技术实现步骤摘要】
电子病历结构化方法及计算机可读存储介质
本专利技术涉及医疗领域,具体而言,涉及一种电子病历结构化方法及计算机可读存储介质。
技术介绍
随着医疗系统的电子化、网络化和智能化,病人的医疗数据被保存在电子病历中,包含主诉、病史、检查、诊断、治疗计划、处置等全方位的信息。在大数据的背景下,这些原始数据提供了医疗诊断决策的新的可能性,使得人们考虑从这些病历数据中挖掘信息、提取规则,设计智能系统,进一步提高医疗水平和医疗质量。但是,电子病历数据库往往保存的是医生录入的原始文本,尽管是按照一些指定模板撰写的,仍然会有一些自然语言表达的自由性和灵活性。因此,这样的数据并非完全结构化的,而仅仅是半结构化的数据,并不适用于更深层次的科研任务和智能医疗项目。这为我们提出了结构化原始文本数据的要求。由于自然语言表达方式的多样性以及医学术语的专业性,电子病历文本的结构化方法存在一定的难度,而国内目前对相关研究的工作开展尚不充分。对于电子病历结构化方法,国内研究工作的结果目前主要是基于电子病历利用语义正反对疾病信息做出肯定或否定的判断,这种方式能够解决以二值逻辑标定的疾病信息,但对于数值、疾病程度等类型的信息则不能提取;此外,对于患者相关疾病信息的发生部位目前的研究结果也未提出对应的解决方案。这种信息提取的不完整性对于医学研究、诊断决策智能系统的开发等工作形成了一定的局限。本专利技术目的是针对不同类型的疾病信息、医疗处置信息对电子病历进行完整的信息提取,实现对电子病历文本的完全结构化。
技术实现思路
本专利技术提供了一种电子病历结构化方法及计算机可读存储介质,以至少解决相关技术中电子病历不能完全结构化的问题。第一方面,本专利技术实施例提供了一种电子病历结构化方法,包括:载入第一医学知识库;对第一电子病历按照特殊符号进行分句,得到多个文本句子;利用匹配打分算法,对所述多个文本句子中每个文本句子匹配所述第一医学知识库中的属性;保存匹配结果。第二方面,本专利技术实施例提供了一种计算机可读存储介质,其上存储有计算机程序指令,当所述计算机程序指令被处理器执行时实现第一方面所述的方法。通过本专利技术实施例提供的电子病历结构化方法及计算机可读存储介质,采用载入第一医学知识库;对第一电子病历按照特殊符号进行分句,得到多个文本句子;利用匹配打分算法,对多个文本句子中每个文本句子匹配第一医学知识库中的属性;保存匹配结果,解决了相关技术中电子病历不能完全结构化的问题,实现了电子病历的完全结构化。附图说明此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:图1是根据本专利技术实施例的电子病历结构化方法的流程图;图2是根据本专利技术实施例的电子病历结构化设备的硬件结构示意图;图3是根据本专利技术优选实施例的电子病历结构化方法的流程图;图4是根据本专利技术优选实施例的口腔修复领域的第一医学知识库结构示例的示意图;图5是根据本专利技术优选实施例的电子病历的示例的示意图;图6是根据本专利技术优选实施例的电子病历结构化匹配结果的示意图;图7是根据本专利技术优选实施例的电子病历结构化匹配结果中属性的匹配频率统计图表。具体实施方式下面将详细描述本专利技术的各个方面的特征和示例性实施例,为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细描述。应理解,此处所描述的具体实施例仅用于解释本专利技术,并不用于限定本专利技术。对于本领域技术人员来说,本专利技术可以在不需要这些具体细节中的一些细节的情况下实施。下面对实施例的描述仅仅是为了通过示出本专利技术的示例来提供对本专利技术更好的理解。需要说明的是,在本文中,诸如第一和第二等之类的关系术语仅仅用来将一个实体或者操作与另一个实体或操作区分开来,而不一定要求或者暗示这些实体或操作之间存在任何这种实际的关系或者顺序。而且,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者设备不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者设备所固有的要素。在没有更多限制的情况下,由语句“包括……”限定的要素,并不排除在包括所述要素的过程、方法、物品或者设备中还存在另外的相同要素。在本实施例中提供了一种电子病历结构化方法,图1是根据本专利技术实施例的电子病历结构化方法的流程图,如图1所示,该流程包括如下步骤:步骤S101,载入第一医学知识库;步骤S102,对第一电子病历按照特殊符号进行分句,得到多个文本句子;步骤S103,利用匹配打分算法,对多个文本句子中每个文本句子匹配第一医学知识库中的属性;步骤S104,保存匹配结果。通过上述的步骤,利用匹配打分算法能够很好地将文本句子与第一医学知识库中的属性进行匹配,匹配的关键词可以不仅包括以二值逻辑标定的疾病信息,还能够匹配数值、疾病程度等类型的信息,从而解决了相关技术中电子病历不能完全结构化的问题,实现了电子病历的完全结构化。可选地,第一医学知识库包括多个部分,每个部分包括一个或者多个属性、与属性对应的一个或者多个关键词,每个属性至少包括:属性名称、属性值和位置,每个关键词还包括该关键词的分数。例如,在第一医学知识库中,其基本单元为一个属性,由属性名称、属性值和位置三部分组成,属性名称可为某种疾病的症状、身体特征或治疗手段等;其相应的属性值可为症状的有无及轻重程度、身体特征的具体表现或治疗手段的具体方法等;位置可为具有对应属性的身体部位。一批属性共同属于某个部分(section)(如检查、治疗计划等),各个部分构成整个知识库。由于医学诊断以及治疗措施本身的复杂性,为了能够详尽地对医学知识进行描述以及在结构化过程中尽可能地保留原始病历的信息,本实施例中对第一医学知识库可以进行以下几个方面的改进:a)拓展属性值取值类型;b)对每个属性增加“位置”以描述对应属性的身体部位;c)增加对时间序列信息的描述;d)对属性基于医学知识进行分类,形成对医学知识的层次化表达。具体说明如下:a)第一医学知识库属性值类型有实数类型、布尔类型、离散分类类型等,而在属性值的取值方式上包括判断、单选、数字、多选以及这几种方式的各种组合。这种多样化的表达形式能够实现医学中出现的各种属性的取值表达。b)由于第一医学知识库中的大部分属性都涉及某一具体身体部位,例如疾病信息的发生部位、医疗措施的实施部位等,在本实施例中对属性增加对应的身体部位描述。而同时,增加“位置”描述之后需要再结构化方法中增加对“位置”信息的提取,这在本实施例中会进一步进行说明。c)由于医疗行为本身是一个过程化的行为,而不是各种医疗措施的简单静态组合,尤其是针对患者病状指定的治疗计划和处置措施,不同医疗措施之间有先后关系。为了保留不同医疗措施之间的先后依赖关系,对第一医学知识库增加了时间序列信息的描述。例如,可以通过对需要表达时间序列的属性增加step和substep两个成员用于描述该属性在治疗过程中出现的次序,实现对属性的序列化表达。d)基于医学上的考虑,本实施例中涉及的第一医学知识库分为主诉、复诊、现病史、既往史、检查、诊断、治疗计划、处置八个部分,每个部分针对具体需要描述的医学领域进行属性的设计和分级本文档来自技高网...

【技术保护点】
1.一种电子病历结构化方法,其特征在于,包括:载入第一医学知识库;对第一电子病历按照特殊符号进行分句,得到多个文本句子;利用匹配打分算法,对所述多个文本句子中每个文本句子匹配所述第一医学知识库中的属性;保存匹配结果。

【技术特征摘要】
1.一种电子病历结构化方法,其特征在于,包括:载入第一医学知识库;对第一电子病历按照特殊符号进行分句,得到多个文本句子;利用匹配打分算法,对所述多个文本句子中每个文本句子匹配所述第一医学知识库中的属性;保存匹配结果。2.根据权利要求1所述的方法,其特征在于,所述第一医学知识库包括多个部分,每个部分包括一个或者多个属性、与属性对应的一个或者多个关键词;每个属性至少包括:属性名称、属性值和位置,每个关键词还包括:关键词的分数。3.根据权利要求2所述的方法,其特征在于,所述属性值的类型包括以下至少之一:实数类型、布尔类型、离散分类类型;所述属性值的取值方式包括以下至少之一:判断、单选、数字、多选。4.根据权利要求1所述的方法,其特征在于,所述特殊符号包括以下至少之一:中英文逗号、句号、换行符、制表符。5.根据权利要求1所述的方法,其特征在于,在载入所述第一医学知识库之前,所述方法还包括:载入第二医学知识库,其中,所述第二医学知识库包括多个部分,每个部分包括一个或者多个属性;每个属性至少包括:属性名称、属性值和位置;根据所述第二医学知识库和第二电子病历提取关键词及其分数;根据所述第二医学知识库和提取到的关键词及其分数,构建所述第一医学知识库。6.根据权利要求5所述的方法,其特征在于,根...

【专利技术属性】
技术研发人员:文再文陈青筱谢屿张嘉琦刘普凡刘德斌
申请(专利权)人:北京大学北京大学口腔医学院
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1