当前位置: 首页 > 专利查询>上海大学专利>正文

一种面向突发公共卫生事件的中医诊疗知识图谱构建方法技术

技术编号:35781806 阅读:11 留言:0更新日期:2022-12-01 14:27
本发明专利技术属于中医医疗知识图谱的技术领域,尤其涉及一种面向突发公共卫生事件的中医诊疗知识图谱构建方法,包括获取医疗数据;提取并整合病例主要症状;中医术语文本的结构化和分级分类;设计知识图谱概念模型;基于本体自动构建和三元组批量填充完成知识图谱自动构建;通过知识推理和知识可视化生成基于症状的中医诊疗知识等步骤。本发明专利技术提出的知识图谱构建方法以新冠肺炎为例,对基于病例症状的多源数据进行整合和知识化,解决了突发公共卫生事件医疗决策中数据的多源异构问题,为突发公共卫生事件医疗救治提供中医诊疗知识和辅助医疗决策支持,提高医疗救治效率,为智能辅助医疗决策系统的研发与应用提供参考。疗决策系统的研发与应用提供参考。疗决策系统的研发与应用提供参考。

【技术实现步骤摘要】
一种面向突发公共卫生事件的中医诊疗知识图谱构建方法


[0001]本专利技术涉及一种面向突发公共卫生事件的中医诊疗知识图谱构建方法,具体上,涉及一种基于中医术语文本数据结构化与术语自动分层分类、多源数据融合、本体自动化等智能手段的突发公共卫生事件中医诊疗知识图谱自动构建与知识推理方法。

技术介绍

[0002]医疗信息化加速推进的背景下,海量的多源异构医疗数据不断堆积,一方面为医疗决策提供了大量的数据资源,另一方面也增加了有价值的数据的检索与获取难度,造成数据和信息过载,影响了医疗决策效率。
[0003]在这一背景下,知识图谱被大量应用于医疗领域,以促进医疗救治效率和能力的提升。但多源异构数据也是知识图谱构建中的一大挑战,特别是在以新冠肺炎疫情为代表的重大突发公共卫生事件背景下,各区域、不同医疗决策主体产生的大量医疗数据存在不一致、非结构化、互操作性不强等问题,且在中医领域更加突出。虽然国家中医药管理局及时发布了《中医临床诊疗术语》(简称中医术语),以推动中医知识标准化和提升不同的决策系统直接的互操作性,但该术语体系数据量大,且以文本数据形式描述。
[0004]在知识图谱的构建过程中,自然语言处理、文本挖掘、本体等是常用技术。其中,自然语言处理和文本挖掘用于识别、提取具有自然语言特征的文本数据中的概念、实体及其之间的关系。本体主要作为载体和实现方法,为众多医疗领域知识图谱的实现提供支持。但目前为止,大量的医疗知识图谱主要侧重于知识的可视化,为用户提供知识服务,面向突发公共卫生事件这一特定领域的医疗知识系统仍然缺乏,尤其缺乏具备智能辅助诊疗功能的知识图谱。因此,亟需结合突发公共卫生事件医疗数据多源异构的特征,整合多种智能手段,提供一种包含多源数据融合、数据自动填充、知识推理规则设计与知识可视化的知识图谱构建方法。

技术实现思路

[0005]针对现有技术存在的缺陷,本专利技术的目的是提供一种面向突发公共卫生事件的中医诊疗知识图谱构建方法,将围绕病例症状的多源数据进行融合和知识表示,基于症状——证候——治法——药物的诊疗逻辑进行知识推理规则,并借助图数据库实现知识可视化,促进中医知识在突发公共卫生事件医疗救治中的利用。
[0006]为了实现上述目标,本专利技术采用如下技术方案:
[0007]一种面向突发公共卫生事件的中医诊疗知识图谱构建方法,包括以下步骤:
[0008]S1:获取病例数据、中医临床诊疗术语、中草药数据;
[0009]S2:对数据进行预处理、识别并整合病例症状、对中医术语文本进行结构化处理和术语自动分层分类;
[0010]S3:设计知识图谱的概念模型;
[0011]S4:基于提取的概念及其关系、概念模型构建知识图谱。
[0012]进一步地,所述步骤2包括如下步骤:
[0013]S2.1:从多源数据中提取病例症状,并整合症状;其中,采用BiLSTM

CRF模型识别病例文本数据中的症状字符,与字典格式病例数据和文献中指明的症状合并;
[0014]S2.2:根据段落和空行标志将中医术语文本分割,每个独立的文本块对应一个术语;将文本块中的句子作为字段,以最大的文本块字段数为所有文本块的字段长度,统一文本块长度,对术语文本块进行表格存储,完成术语文本数据的结构化;
[0015]S2.3:根据文本块中术语分类号的长度对分类号进行分层,通过分类号与其上下层分类号的关系判断该术语为类或实例,确定分类号对应术语的类型、父类,完成中医术语的分层分类。
[0016]进一步地,所述步骤2.3包括以下步骤:
[0017]S2.3.1:对于每一个文本块,统计其唯一的术语分类号的长度,将分类号长度作为其层数;
[0018]S2.3.2:根据层数对分类号进行分级,一级分类号对应的术语被作为顶层类;将末级分类号作为实例,在上一级分类号集合中查找去掉末位的该分类号,确定末级分类号的父类;对非一级和末级的分类号,其层数为l,首先检测其是否存在于下一级即l+1层分类号的前l位中,确定其属于类还是实例,如果存在,断定该分类号对应的术语存在子术语,将其作为概念类,否则作为实例;
[0019]S2.3.3:根据术语分级分类逻辑确定中医术语的类型和层级关系。
[0020]进一步地,所述步骤3中知识图谱概念模型的设计包括如下步骤:
[0021]S3.1:面向病例中医诊疗,基于病例症状,通过S2提取的主要概念确定中医诊疗知识图谱中的主要概念术语和基本层次关系;
[0022]S3.2:结合诊疗逻辑确定不同概念之间的基本关系,绘制概念模型图。
[0023]进一步地,所述步骤4中知识图谱的自动构建主要包括如下步骤:
[0024]S4.1:基于概念模型,采用owlready2自动构建本体,创建症状、证候、治法、中医顶层概念类;
[0025]S4.2:根据RDFlib本体自动化策略进行知识图谱的自动构建和三元组批量填充;
[0026]S4.3:基于“症状——证候——治法——中药”逻辑设计知识推理规则,根据病例症状进行症状与证候、治法、中药的匹配;
[0027]S4.4:通过图数据库neo4j存储和可视化知识图谱。
[0028]与现有技术相比,本专利技术有以下有益效果:
[0029]本专利技术提出了一种高效的突发公共卫生事件中医诊疗知识图谱构建方法,能够对类似于国家中医药管理局发布的大量中医术语文本数据进行结构化转换和术语自动分层分类,从文本数据在提取中医术语的类别和层次关系,形成中医知识概念体系,解决了多源异构数据的融合和知识化问题,以病例症状为基本线索,通过知识推理和知识可视化,解决了医务工作者难以快速从多源数据中获取医疗知识的问题,为医务工作者进行病理诊断和对症治疗提供医疗知识和治法、中草药等治疗方案,有助于中医临床经验和知识在突发公共卫生事件医疗救治中的利用,进而促进突发公共卫生事件医疗救治能力的提升,并为智能辅助诊疗系统的研发与设计提供了参考方案。
附图说明
[0030]为了更清楚地说明本专利技术提出的技术方案及其实现效果,以下附图被用于促进对相关技术流程和实施结果的理解。
[0031]图1是本专利技术的基本方法流程图;
[0032]图2是本专利技术构建的知识图谱的基本概念模型图;
[0033]图3是本专利技术构建的知识图谱基本概念层次关系;
[0034]图4是本专利技术构建的知识图谱围绕病例症状的实体关系示例图。
具体实施方式
[0035]以下将结合实施例来说明本专利技术的具体实施方式,以此说明本专利技术如何通过智能技术手段解决多源异构数据背景下的医疗知识图谱构建问题和达到技术效果的实现过程。本专利技术以新冠肺炎为例,以中医术语为主要数据源,融合部分新冠肺炎主要症状、中医百科全书(ETCM)中的中草药数据,设计算法实现数据融合和知识表示。
[0036]实施例一:
[0037]如图1所示,一种面向突发公共卫生事件的中医诊疗知识图谱本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种面向突发公共卫生事件的中医诊疗知识图谱构建方法,其特征在于,包括以下步骤:S1:获取病例数据、中医临床诊疗术语、中草药数据;S2:对数据进行预处理、识别并整合病例症状、对中医术语文本进行结构化处理和术语自动分层分类;S3:设计知识图谱的概念模型;S4:基于提取的概念及其关系、概念模型自动构建知识图谱。2.根据权利要求1所述的面向突发公共卫生事件的中医诊疗知识图谱构建方法,其特征在于,所述步骤2包括如下步骤:S2.1:从多源数据中提取病例症状,并整合症状;其中,采用BiLSTM

CRF模型识别病例文本数据中的症状字符,与字典格式病例数据和文献中指明的症状合并;S2.2:根据段落和空行标志将中医术语文本分割,每个独立的文本块对应一个术语;将文本块中的句子作为字段,以最大的文本块字段数为所有文本块的字段长度,统一文本块长度,对术语文本块进行表格存储,完成术语文本数据的结构化;S2.3:根据文本块中术语分类号的长度对分类号进行分层,通过分类号与其上下层分类号的关系判断该术语为类或实例,确定分类号对应术语的类型、父类,完成中医术语的分层分类。3.根据权利要求2所述的面向突发公共卫生事件的中医诊疗知识图谱构建方法,其特征在于,所述步骤2.3包括以下步骤:S2.3.1:对于每一个文本块,统计其唯一的术语分类号的长度,将分类号长度作为其层数;S2.3.2:根据层数对分...

【专利技术属性】
技术研发人员:熊励王成文王后才
申请(专利权)人:上海大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1