一种面向医学的因果关系知识库的构建方法和系统技术方案

技术编号:21202720 阅读:32 留言:0更新日期:2019-05-25 02:04
本发明专利技术涉及一种面向医学的因果关系知识库的构建方法,其步骤包括:文献单元能够获取众多含有多种病症的相关文献并对其进行分类形成若干文献单元体以构建原始文献库,以使得数据单元能够基于文献单元体获取主要特征参数并基于主要特征参数构建数据集,因果单元基于主要特征参数和数据集构建贝叶斯网络,以通过数据模式分析病症之间的平均因果效应,从而知识单元能够基于相关文献以形成病症之间及病症之间的平均因果效应的对应关系的方式构建知识库。

A Medical-Oriented Method and System for Constructing Causality Knowledge Base

The invention relates to a method for constructing a medical-oriented causality knowledge base. The steps include: the document unit can obtain numerous related documents containing multiple diseases and classify them into several document units to construct the original document library, so that the data unit can acquire the main feature parameters based on the document units and construct data sets based on the main feature parameters. The causal unit builds a Bayesian network based on the main characteristic parameters and data sets to analyze the average causal effect between diseases through data patterns, so that the knowledge unit can build a knowledge base based on the relevant literature to form the corresponding relationship of the average causal effect between diseases and between diseases.

【技术实现步骤摘要】
一种面向医学的因果关系知识库的构建方法和系统
本专利技术涉及医疗信息化
,尤其涉及一种面向医学的因果关系知识库的构建方法和系统。
技术介绍
在科学研究的过程中,文献是一种记录科研成果最具备说服力和信服力的载体。毫无疑义的说,文献中记录了科研活动的大部分的内容。大量的文献记载了病症之间的关联,但是医生需要查阅大量的文献去研究并病症之间的因果关系是十分的困难。如,在医学界,合并症和并发症均是在发生了一种疾病之后,跟随这种疾病发生了另外一种或者多种疾病。其中,合并症和并发症是一个复杂的临床医学概念。并发症指一种疾病在发展过程中引起另一种疾病或症状的发生;而合并症是指在诊疗护理过程中,病人由患一种疾病合并发生了与这种疾病有关的另一种或几种疾病。在医学界,医学研究强调的是因果关系而不是关联关系。而在合并症和并发症症之间,并发症与原发疾病之间有因果关系,而合并症与主要疾病之间无因果关系。因此,医生能够从众多文献中找到病症之间的是否为因果关系是需要解决的技术问题。例如,公开号为CN107145712A的中国专利公开的一种合并症与并发症的病历统计分析系统。该系统包括诊断代码维护单元、病历计数单元、2×2交叉分类资料的卡方检验单元以及报表生成单元,维护各个ID与诊断之间的映射关系,并建立诊断ID诊断统计表;其中,诊断ID统计表的纵列对应病历首页出院诊断中的其他诊断;再通过数据接口导入医院历史病历k份,根据诊断ID统计表,将病历出院诊断中的主要诊断和其他诊断转换为ID诊断,然后通过2×2交叉分类资料的卡方检验计算出与主要诊断与各种诊断对应的卡方值,并进行排序,如此,能够利用计算机高速运算迅速分析出与选定主要诊断可能有因果关系的合并症与并发症,达到速度更好的有益效果。例如,公开号为CN107799182A的中国专利公开的一种合并症及并发症影响因子的估算方法和电子设备。该方法通过优算算法求取影响因子向量,以使得诊断向量与影响因子向量的内积最为接近资源消耗水平参数,从而可以获取到一个诊断相关分组下的每一种合并症和并发症的出现是否或严重程度对于医疗资源消耗水平的影响权重。该影响权重可以精确地估计每一种合并症和并发症的出现与否或严重程度对于医疗资源消耗水平的影响。例如,公开号为CN106407686A的中国专利公开的一种评估慢性病费用建模方法。该方法首先通过样本筛选和特征选择,再采用回归模型,得到各影响因子对慢性疾病费用的影响。该专利技术能够直接量化出慢性病的并发症合并症对其资料费用的影响程度,为慢性并的医疗控费提供依据。例如,公开号为CN105046406A的中国专利公开的一种住院病人医疗管理质量评估方法,该方法包括:历史性数据筛选与建模;数据鉴别与清理;疾病诊断相关分组DRG和模型的归类;入院时ICD合并发症及其其他变量的归类集合;入院及合并发症变量的统计检验与筛选;数学建模的建立和质量验证;当前数据筛选与预值计算;计算病人入院的风险预测值,实现对每个入院病人在死亡率、住院天数和医疗成本的入院风险预测。该专利技术通过大数据分析、数学统计学和机器学习等方法实现了医疗数据从数据到解决方案的有效转化,实现了数据价值。解决了医疗数据之间不可比的难题,不仅能够实现病种之间的医疗质量评估,还可实现医生之间、医院科室之间、医院之间在住院病人疾病治疗管理的绩效合理性评价。例如,公开号为CN102542153B公开的一种引入生物辐射敏感性参数对正常组织并发症概率影响的方法。该方法基于简单正常组织器官模型,计算得到器官模型的剂量和生物有效剂量BED分布,归箱处理BED分布计算得到总生存分数SF,利用SF计算得到器官模型有效均匀剂量EUD,将NTCPLKB模型50%并发症对应的广义有效均匀剂量EUD,利用EUD模型中包含的多种辐射敏感性参数,引入辐射敏感性参数对正常组织并发症概率的影响。例如,公开号为CN106295187A的中国专利公开的一种面向智能临床辅助决策支持系统的知识库构建方法和系统,该方法包括获取输入信息,对所述输入信息进行分词处理、词性标注以及语法分析,获取关系依赖树、提取所述关系依赖树中的概念、实体、实体修饰语;并根据所述概念、所述实体、所述实体修饰语,通过关系语义定义规则,获取所述关系依赖树中各所述实体之间的关系;设置扩展三元组,通过所述扩展三元组将所述关系依赖树中各所述实体之间的关系进行存储,以完成构建知识库。该专利技术可用于临床实例多且特征多的情况,对于病历表述信息可实现灵活拓展。但是,该申请仅通过识别表达语义关系的短语来抽取实体之间的关系,并且关系侧重于相关关系,而相关关系不一定为因果关系,因此该专利所获取的因果关系不可靠。例如,公开号为CN106667443A的中国专利公开的一种先天性白内障术候并发症预测方法和系统。该方法通过临床信息获取预测因子;将预测因子通过朴素贝叶斯算法,得到预测结果;呈现预测结果;根据预测结果获取对应的随访信息,从而可以准确预测并发症的发生。通过以上的现有技术调研可以发现,对于病症之间是否构成合并症和并发症的现有技术远远不足,仅有的公开号为CN107145712A仅能通过简单的数理统计来进行判定,并且是以独立性假定来判定,仅仅能够说明病症之间的关联性,并不能说明病症之间的因果性,这不足以量化病症之间的因果关系。
技术实现思路
针对现有技术之不足,本专利技术提供了一种面向医学的因果关系知识库的构建方法,涉及一种基于文献检索的多种病症之间是否构成并发症或合并症的知识库的构建方法,其步骤包括:文献单元构建原始文献库;数据单元构建数据集;因果单元病症之间的因果关系;知识单元存储所述原始文献库、所述数据集和/或所述平均因果效应以构建能够读取和/或显示的所述知识库,以数据量化的形式提供给医疗工作者参考、学习和/或决策;所述文献单元能够获取众多含有多种病症的相关文献并对其进行分类形成若干文献单元体以构建原始文献库,以使得所述数据单元能够基于所述文献单元体获取主要特征参数并基于所述主要特征参数构建数据集,所述因果单元基于所述主要特征参数和所述数据集构建贝叶斯网络,以通过数据模式分析病症之间的平均因果效应,从而所述知识单元能够基于所述相关文献以形成所述病症之间及所述病症之间的所述平均因果效应的对应关系的方式构建所述知识库。本专利技术是通过将文献中记录的原始数据形成一种知识库,并不涉及疾病的诊断和治疗方法。根据一种优选的实施方式,所述相关文献分类按照如下方式进行:所述文献单元统计每一个文献中单词/词组的频率,按照独立性假设获取所述单词/所述词组的联合出现概率;所述文献单元计算所述单词/所述词组的关联性强度,并基于所述关联性强度修正所述联合出现概率以获取该文献的关联约化坐标;所述文献单元构建所述文献的关联约化坐标,并基于全部的所述相关文献的所述关联约化坐标和所述关联性强度构建的分类函数将所述相关文献按照迭代算法的形式进行分类以形成若干所述文献单元体;其中,所述分类函数能够基于所述相关文献的样本量进行深度学习,从而增强所述文献单元的精度。根据一种优选的实施方式,在所述数据单元获取了所述文献单元体的情况下,所述数据单元按照病症对配对的方式获取所述数据集;所述数据单元对每一个所述相关文献以自然语言处理的句法分析方式提取其中病症对之间的本文档来自技高网
...

【技术保护点】
1.一种面向医学的因果关系知识库的构建系统,包括:文献单元(1):用于构建原始文献库;数据单元(2):用于构建数据集;因果单元(3):用于计算病症之间的平均因果效应;知识单元(4):用于存储所述原始文献库、所述数据集和/或所述平均因果效应以构建能够读取和/或显示的所述知识库,其特征在于,所述文献单元(1)能够获取众多含有多种病症的相关文献并对其进行分类形成若干文献单元体以构建原始文献库,以使得所述数据单元(2)能够基于所述文献单元体获取主要特征参数并基于所述主要特征参数构建数据集,所述因果单元(3)基于所述主要特征参数和所述数据集构建贝叶斯网络,以通过数据模式分析病症之间的平均因果效应,从而所述知识单元(4)能够基于所述相关文献以形成所述病症之间的所述平均因果效应的对应关系的方式构建所述知识库。

【技术特征摘要】
1.一种面向医学的因果关系知识库的构建系统,包括:文献单元(1):用于构建原始文献库;数据单元(2):用于构建数据集;因果单元(3):用于计算病症之间的平均因果效应;知识单元(4):用于存储所述原始文献库、所述数据集和/或所述平均因果效应以构建能够读取和/或显示的所述知识库,其特征在于,所述文献单元(1)能够获取众多含有多种病症的相关文献并对其进行分类形成若干文献单元体以构建原始文献库,以使得所述数据单元(2)能够基于所述文献单元体获取主要特征参数并基于所述主要特征参数构建数据集,所述因果单元(3)基于所述主要特征参数和所述数据集构建贝叶斯网络,以通过数据模式分析病症之间的平均因果效应,从而所述知识单元(4)能够基于所述相关文献以形成所述病症之间的所述平均因果效应的对应关系的方式构建所述知识库。2.如权利要求1所述的构建系统,其特征在于,所述文献单元(1)被配置于用于统计每一个文献中单词/词组的频率,按照独立性假设获取所述单词/所述词组的联合出现概率;所述文献单元(1)计算所述单词/所述词组的关联性强度,并基于所述关联性强度修正所述联合出现概率以获取该文献的关联约化坐标;所述文献单元(1)所述文献单元(1)构建所述文献的关联约化坐标,并基于全部的所述相关文献的所述关联约化坐标和所述关联性强度构建的分类函数将所述相关文献按照迭代算法的形式进行分类以形成若干所述文献单元体;其中,所述分类函数能够基于所述相关文献的样本量进行深度学习,从而增强所述文献单元(1)的精度。3.如权利要求1或2所述的构建系统,其特征在于,在所述数据单元(2)获取了所述文献单元体的情况下,所述数据单元(2)被配置于按照病症对配对的方式获取所述数据集:所述数据单元(2)对每一个所述相关文献以自然语言处理的句法分析方式提取其中病症对之间的关系,用以建立所述病症对的关系知识库,所述病症对之间的关系包括正向关系、反向关系和垂直关系;并且,所述数据单元(2)基于关系知识表在所述文献单元体内对包含有所述病症对的文献进行检索以融合的方式获取所述病症对的关系信度值用以建立所述病症对的关系信度值库,所述病症对之间的关系包括正向关系信度值、反向关系信度值和垂直关系信度值;从而,所述数据单元(2)基于对所有病症之间按照两两配对的方式建立的所述关系知识库和关系信度值库构建所述数据集。4.如前述权利要求之一所述的构建系统,其特征在于,所述因果单元(3)被配置于按照如下方式构建贝叶斯网络,S31:基于所述关系知识库构建贝叶斯网络评价函数:logP(G,D,KL)=logP(G)+log(D|G)+logP(KL|G)S32:基于所述关系知识库构建无向图结构约束;对所述数据集D,对所述数据集D中的任意病症对Lm和Ln,通过检索病症对所述关系知识库获得属性对Lm和Ln的病症对编号,根据所述病症对编号检索文献中病症对Lm和Ln关系信度值表中的Lm→Ln的关系信度值和Ln→Lm的关系信度值,S33:基于所述贝叶斯网络评价函数和所述无向图结构约束构建贝叶斯网络。5.如前述权利要求之一所述的构建系统,其特征在于,所述因果单元(3)被配置于基于所述贝叶斯网络和Pearl原理计算各病症对之间的平均因果效应,在所述平均因果效应超过设定的因果效应阈值时,病症之间构成并发症;在所述平均因果效应不超过设定的因果效应阈值时,病症之间构成合并症。6.如前述权利要求之一所述的构建系统,其特征在于,对于病症Lm,通过遍历...

【专利技术属性】
技术研发人员:杨矫云江思源吉品安宁
申请(专利权)人:合肥工业大学
类型:发明
国别省市:安徽,34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1