The invention relates to a method for constructing a medical-oriented causality knowledge base. The steps include: the document unit can obtain numerous related documents containing multiple diseases and classify them into several document units to construct the original document library, so that the data unit can acquire the main feature parameters based on the document units and construct data sets based on the main feature parameters. The causal unit builds a Bayesian network based on the main characteristic parameters and data sets to analyze the average causal effect between diseases through data patterns, so that the knowledge unit can build a knowledge base based on the relevant literature to form the corresponding relationship of the average causal effect between diseases and between diseases.
【技术实现步骤摘要】
一种面向医学的因果关系知识库的构建方法和系统
本专利技术涉及医疗信息化
,尤其涉及一种面向医学的因果关系知识库的构建方法和系统。
技术介绍
在科学研究的过程中,文献是一种记录科研成果最具备说服力和信服力的载体。毫无疑义的说,文献中记录了科研活动的大部分的内容。大量的文献记载了病症之间的关联,但是医生需要查阅大量的文献去研究并病症之间的因果关系是十分的困难。如,在医学界,合并症和并发症均是在发生了一种疾病之后,跟随这种疾病发生了另外一种或者多种疾病。其中,合并症和并发症是一个复杂的临床医学概念。并发症指一种疾病在发展过程中引起另一种疾病或症状的发生;而合并症是指在诊疗护理过程中,病人由患一种疾病合并发生了与这种疾病有关的另一种或几种疾病。在医学界,医学研究强调的是因果关系而不是关联关系。而在合并症和并发症症之间,并发症与原发疾病之间有因果关系,而合并症与主要疾病之间无因果关系。因此,医生能够从众多文献中找到病症之间的是否为因果关系是需要解决的技术问题。例如,公开号为CN107145712A的中国专利公开的一种合并症与并发症的病历统计分析系统。该系统包括诊断代码维护单元、病历计数单元、2×2交叉分类资料的卡方检验单元以及报表生成单元,维护各个ID与诊断之间的映射关系,并建立诊断ID诊断统计表;其中,诊断ID统计表的纵列对应病历首页出院诊断中的其他诊断;再通过数据接口导入医院历史病历k份,根据诊断ID统计表,将病历出院诊断中的主要诊断和其他诊断转换为ID诊断,然后通过2×2交叉分类资料的卡方检验计算出与主要诊断与各种诊断对应的卡方值,并进行排序,如此,能够 ...
【技术保护点】
1.一种面向医学的因果关系知识库的构建系统,包括:文献单元(1):用于构建原始文献库;数据单元(2):用于构建数据集;因果单元(3):用于计算病症之间的平均因果效应;知识单元(4):用于存储所述原始文献库、所述数据集和/或所述平均因果效应以构建能够读取和/或显示的所述知识库,其特征在于,所述文献单元(1)能够获取众多含有多种病症的相关文献并对其进行分类形成若干文献单元体以构建原始文献库,以使得所述数据单元(2)能够基于所述文献单元体获取主要特征参数并基于所述主要特征参数构建数据集,所述因果单元(3)基于所述主要特征参数和所述数据集构建贝叶斯网络,以通过数据模式分析病症之间的平均因果效应,从而所述知识单元(4)能够基于所述相关文献以形成所述病症之间的所述平均因果效应的对应关系的方式构建所述知识库。
【技术特征摘要】
1.一种面向医学的因果关系知识库的构建系统,包括:文献单元(1):用于构建原始文献库;数据单元(2):用于构建数据集;因果单元(3):用于计算病症之间的平均因果效应;知识单元(4):用于存储所述原始文献库、所述数据集和/或所述平均因果效应以构建能够读取和/或显示的所述知识库,其特征在于,所述文献单元(1)能够获取众多含有多种病症的相关文献并对其进行分类形成若干文献单元体以构建原始文献库,以使得所述数据单元(2)能够基于所述文献单元体获取主要特征参数并基于所述主要特征参数构建数据集,所述因果单元(3)基于所述主要特征参数和所述数据集构建贝叶斯网络,以通过数据模式分析病症之间的平均因果效应,从而所述知识单元(4)能够基于所述相关文献以形成所述病症之间的所述平均因果效应的对应关系的方式构建所述知识库。2.如权利要求1所述的构建系统,其特征在于,所述文献单元(1)被配置于用于统计每一个文献中单词/词组的频率,按照独立性假设获取所述单词/所述词组的联合出现概率;所述文献单元(1)计算所述单词/所述词组的关联性强度,并基于所述关联性强度修正所述联合出现概率以获取该文献的关联约化坐标;所述文献单元(1)所述文献单元(1)构建所述文献的关联约化坐标,并基于全部的所述相关文献的所述关联约化坐标和所述关联性强度构建的分类函数将所述相关文献按照迭代算法的形式进行分类以形成若干所述文献单元体;其中,所述分类函数能够基于所述相关文献的样本量进行深度学习,从而增强所述文献单元(1)的精度。3.如权利要求1或2所述的构建系统,其特征在于,在所述数据单元(2)获取了所述文献单元体的情况下,所述数据单元(2)被配置于按照病症对配对的方式获取所述数据集:所述数据单元(2)对每一个所述相关文献以自然语言处理的句法分析方式提取其中病症对之间的关系,用以建立所述病症对的关系知识库,所述病症对之间的关系包括正向关系、反向关系和垂直关系;并且,所述数据单元(2)基于关系知识表在所述文献单元体内对包含有所述病症对的文献进行检索以融合的方式获取所述病症对的关系信度值用以建立所述病症对的关系信度值库,所述病症对之间的关系包括正向关系信度值、反向关系信度值和垂直关系信度值;从而,所述数据单元(2)基于对所有病症之间按照两两配对的方式建立的所述关系知识库和关系信度值库构建所述数据集。4.如前述权利要求之一所述的构建系统,其特征在于,所述因果单元(3)被配置于按照如下方式构建贝叶斯网络,S31:基于所述关系知识库构建贝叶斯网络评价函数:logP(G,D,KL)=logP(G)+log(D|G)+logP(KL|G)S32:基于所述关系知识库构建无向图结构约束;对所述数据集D,对所述数据集D中的任意病症对Lm和Ln,通过检索病症对所述关系知识库获得属性对Lm和Ln的病症对编号,根据所述病症对编号检索文献中病症对Lm和Ln关系信度值表中的Lm→Ln的关系信度值和Ln→Lm的关系信度值,S33:基于所述贝叶斯网络评价函数和所述无向图结构约束构建贝叶斯网络。5.如前述权利要求之一所述的构建系统,其特征在于,所述因果单元(3)被配置于基于所述贝叶斯网络和Pearl原理计算各病症对之间的平均因果效应,在所述平均因果效应超过设定的因果效应阈值时,病症之间构成并发症;在所述平均因果效应不超过设定的因果效应阈值时,病症之间构成合并症。6.如前述权利要求之一所述的构建系统,其特征在于,对于病症Lm,通过遍历...
【专利技术属性】
技术研发人员:杨矫云,江思源,吉品,安宁,
申请(专利权)人:合肥工业大学,
类型:发明
国别省市:安徽,34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。