一种推理规则自动发现方法及系统技术方案

技术编号:20007455 阅读:45 留言:0更新日期:2019-01-05 18:51
本发明专利技术提供一种推理规则自动发现方法及系统,该推理规则自动发现方法应用于医学知识库,所述医学知识库中包括多个医学知识,每一所述医学知识为两个医学实体和一医学关系的组合,所述方法包括:获取每一所述医学关系的关系矩阵,所述关系矩阵反映具有所述医学关系的医学实体的向量之间的关系;根据多个所述医学关系的关系矩阵,获取推理规则,获取的每一推理规则中包括第一医学关系、第二医学关系和第三医学关系,所述推理规则用于表示由所述第一医学关系和所述第二医学关系能够推理出所述第三医学关系。本发明专利技术能够自动发现医学知识库中的推理规则,不需要人工定义,节省了人力物力,降低了时间成本。

A Method and System for Automatic Discovery of Reasoning Rules

The invention provides a method and system for automatic discovery of reasoning rules, which is applied to medical knowledge base. The medical knowledge base includes multiple medical knowledge, each of which is a combination of two medical entities and a medical relationship. The method includes: acquiring the relationship matrix of each medical relationship, and the relationship matrix reflects that there is a medical relationship between two medical entities and a medical relationship. The relationship between vectors of medical entities of the medical relationship is described; the inference rules are obtained according to the relationship matrices of the medical relations. Each inference rule acquired includes the first medical relationship, the second medical relationship and the third medical relationship. The inference rules are used to express that the third medical relationship can be inferred from the first medical relationship and the second medical relationship. Department. The invention can automatically discover reasoning rules in medical knowledge base without manual definition, saves manpower and material resources, and reduces time cost.

【技术实现步骤摘要】
一种推理规则自动发现方法及系统
本专利技术涉及医学知识库数据挖掘
,尤其涉及一种推理规则自动发现方法及系统。
技术介绍
当今,生物医学文献的数量以指数级的速度增长,海量的数据给研究者们带来丰富信息的同时,也让研究者们难以发现不同文献之间的关联信息,从而失去发现一些重要知识的机会。例如,在生物医学领域,生物医学文献数据库MEDLINE中的论文已经超过二千万,同时每年也有几百万篇的论文加入到数据库中。阅读如此海量的文献对于医学研究者来说是相当困难的。因此,从医学文献中自动发现知识的方法受到广泛关注。然而,传统的医学知识自动发现方法需要人工定义推理规则。例如,人工定义推理规则“包含(A,B)^治疗(B,C)=>预防(A,C)”。则基于事实“金针菇含有朴菇素”和“朴菇素可以治疗癌症”,依据上面定义的推理规则,可以得出“金针菇可以预防癌症”。但是,目前医学领域包含的信息巨大,人工定义推理规则需要大量的时间和人力财力。
技术实现思路
有鉴于此,本专利技术提供一种推理规则自动发现方法及系统,能够自动发现医学知识库中的推理规则,不需要人工定义,节省了人力物力,降低了时间成本。为解决上本文档来自技高网...

【技术保护点】
1.一种推理规则自动发现方法,应用于医学知识库,所述医学知识库中包括多个医学知识,每一所述医学知识为两个医学实体和一医学关系的组合,其特征在于,所述方法包括:获取每一所述医学关系的关系矩阵,所述关系矩阵反映具有所述医学关系的医学实体的向量之间的关系;根据多个所述医学关系的关系矩阵,获取推理规则,获取的每一推理规则中包括第一医学关系、第二医学关系和第三医学关系,所述推理规则用于表示由所述第一医学关系和所述第二医学关系能够推理出所述第三医学关系。

【技术特征摘要】
1.一种推理规则自动发现方法,应用于医学知识库,所述医学知识库中包括多个医学知识,每一所述医学知识为两个医学实体和一医学关系的组合,其特征在于,所述方法包括:获取每一所述医学关系的关系矩阵,所述关系矩阵反映具有所述医学关系的医学实体的向量之间的关系;根据多个所述医学关系的关系矩阵,获取推理规则,获取的每一推理规则中包括第一医学关系、第二医学关系和第三医学关系,所述推理规则用于表示由所述第一医学关系和所述第二医学关系能够推理出所述第三医学关系。2.根据权利要求1所述的推理规则自动发现方法,其特征在于,所述获取每一所述医学关系的关系矩阵的步骤包括:针对每一医学关系,构建一初始的关系矩阵;获取所述医学知识库中的所述医学关系对应的医学知识作为正确医学知识;更换所述正确医学知识中的医学实体,得到新的医学知识作为错误医学知识;采用打分函数为所述正确医学知识和错误医学知识分别打分;采用预设目标函数,对所述初始的关系矩阵进行学习,使得所述正确医学知识的打分高于所述错误医学知识的打分,得到学习后的关系矩阵。3.根据权利要求2所述的推理规则自动发现方法,其特征在于,对所述初始的关系矩阵进行学习时,采用的所述正确医学知识和错误医学知识的个数差小于预设阈值。4.根据权利要求2所述的推理规则自动发现方法,其特征在于,所述更换所述正确医学知识中的医学实体,得到新的医学知识作为错误医学知识的步骤包括:采用未包含在所述医学关系对应的所有正确医学知识的医学实体,更换所述正确医学知识中的医学实体,得到新的医学知识作为错误医学知识。5.根据权利要求2所述的推理规则自动发现方法,其特征在于,所述获取每一所述医学关系的关系矩阵的步骤之前,还包括:获取每一所述医学实体的独热码向量xe;根据所述每一所述医学实体的独热码向量xe,获取每一所述医学实体的向量ye;其中,xe=(a1,…,ai,…,aN),N为所述医学知识库中的所有医学实体的个数,xe为N×1维的向量;ye=σ(Wxe),σ(x)=1/(1+ex),ye为K×1维的向量,W为映射矩阵,W为K×N维的向量,K为预定的数值,K小于N。6.根据权利要求5所述的推理规则自动发现方法,其特征在于,所述打分函数为:其中,r为所述医学关系,e1,e2为所述医学实体,r(e1,e2)为所述医学知识,Score(·)为打分函数。7.根据权利要求6所述的推理规则自动发现方法,其特征在于,所述预设目标函数为:其中,L为目标函数,T为所述正确医学知识集合,T′为所述错误医学知识集合,Me为所述医学关系r的关系矩阵。8.根据权利要求1所述的推理规则自动发现方法,其特征在于,所述根据所述医学关系的关系矩阵,获取推理规则的步骤包括:从所有医学关系中,选择多个医学关系组,构建多个待验证推理规则,其中,每一待验证推理规则对应一医学关系组,每一医学关系组包括三个医学关系;计算所述医学关系组中的其中两个医学关系的关系矩阵的乘积与另一个医学关系的关系矩阵的相似度;根据所述相似度,选择部分待验证推理规则作为最终得到的推理规则。9.根据权利要求8所述的推理规则自动发现方法,其特征在于,所述根据所述相似度,选择部分待验证推理规则作为最终得到的推理规则的步骤包括:将所有所述医学关系组对应的相似度进行排序,得到相似度最大的预设数目个待验证推理规则;将所述预设数目个待验证推理规则作为最终得到的推理规则。10.根据权利要求8或9所述的推理规则自动发现方法,其特征在于,每一医学关系组中的三个医学关系满足如下条件:(1)(2)(3)其中,Hp、Hq和Hr分别是医学关系组中的三个医学关系p、q和r对应的三元组中的所有第一个医学实体的集合,Lp、Lq和Lr分别是医学关系组中的三个医学关系p、q和r对应的三元组中的所有第二个医学实体的集合。11.根据权利要求8或9所述的推理规则自动发现方法,其特征在于,所述计算所述医学关系组中的其中两个医学关系的关系矩阵的乘积与另一个医学关系的关系矩阵的相似度的步骤包括:计算所述医学关系组中的其中两个...

【专利技术属性】
技术研发人员:张振中
申请(专利权)人:京东方科技集团股份有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1