【技术实现步骤摘要】
一种面向糖尿病文本的知识图谱多跳推理方法
[0001]本专利技术属于医学文本信息数据处理
,特别涉及一种面向糖尿病文本的知识图谱多跳推理方法。
技术介绍
[0002]在医学领域,得益于信息化技术的快速发展和医疗信息系统的普及,医学数据库中积淀了海量的医学文本信息和临床诊断数据,尤其近年来人工智能快步发展和智能医疗精准医疗和医学辅助诊断的提出,知识图谱在医学领域逐渐引起重视。知识图谱能够有效挖掘﹑组织和管理大规模数据中的知识,提高知识信息服务质量,从而也可以在医学领域为医生和病人提供更智能化的服务。
[0003]基于知识图谱的医学知识推理目的主要是从现有的知识图谱数据中辨别出错误的医学知识数据并发掘推断出新的知识。通过医学知识推理,可以获得医学知识图谱中现有实体对间新的关系,然后反馈给医学知识图谱,从而能够扩展和补全现有医学知识图谱,为医学高级应用提供完备的医学知识支持。基于医学知识图谱广泛的现实应用和补全现有医学知识图谱不完整的缺陷需求,基于知识图谱的医学知识推理成为当前知识图谱和知识推理研究领域的热门问题。< ...
【技术保护点】
【技术特征摘要】
1.一种面向糖尿病文本的知识图谱多跳推理方法,其特征在于,包括以下步骤:步骤1、提取糖尿病文本知识图谱中的源实体、目标实体以及二者之间的关系,通过预训练将源实体、目标实体以及二者之间的关系向量化,对知识图谱三元组数据进行嵌入表示;步骤2、构建强化学习智能体,利用源实体当前查询关系和上一跳推理关系中最相似的关系与实体对扩充智能体的动作空间并通过智能体随机采样策略函数来获取智能体下一步动作;步骤3、提取源实体的实例路径集,归纳出实例路径集对应的元路径集,挖掘糖尿病文本知识图谱中的逻辑规则;步骤4、依据智能体命中目标实体时的命中奖励和智能体元路径符合逻辑规则时的规则奖励来计算智能体总奖励,通过最大化智能体总奖励的期望值来训练智能体的策略网络;步骤5、以提取的源实体和目标实体间的关系以及逻辑规则为基础,通过找到相应元路径与规则主体匹配的实例路径,以便预测实例路径的源实体和目标实体之间的新关系,并输出推理结果。2.根据权利要求1所述的一种面向糖尿病文本的知识图谱多跳推理方法,其特征在于,步骤1具体为:将糖尿病文本知识图谱表示为的形式,其中,表示实体集,表示关系集;假设每个实体都属于实体类型集中的唯一类型,由映射定义;知识图谱中的每条有向连接表示一个三元组;对于任何关系,用表示其对应的逆关系,即等价于;给定一个查询,其中,为源实体,为查询关系,?为需要查询或推理的结果即目标实体;智能体从源实体开始,不断选择一条当前实体的出边并跳转到下一个实体,直到它到达目标实体或它在上遍历的跳数满足预定义的最大步长。3.根据权利要求1所述的一种面向糖尿病文本的知识图谱多跳推理方法,其特征在于,步骤2中,构建的智能体的要素包括:状态、动作、奖励、策略网络和转移函数;其中,状态代表智能体当前所在节点嵌入表示,动作代表智能体在当前所在节点所有可能的下一步操作,奖励代表智能体采取动作后所获得的反馈,策略网络代表智能体依据节点状态、动作、奖励及转移函数进行强化学习的网络,转移函数代表状态经过智能体下一步动作后的转移结果;构建强化学习智能体时,第跳的状态为,其中,表示要查询的关系的嵌入表示,表示第跳到达实体的嵌入表示,表示第跳探索的路径历史信息;中的实体和关系,被表示为低维连续向量和,由关系向量和实体向量的拼接向量表示动作,为状态对应的所有动作组成的当前动作空间,动作空间由中的所有动作表示向量堆叠组成,状态中提到的历史路径由LSTM编码,
。4.根据权利要求3所述的一种面向糖尿病文本的知识图谱多跳推理方法,其特征在于,步骤2中,更新智能体动作空间时,假设查询三元组,智能体当前位于实体上,上一跳经过的推理关系为;首先计算关系集R中所有关系与和的相似度:,其中为关系集R中第i个关系向量。5.根据权利要求4所述的一种面向糖尿病文本的知识图谱多跳推理方法,其特征在于,步骤2中,通过...
【专利技术属性】
技术研发人员:郭永安,狄杰斯,钱琪杰,周沂,王宇翱,
申请(专利权)人:南京邮电大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。