【技术实现步骤摘要】
一种医学知识表示的生成方法和装置
[0001]本公开涉及医学知识表示
,尤其涉及一种医学知识表示的生成方法和装置。
技术介绍
[0002]通常,针对稳定性冠心病、心力衰竭、高血压等心血管慢病的诊断,涉及医学知识面广泛、推理链比较程长,需要融合患者高维的基线信息,如性别、年龄、病史、职业、生活习惯等,以及体格检查、影像学检查、实验室检验等诊断指标结果知识。此外,临床疾病推理环节通常也是错综复杂,往往需要多角度多步长的反复验证和疾病鉴别。
[0003]可以理解的是,知识表示学习是通过机器学习将研究对象的语义信息表示为稠密低维实值向量,在许多下游自然语言处理任务中起着不可或缺的作用,典型应用主要包括知识相似度计算、知识图谱补全、知识语义搜索等。
[0004]目前的医学知识表示通常是基于单步长或者单实体节点的向量表示,无法考虑足够的医学语义信息,并且遇见未在词表中的医学实体名词则无法进行向量嵌入表示。
技术实现思路
[0005]为了解决上述技术问题或者至少部分地解决上述技术问题,本公开提供了一种 ...
【技术保护点】
【技术特征摘要】
1.一种医学知识表示的生成方法,其特征在于,获取医学知识图谱数据集;基于所述医学知识图谱数据集,获取单步路径三元组集和实体的描述文本数据;其中,所述实体包括头实体和尾实体;基于所述实体的描述文本数据和所述单步路径三元组集,获取实体的初始描述信息存储在所述单步路径三元组集;获取所述单步路径三元组集中每个单步路径三元组对应的多跳路径三元组集合;所有所述单步路径三元组和对应的多跳路径三元组进行合并为正样本集合,并对所述正样本集合进行处理得到负样本集合;通过预设损失函数将所述正样本集合和所述负样本集合输入神经网络进行训练,获取医学知识表示学习模型,以获取待处理实体和待处理尾实体输入所述医学知识表示学习模型,生成医学知识表示。2.根据权利要求1所述的医学知识表示的生成方法,其特征在于,所述基于所述知识图谱数据集获取单步路径三元组集,包括:针对所述知识图谱数据集中的每个头实体,遍历所有单步关系获取对应的尾实体,组成直接关系三元组实体对;存储所述直接关系三元组实体对、头尾实体和路径概率信息。3.根据权利要求1所述的医学知识表示的生成方法,其特征在于,所述获取实体的描述文本数据,包括:获取每一个实体的描述文本;对所述描述文本进行关键词抽取,获取目标数值关键词作为实体的描述文本数据。4.根据权利要求1所述的医学知识表示的生成方法,其特征在于,所述获取所述单步路径三元组集中每个单步路径三元组对应的多跳路径三元组集合,包括:基于所述单步路径三元组集,针对每个第一单步路径三元组,遍历检索所有头实体与所述第一单步路径三元组的尾实体相同的第二单步路径三元组进行组合,生成二步路径三元组集;针对所述二步路径三元组集中的每个第一两步路径三元组,遍历所有头实体与所述第一两步路径三元组尾实体相同的第二两步路径三元组进行组合,生成三步路径三元组集;根据所述单步路径三元组集,针对每个单步路径三元组,遍历检索所述二步路径三元组集、所述三步路径三元组集中头实体和尾实体都对应与单步路径三元组头、尾实体相同的多跳路径,生成对应的多跳路径三元组集合进行存储。5.根据权利要求1所述的医学知识表示的生成方法,其特征在于,还包括:获取医学知识中的头实体和尾实体;获取所述头实体的第一头向量和所述尾实体的第一尾向量;基于所述头实体的描述文本获取所述头实体的第二头向量,以及基于所述尾实体的描述文本获取所述尾实体的第二尾向量;基于所述头实体和所述尾实体的直接关系路径向量、所述第一头向量、所述第二头向量、所述第一尾向量和所述第二尾向量,得到直接关系三元组的直接关系得分。6.根据权利要求5所述的医学知识表...
【专利技术属性】
技术研发人员:王欣梅,李瑞瑞,李爽,赵伟,
申请(专利权)人:北京富通东方科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。