一种基于深度学习与知识图谱的糖尿病问答方法技术

技术编号：37971362 阅读：24 留言：0更新日期：2023-06-30 09:46

本发明专利技术公开了一种基于深度学习与知识图谱的糖尿病问答方法。涉及知识问答领域，该方法利用知识图谱嵌入学习将知识图谱转化为连续空间中的低维向量，将问句输入到实体关系表示学习模型，获取头部实体和关系在知识图谱嵌入空间中的表示向量。根据头部实体检测模型学习到问题中蕴含的头部实体名称，搜索整个知识图谱构建候选三元组集合。对于候选集合中的所有三元组，根据联合距离计算找到最小距离的事实三元组，根据三元组中的头部实体和关系查找问题的答案，测试结果表明所提出的糖尿病问答方法有效地提升糖尿病知识问答的准确率。方法有效地提升糖尿病知识问答的准确率。方法有效地提升糖尿病知识问答的准确率。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度学习与知识图谱的糖尿病问答方法

[0001]本专利技术涉及知识问答领域，尤其涉及一种基于深度学习与知识图谱的糖尿病问答方法。

技术介绍

[0002]智能问答系统相较于传统的搜索引擎更加智能，能够直接提供精准的信息。在人工智能的时代，人们希望能够以简单的交互方式和机器沟通。智能问答系统就是以自然语言为交互方式的信息服务系统。系统先通过理解用户提出的自然语言问句，之后从互联网庞大的数据中抽取相关的信息，最终直接返回一个准确的答案。最初的技术主要利用信息检索在存储的数据中获取答案，由于早期技术研究落后以及数据规模的局限，还无法直接得到准确的答案。近些年来，随着知识图谱领域的发展，智能问答领域开启了新的路线，KG为实现更加智能的问答系统提供了强有力的支持。
[0003]随着自然语言处理技术的发展，开始引入深度学习研究更加智能且更具扩展性的知识图谱问答，为智能问答系统提供更强力的支撑。深度学习带来了更加智能的自然语言理解方法。然而，由于复杂的文本结构和语义模糊性，要实现基于深度学习模型自动提取知识单元并保证准确性存...

【技术保护点】

【技术特征摘要】
1.一种基于深度学习与知识图谱的糖尿病问答方法，其特征在于，所述方法包括以下步骤：步骤一：利用实体/关系表示学习模型从问句中预测得到实体/关系表示；步骤二：对问句进行头部实体检测模型，得到头部实体；步骤三：根据检测的头部实体在知识图谱嵌入TransR中生成候选集合；步骤四：对于候选集合中的每个三元组，计算联合距离；步骤五：根据联合距离结果，选择距离最小的三元组作为结果；步骤六：依据三元组的头部实体和关系得到答案。2.根据权利要求1所述的一种基于深度学习与知识图谱的糖尿病问答方法，其特征在于，步骤一中所述对实体关系表示学习包括以下步骤：步骤一：使用BERT模型编码字符级向量，使用树形LSTM编码单词级向量。步骤二：采用局部注意力机制，注意力权值的数值根据节点与最终学习的表示的关联性决定。q
j
＝tanh(w
T
[x
j
；h
j
]+b
q
)
ꢀꢀ
(2)步骤三：将注意力权重应用到隐藏状态上，将其与单词嵌入链接，得到隐藏状态，然后接入一层全连接层，将其结果取平均作为目标向量；3.根据权利要求1所述的一种基于深度学习与知识图谱的糖尿病问答方法，其特征在于，步骤二中所述利用头部实体检测模型对问句进行头部实体检测包括以下步骤：步骤一：将给定的自然语言问句作为输入序列传入预训练语言模型BERT中，学习文本序列中的语义信息得到字符级别的嵌入向量；步骤二：将预训练语言模型层得到的嵌入作为双向GRU层的输入；步骤三：将双向GRU层得到的输出通过注意力机制为文本序列中每个单词计算其权重参数，最后加权计算获取新的序列表示输出；步骤四：采用CRF模型通过自动学习输入序列标签中存在的客观约束，为最终序列标注结果提供约束条件，提高结果的准确率。4.根据权利要求1所述的一种基于深度学习与知识图谱的糖尿病问答方法，其特征在于，步骤三中所述采用transR方法将知识图谱转化为知识图谱嵌入包括以下步骤：步骤一：根...

【专利技术属性】
技术研发人员：钱景辉，贺尔欣，杨小健，
申请(专利权)人：南京工业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人