一种基于知识图谱的问答方法技术

技术编号：38595882 阅读：11 留言：0更新日期：2023-08-26 23:32

一种基于知识图谱的问答方法，包括以下步骤：采集相关领域的问答语料和领域知识，进行预处理，构建好知识库和问答训练库；利用训练库进行特征融合训练，捕捉问题特征，识别出提问问题中的关键实体；基于识别出的关键实体进行知识推理，在知识推理过程中为了处理可能会遇到的较为复杂的提问，提出一种基于卷积推理的多跳知识图谱问答算法，在问答系统最终的答案推理部分利用一种全新的组合嵌入向量提取方法，通过组合嵌入向量和候选实体嵌入向量之间的相似度计算作为答案推理的评分依据来构建评分函数最终确定问题的答案。本发明专利技术依据知识库中已有的实体关系进行延伸，能够回答较为复杂的自然语言问题。复杂的自然语言问题。复杂的自然语言问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于知识图谱的问答方法

[0001]本专利技术涉及人工智能
，具体涉及一种基于知识图谱的问答方法。

技术介绍

[0002]知识图谱问答算法是一种基于人工智能和自然语言处理技术的智能问答系统，旨在帮助用户在知识图谱上提出问题，并给出准确的答案。多跳知识图谱问答算法是一种能够回答关于实体之间复杂关系的自然语言问题的算法。知识图谱问答是利用整理在知识图谱中的领域数据作为问答库进行智能问答的技术，它通过在知识图谱中整理好的知识的基础上进行推理来回答给定的问题，并利用知识图谱中的三元组来获取答案。传统的问答系统一般基于检索或基于模板，其缺点是对于复杂问题的处理能力弱。

技术实现思路

[0003]本专利技术要克服现有技术的上述缺点，提供一种基于知识图谱的问答方法。本专利技术利用多跳知识图谱问答算法能够自动推理并获取多个实体之间的关系，从而回答复杂的自然语言问题。
[0004]一种基于知识图谱的问答方法，包括以下步骤：
[0005]S1.采集相关领域的问答语料和领域知识，进行预处理，构建好知识库和问答训练库。
[0006]S2.利用训练库进行特征融合训练，捕捉问题特征，识别出提问问题中的关键实体。
[0007]S3.基于识别出的关键实体进行知识推理，在知识推理过程中为了处理可能会遇到的较为复杂的提问，提出一种基于卷积推理的多跳知识图谱问答算法，在问答系统最终的答案推理部分利用一种全新的组合嵌入向量提取方法，通过组合嵌入向量和候选实体嵌入向量之间的相似度计算作为答案推理的评分...

【技术保护点】

【技术特征摘要】
1.一种基于知识图谱的问答方法，包括以下步骤：S1.采集相关领域的问答语料和领域知识，进行预处理，构建好知识库和问答训练库；S2.利用训练库进行特征融合训练，捕捉问题特征，识别出提问问题中的关键实体；S3.基于识别出的关键实体进行知识推理，在知识推理过程中为了处理可能会遇到的较为复杂的提问，提出一种基于卷积推理的多跳知识图谱问答算法，在问答系统最终的答案推理部分利用一种全新的组合嵌入向量提取方法，通过组合嵌入向量和候选实体嵌入向量之间的相似度计算作为答案推理的评分依据来构建评分函数最终确定问题的答案。2.如权利要求1所述的一种基于知识图谱的问答方法，其特征在于：步骤S1具体包括：S1.1从领域专业网站获取数据获取问答数据；将依据从相关领域的专业网站上获取咨询对话作为训练语料帮助理解提问的问题；数据包括即为一组键值对，QS＝{<Q1,A1>,<Q2,A2>,<Q3,A3>...<Qn,An>},其中<Qi,Ai>就是一组相对应的问题和回答，将采集到的数据进行清洗，接着对用户提出的问题进行分类和标注，以便更好地理解和回答这些问题；S1.2数据预处理；对所获取的数据进行预处理，使用N
‑
gram模型得到获取的领域问答数据的字符级特征向量表示，通过Word2Vec将每个单词转换为低维向量，然后将这些向量组合成句子向量或段落向量，获取问题的语义级向量特征；S1.3构建领域知识图谱；从各种渠道收集领域相关的数据，对收集到的数据进行清洗、去重、标注等处理，使其符合建模要求；进行知识抽取，将相关的信息以三元组的形式存储；确定好知识图谱的构建规则，将知识存入数据库中。3.如权利要求1所述的一种基于知识图谱的问答方法，其特征在于：步骤S2具体包括：明确提问者的问题并提取出关键的信息；为了获取的问题中信息的质量所提出的问题信息模型，结合了单词的语义和字符特征，从而更好地描述了问题的特征，提取出问题中的关键实体；下面是详细步骤：S2.1特征融合问题中的单词与知识图谱中的关系词存在的语义相似性，准确地学习问题中与知识图谱相似的关系信息对于获得正确答案至关重要；因此，将步骤S1.2中获得的问题语义级特征和字符级特征进行融合，然后输入到LSTM语言模型中，此处所用向量需要进行归一化处理，以获得问题中单词的嵌入向量；使用两个LSTM模型，一个用于处理字符级输入，另一个用于处理语义级输入；这两个模型的输出将被连接起来，然后输入到一个全连接层中，以产生最终的融合表示；hz＝LSTMh(qy)+LSTMc(qz)<...

【专利技术属性】
技术研发人员：张鹏，季白杨，
申请(专利权)人：浙江工业大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人