一种基于文本、知识库及序列到序列的自然问答方法技术

技术编号:20221767 阅读:48 留言:0更新日期:2019-01-28 20:16
本发明专利技术具体涉及一种基于文本、知识库及序列到序列的自然问答方法,包括如下:S1:用户输入一个问题;S2:初始化模型;S3:序列到序列模型中的编码器对问题进行编码,得到上下文向量;S4:利用用户问题来对知识进行检索得到与问题相关的知识候选集;S5:利用解码器当前状态和问题上下文向量,来决定生产回答中词的来源;S6:将上下文向量输入解码器,用于生产常用词;S7:利用解码器当前状态和问题上下文,知识候选集来匹配最终知识实体;S8:迭代执行步骤S5‑S7,直至最终输出自然答案。本发明专利技术克服了现有不能有效查询知识和所需知识不存在、不能有效的回答多个知识实体的缺陷,完全采用生成式,大量减少了人工干预。

【技术实现步骤摘要】
一种基于文本、知识库及序列到序列的自然问答方法
本专利技术涉及自动问答领域,具体的涉及一种基于文本、知识库及序列到序列的自然问答方法。
技术介绍
自动问答技术是一种能够自动回答问题,可以计算出用户输入问题与问答库中的候选问答对之间的各种特征,例如,词频、逆向词频、空间向量模型等等。然后,利用问答排序模型,根据所计算出的特征、以及各种特征的权值,得出问题与候选答案之间的匹配度,再根据该匹配度对候选问答对进行排序,并将排名靠前的问答对返回给用户。对于自动问答技术,一个重要的评价指标就是回答答案中知识的匹配程度,比如一个问题是“西游记的作者是谁”,回答应该为:“西游记的作者是吴承恩”,在该例子中可以把吴承恩看作为一个知识实体。通用策略是指通过联合嵌入结构化知识库和文本的知识形成统一的结构化表示,允许信息的交错传播,实际上,通用策略是一个矩阵,每一行都是实体对,每一列是结构化三元组和非结构化文本关系。现有的通用策略是用于在知识群体的背景下做关系抽取。每一行都是一个实体对,每一列代表了它们之间的关系,可以为结构化知识库关系,也可以是文本之间存在的一种策略。现有的问答系统方法利用文本和结构化知识本文档来自技高网...

【技术保护点】
1.一种基于文本、知识库及序列到序列的自然问答方法,其特征在于,所述方法包括如下步骤:S1:用户输入一个问题;S2:根据当前对话历史和上一轮用户对话初始化模型;S3:序列到序列模型中的编码器对问题进行编码,得到上下文向量;S4:利用用户问题来对知识进行检索得到与问题相关的知识候选集;S5:利用解码器当前状态和问题上下文向量,来决定生产回答中词的来源;S6:将上下文向量输入解码器,用于生产常用词;S7:利用解码器当前状态和问题上下文,知识候选集来匹配最终知识实体;S8:迭代执行步骤S5‑S7,直至最终输出自然答案。

【技术特征摘要】
1.一种基于文本、知识库及序列到序列的自然问答方法,其特征在于,所述方法包括如下步骤:S1:用户输入一个问题;S2:根据当前对话历史和上一轮用户对话初始化模型;S3:序列到序列模型中的编码器对问题进行编码,得到上下文向量;S4:利用用户问题来对知识进行检索得到与问题相关的知识候选集;S5:利用解码器当前状态和问题上下文向量,来决定生产回答中词的来源;S6:将上下文向量输入解码器,用于生产常用词;S7:利用解码器当前状态和问题上下文,知识候选集来匹配最终知识实体;S8:迭代执行步骤S5-S7,直至最终输出自然答案。2.根据权利要求1所述的基于文本、知识库及序列到序列的自然问答方法,其特征在于,所述序列到序列模型包括解码器和编码器,所述编码器根据输入的前对话历史和上一轮用户对话进行编码,提取对话的特征,并将特征转变成上下文向量;所述编码器提取的上下文向量传输至解码器;所述解码器根据上下文向量生成新的序列。3.根据权利要求1所述的基于文本、知识库及序列到序列的自然问答方法,其特征在于,所述S3具体包括如下步骤:S3.1:编码器对当前问题编码,得到隐含向量和解码器当前隐含向量,并且计算相似度向量;S3.2:根据S3.1得到的相...

【专利技术属性】
技术研发人员:叶志豪廖朝辉蔡瑞初崔洪刚李卓章
申请(专利权)人:广东工业大学
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1