【技术实现步骤摘要】
基于QA知识库推理的多轮对话回复选择方法、系统
本专利技术属于自然语言处理
,具体涉及一种基于QA知识库推理的多轮对话回复选择方法、系统。
技术介绍
随着人工智能的快速发展,特别是近年来随着深度学习技术、自然语言处理技术和人工构造的知识库规模的扩大,人机对话系统在智能家居、智能助理以及智能客服等领域得到了长足发展,而用户对于聊天内容的质量要求也越来越高。目前的聊天机器人,根据回复语句生成策略的不同可分为生成式方法和检索式方法。相比于生成式方法,基于检索式的方法有如下优点:1)模型实现比较简单;2)由于回复的语句都是从数据库中提取的,回复句子自然,符合语法规范;3)可以很容易地扩展新的对话知识。但是目前检索式方法都是利用用户的输入语句来检索答案的,没有考虑当前对话的上下文信息,这就导致很有可能产生错误的回复,大大降低了对话系统的鲁棒性。为了提高回复语句的质量,增强用户体验,如何构建带上下文信息的QA知识库以及如何有效利用当前对话的上下文信息是一个非常值得研究的课题。
技术实现思路
为了解决现有技术中的上述问题,即为了解决现有回复语句生产方法鲁棒性不足的问题,本专利 ...
【技术保护点】
1.一种基于QA知识库推理的多轮对话回复选择方法,其特征在于,包括以下步骤:对当前多轮对话进行关键词提取,获取第一关键词组合;以所述第一关键词组合、当前输入作为问题,从QA知识库中检索出候选问题集合,并获取各候选问题相应的上下文,构建候选多轮对话集合;所述QA知识库基于预先获取的多轮对话数据集进行构建;计算所述当前输入与所述候选问题集合中各候选问题的语义相似度,作为对应的候选问题与当前输入的第一相似度;计算所述当前输入的上下文与所述候选问题集合中各候选问题上下文的语义相似度,作为对应的候选问题与当前输入的第二相似度;计算当前多轮对话的摘要信息与所述候选多轮对话集合中各候选多 ...
【技术特征摘要】
1.一种基于QA知识库推理的多轮对话回复选择方法,其特征在于,包括以下步骤:对当前多轮对话进行关键词提取,获取第一关键词组合;以所述第一关键词组合、当前输入作为问题,从QA知识库中检索出候选问题集合,并获取各候选问题相应的上下文,构建候选多轮对话集合;所述QA知识库基于预先获取的多轮对话数据集进行构建;计算所述当前输入与所述候选问题集合中各候选问题的语义相似度,作为对应的候选问题与当前输入的第一相似度;计算所述当前输入的上下文与所述候选问题集合中各候选问题上下文的语义相似度,作为对应的候选问题与当前输入的第二相似度;计算当前多轮对话的摘要信息与所述候选多轮对话集合中各候选多轮对话的摘要信息的相似度,作为对应的候选问题与当前输入的第三相似度;基于第一相似度、第二相似度、第三相似度,通过加权求和的方式计算得到候选问题集合中各候选问题与当前输入的相似度,选取相似度最大的候选问题对应的回复作为当前输入的回复。2.根据权利要求1所述的基于QA知识库推理的多轮对话回复选择方法,其特征在于,“对当前多轮对话进行关键词提取”,其方法为:对当前正在进行的多轮对话进行关键词抽取,并选取其中词性为名词和动词的关键词作为所提取的关键词。3.根据权利要求1所述的基于QA知识库推理的多轮对话回复选择方法,其特征在于,“构建候选多轮对话集合”,其方法为:根据所述第一关键词组合对QA知识库进行检索,获得包含所述第一关键词组合中关键词的多轮对话,作为第一多轮对话集合;根据当前输入对QA知识库进行检索,得到与当前输入最相似的N个候选句子及包含该句子的多轮对话,作为第二多轮对话集合;对第一多轮对话集合和第二多轮对话集合取交集,得到候选问题集合和候选多轮对话集。4.根据权利要求1所述的基于QA知识库推理的多轮对话回复选择方法,其特征在于,所述第二相似度,其计算方法为:通过循环神经网络获取当前输入的上下文的语境分布式表达,作为第一语境分布式表达;通过循环神经网络分别获取所述候选问题集合中各候选问题的上下文的语境分布式表达,作为第二语境分布式表达;分别计算所述第一语境分布式表达和所述第二语境分布式表达的相似度,作为对应的候选问题与当前输入的第二相似度。5.根据权利要求1所述的基于QA知识库推理的多轮对话回复选择方法,其特征在于,所述第三相似度,其计算方法为:对当前多轮对话进行摘要抽取,获得当前多轮对话的摘要信息;分别对所述候选多轮对话集合中各候选多轮对话进行摘要抽取,获得每个候选多轮对话的摘要信息;分别计算当前多轮对话的摘要信息与所述候选多轮对话集合中各候选多轮对话的摘要信息的相似度,作为对应的候选问题与当前输入的第三相似度。6...
【专利技术属性】
技术研发人员:向露,刘洋,周玉,宗成庆,
申请(专利权)人:中国科学院自动化研究所,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。