【技术实现步骤摘要】
一种知识对话生成中主题驱动的知识选择方法
[0001]本专利技术涉及自然语言处理以及对话系统
,具体为一种知识对话生成中主题驱动的知识选择方法。
技术介绍
[0002]开放域对话生成系统显示出巨大的潜力,可以赋予机器使用自然语言与人类对话的能力。然而,在许多真实场景中,响应生成的性能仍然远远不能令人满意。例如,在对话系统中,仅以输入文本为条件,文本生成系统通常会产生由语料库中的频繁单词或短语组成的一般或无意义的反应,例如对于给定的输入文本,“我的皮肤太干了”它通常会生成“我也是”或者“哦,我的上帝!”与蕴含丰富知识的人类回复相比,这些回复缺乏有意义的内容。一般或无意义的回复通常是由机器和人类之间的常识知识差距引起的。常识知识提供了上下文中概念之间关系的信息,从而潜在地指导人类捕捉概念之间的隐含逻辑。这样,真实对话中的人类通常会将上下文与他们的常识知识联系起来,做出信息量丰富的回复。为了解决这个问题,研究人员引入了一些大规模的知识库来增强对话生成的结果。许多知识语料库也极大地推进了这一研究主题的发展。知识的形式可以是非结构化的知识文本、结构化的知识图谱或它们的混合表示。
[0003]以知识为基础的对话生成旨在基于话语语境和外部知识生成信息丰富的回复。它主要致力于解决两个研究问题:(1)知识选择:根据对话上下文和之前选择的知识选择合适的知识;(2)知识感知生成:注入所需的知识以生成有意义和信息丰富的回复。选择合适的知识是基于知识的对话系统成功的先决条件。现有的知识选择模型一般分为两类。第一类是非顺序选择,它 ...
【技术保护点】
【技术特征摘要】
1.一种知识对话生成中主题驱动的知识选择方法,其特征在于,包括以下步骤:(1)构建融合主题信息的上下文编码器与知识编码器上下文编码器和知识编码器用于提取训练语料中第t轮对话的上下文信息x
t
,真实回复信息y
t
,主题信息f
t
和外部知识信息k
t
;它不仅充分利用大量数据预训练的优势,还通过双向注意力机制将主题信息和上下文信息进行融合编码得到(2)构建主题驱动的知识选择器主题驱动的知识选择器的主要目的是根据主题信息和上下文信息从候选知识句子中选择出合适的知识;为了选择更合适的知识,我们构建的知识选择器还关注先前轮选择的知识信息并将其建模为潜在变量,从而对多轮知识选择和回复生成进行联合推理;具体来说,给定编码的主题信息f
t
、上下文信息x
t
、外部知识信息k
t
、先前选择的知识和真实回复信息y
t
,知识选择器将充分利用这些信息选择合适的(3)构建知识感知生成解码器知识感知生成解码器的主要目的是根据知识选择器选择出的知识信息上下文信息x
t
和主题信息f
t
生成第t轮对话的真实回复信息y
t
;步骤(1)中,在训练语料中的每段对话由上下文,回复和给定的知识信息构成;其中,每段对话中的上下文信息表示为其中,每段对话中的上下文信息表示为表示对话上下文信息中的第i个单词;每段对话中的真实回复信息表示为第i个单词;每段对话中的真实回复信息表示为表示回复信息中的第j个单词;候选知识信息表示为首先,上下文编码器和知识编码器由基于transformer的bert编码器组成,它由N层多头注意力机制和前馈神经网络构成;它将上下文信息x
t
,外部知识信息k
t
和真实回复信息y
t
分别与主题信息f
t
进行编码得到相应的输出,具体计算公式如下所示:相应的输出,具体计算公式如下所示:相应的输出,具体计算公式如下所示:相应的输出,具体计算公式如下所示:2.根据权利要求1所述一种知识对话生成中主题驱动的知识选择方法,其特征在于,步骤(2)中,知识选择模块的主要目标是根据主题信息和上下文信息从候选知识句子中选择合适的知识,关注先前选择的知识信息,将其建模为潜在变量,从而对多轮知识选择和响应生成进行联合推理;具体来说,给定编码的主题信息f
t
、上下文信息x
t
、外部知识信息k
t
、先前选择的知识和仅在训练阶段的真实响应y
t
,知识选择方法将充分利用这些信息选择合适的在训练阶段,真实回复信息y
t
被用于伪标签来帮助选择合适的知识信息,此时知识的选择基于后验分布,表示为
其...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。