【技术实现步骤摘要】
一种面向对象的端到端对话生成方法、系统和介质
[0001]本专利技术涉及对话生成的
,具体涉及一种面向对象的端到端对话生成方法、系统和介质。
技术介绍
[0002]近年来,人工智能及相关产业正迅速发展壮大,成为学术界、工业界以及世界各国政府关注的焦点。面向任务的对话系统已经成为一个越来越重要的研究领域,它需要理解人类的意图并通过自然语言生成正确的答案来完成指定的任务。具体来说,在对话系统中,对话话语和知识库是输入,相应的预测响应是通过理解对话历史、查询知识库和解释查询结果的输出。
[0003]现有的对话系统在知识融合方面存在一些问题,在给定上下文和知识库的情况下,系统回复不但要符合人类语言习惯,还应该涵盖正确的知识。现有的对话系统通常基于复制集支实现融合知识到对话生成,然而复制机制依赖于门来控制单词的分布,由于缺少明确的监督信息,容易使模型的效果次优。
技术实现思路
[0004]本专利技术的主要目的在于克服现有技术的缺点与不足,提供一种面向对象的端到端对话生成方法、系统和介质,本方法不依赖于特定 ...
【技术保护点】
【技术特征摘要】
1.一种面向对象的端到端对话生成方法,其特征在于,包括下述步骤:以三元组的形式组成知识图,并获取历史对话信息;将历史对话信息进行分层编码以生成上下文对话表示;结合历史对话信息获得知识图中每个实体表示;通过双重注意力解码器将上下文对话表示和知识图的实体表示连接起来生成最终的系统响应。2.根据权利要求1所述一种面向对象的端到端对话生成方法,其特征在于,所述以三元组的形式组成知识图,表示为:G=(h,r,t)其中,(h,t)∈ε,r∈R,ε表示知识图中的实体集合,R表示知识图中的关系集合。3.根据权利要求1所述一种面向对象的端到端对话生成方法,其特征在于,所述历史对话信息表示为:{(U1,S1),(U2,S2),
…
,(U
t
,S
t
)}其中,t表示对话轮数;U
t
表示用户的第t轮对话信息,S
t
表示系统的第t轮对话信息。4.根据权利要求1所述一种面向对象的端到端对话生成方法,其特征在于,所述将历史对话信息进行分层编码以生成上下文对话表示,具体为:将历史对话信息通过双向门控循环单元获得历史对话信息的历史隐藏表示,公式为:其中,表示第i轮历史对话中第T
i
个词汇的隐藏表示,T
i
表示第i轮历史对话中的词汇数目,BiGRU()表示双向门控循环单元,表示第i轮历史对话中的第t个词的向量表示,w
i,t
表示第i轮历史对话中的第t个词;对历史对话信息的历史隐藏表示进行自注意力计算,得到历史对话的注意力表示,公式为:u
i,t
=tanh(W
w
h
i,t
+b
w
))其中,u
i,t
表示第i轮历史对话中第t个词汇的向量相似度,a
i,t
表示第i轮历史对话中第t个词汇归一化处理后得到的注意力分数,T表示向量转置,h
i,t
表示第i轮历史对话中第t个词汇的隐藏表示,s
i
表示第i轮历史对话的注意力表示,W
w
,b
w
和u
w
都是训练的模型参数;将历史对话的注意力表示s
i
通过门控循环单元,得到聚合后的上下文对话表示:H=h1,
…
,h
L
=GRU(s
i
),i∈[1,L]其中,L分别表示句子个数,h
L
表示第L个句子的上下文对话表示,GRU()表示门控循环单元。5.根据权利要求4所述一种面向对象的端到端对话生成方法,其特征在于,所述结合历史对话信息获得知识图中每个实体表示,具体为:
使用对齐函数计算知识图中每一实体和历史对话信息中对话词汇的相似分数,得到中间表示,公式为:间表示,公式为:间表示,公式为:其中,表示使用对齐函数计算得到的中间表示,e表示某一实体的向量表示,W
e
,b
e
和u
e
都是训练的模型参数,[;]表示的是拼接操作;将知识图中的实体集合传递给门控循环单元,顺序处理整个中间表示以获得历史感知实体表示,公式为:其中,f
L,j
表示知识图中第j个实体在历史对话信息中第L个句子中的表示,e
j
表示知识图中第j个实体的向量表示,表示使用...
【专利技术属性】
技术研发人员:陈健,吴庆耀,薛志翔,谢方圆,
申请(专利权)人:华南理工大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。