当前位置: 首页 > 专利查询>苏州大学专利>正文

基于人物属性的知识增强对话生成方法及系统技术方案

技术编号:37851896 阅读:11 留言:0更新日期:2023-06-14 22:42
本发明专利技术公开了一种基于人物属性的知识增强对话生成方法及系统。本发明专利技术的基于人物属性的知识增强对话生成方法通过构建个性化知识图谱,将知识与人物属性结合起来,使得对话同时具备了理性和个性;同时,本发明专利技术将与人设的人物属性不同的知识当作对比学习的负例,具有一定的针对性,最终使得生成的对话更加合理,准确度更高,符合人设的人物属性。符合人设的人物属性。符合人设的人物属性。

【技术实现步骤摘要】
基于人物属性的知识增强对话生成方法及系统


[0001]本专利技术涉及人机对话
,尤其是指一种基于人物属性的知识增强对话生成方法及系统。

技术介绍

[0002]人机对话通过模拟人类并旨在与人类形成连贯通顺对话,使得人类能够用更自然的方式与机器进行交流。根据应用场景的不同,可以将人机对话分成两类,即任务型和非任务型对话。任务型对话主要面向垂直领域,需要特定领域的知识,目的是在有限的对话轮次内解决用户的需求,如智能客服、个人助理等。而非任务型对话一般面相的是开放领域,即闲聊,对话内容更为自由,要求其回复具有一致性、多样化和个性化。为了达到这些目的,一般会给系统设定特定的人设,并结合知识、个性(性别、地域等)等因素进行对话生成。
[0003]目前常见的对话系统还可以分为两种方式:检索式和生成式。
[0004]检索式对话系统是根据对话历史和当前用户话语选择最合适的系统回复来与用户进行对话的系统。顾名思义,检索式对话系统的任务就是在大量的候选回复中选择一个最佳的回复反馈给用户。
[0005]生成式对话系统通常是基于深度学习的技术,使用Encoder(编码器)

Decoder架构来完成,不依赖于特定的答案库或模板,而依据从大量语料中习得的语言能力来进行对话,根据问题内容直接生成回答。
[0006]其中,检索式对话系统虽然不需要定义结构化的领域本体,减少人工;避免了困难的语言生成问题;回复选择模型的输出更方便进行约束和组合等。但是,想要将对话系统应用于新的领域就需要足够多的域内数据来训练回复选择模型,获取这样的数据代价高昂且数据集的规模非常有限。尽管检索式对话系统非常有吸引力,它仍然面临数据短缺的问题,且回复较为单一。
[0007]虽然生成式对话系统便于和理性、个性等因素结合,但是当前的对话系统大多只考虑其中一个因素,而忽略其他因素,例如基于知识增强的对话系统在选取相关知识时,往往只会选择普遍共识的知识,并没有考虑到知识选择的个性化,例如当提到“高兴”时,女生也许会想到“花”,“男友”等,而男生想到的则是“游戏”,“女友”等。
[0008]综上所述,以往的知识选择方法只关注知识和对话上下文之间的相关性,而忽略了对话者个性,如性别、地域等对外部知识选择的影响。如果不考虑个性化问题,就会导致很难选择合适的知识,且生成的回复与人设不一致。同时,以往的对比学习在对话生成中的应用,在选择负例时,大多都是随机选择的或是将同一批次中其他的数据作为负例,而这样的负例往往缺乏针对性。

技术实现思路

[0009]为此,本专利技术所要解决的技术问题在于提供一种对话生成更加合理、准确度高的基于人物属性的知识增强对话生成方法。
[0010]为解决上述技术问题,本专利技术提供了一种基于人物属性的知识增强对话生成方法,其包括:根据人物属性三元组构建个性化知识图谱,并训练所述个性化知识图谱;所述人物属性三元组包括:对话历史中的知识、对应回复中的知识、人物属性;获取用户的输入信息,所述输入信息包括对话历史和人物属性,将所述对话历史转化为输入序列;从所述对话历史中提取已经出现的知识,将其作为个性化知识图谱的头节点,在个性化知识图谱中选择与头节点相关的潜在知识节点,并在个性化知识图谱中选择与所述输入信息中的人物属性不同的知识作为对比学习的负例,记为负例知识节点;对所述输入序列进行编码得到输入序列的上下文的隐层表示,对选择的潜在知识节点进行编码得到潜在知识的隐层表示,对选择的负例知识节点进行编码得到负例知识的隐层表示;根据输入序列的上下文的隐层表示、潜在知识的隐层表示、负例知识的隐层表示,利用对比学习生成对话。
[0011]在本专利技术的一个实施例中,所述在个性化知识图谱中选择与头节点相关的潜在知识节点,包括:根据以下公式计算个性化知识图谱中潜在候选知识的得分t
s
:;其中,R为所述个性化知识图谱中存在的关系,d表示要生成回复的人物自然属性,仅当属于所述个性化知识图谱时才进行计算;为人物属性三元组的得分,h为头节点,t为尾节点,r为h和t的关系,为所述对话历史中提取已经出现的知识;选择得分t
s
大于1的潜在候选知识作为潜在知识节点。
[0012]在本专利技术的一个实施例中,,h为头节点,t为尾节点,r为h和t的关系,T表示转置。
[0013]在本专利技术的一个实施例中,对所述输入序列进行编码得到输入序列的上下文的隐层表示,如下:;其中,C
i
表示第i层的上下文的隐层表示,,Embedding表示嵌入层,X表示输入序列,表示的第i层编码器,最终得到输入序列的上下文的隐层表示 ,L为隐层的最大层数。
[0014]在本专利技术的一个实施例中,对选择的潜在知识节点进行编码得到潜在知识的隐层表示,对选择的负例知识节点进行编码得到负例知识的隐层表示,如下:
;其中,为潜在知识的第i层的隐层表示,为负例知识的第i层的隐层表示,为潜在知识隐层表示的中间变量,为负例知识隐层表示的中间变量,Attention为多头注意力机制,Norm为层归一化,FFN为前馈神经网络,,表示潜在知识节点,表示负例知识节点,,Embedding表示嵌入层,最终得到潜在知识的隐层表示,最终得到负例知识的隐层表示,L为隐层的最大层数。
[0015]在本专利技术的一个实施例中,训练所述个性化知识图谱,包括:使用TransE算法对个性化知识图谱进行训练。
[0016]在本专利技术的一个实施例中,将所述对话历史转化为输入序列,包括:将所述对话历史转化为输入序列,无法匹配的字用[UNK]代替,并在输入序列的前后加上[CLS]和[SEP]特殊符号;将输入序列按照设定的长度进行截断或补齐得到最终的输入序列。
[0017]本专利技术还提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,所述处理器执行所述程序时实现上述任一项所述方法的步骤。
[0018]本专利技术还提供了一种计算机可读存储介质,其上存储有计算机程序,该程序被处理器执行时实现上述任一项所述方法的步骤。
[0019]本专利技术还提供了一种基于人物属性的知识增强对话生成系统,其包括:个性化知识图谱构建模块,用于根据人物属性三元组构建个性化知识图谱,并训练所述个性化知识图谱;所述人物属性三元组包括:对话历史中的知识、对应回复中的知识、人物属性;用户信息获取模块,用于获取用户的输入信息,所述输入信息包括对话历史和人物属性,将所述对话历史转化为输入序列;节点选择模块,用于从所述对话历史中提取已经出现的知识,将其作为个性化知识图谱的头节点,在个性化知识图谱中选择与头节点相关的潜在知识节点,并在个性化知识图谱中选择与所述输入信息中的人物属性不同的知识作为对比学习的负例,记为负例知识节点;编码模块,用于对所述输入序列进行编码得到输入序列的上下文表示,对选择的潜在知识节点进行编码得到潜在知识的隐层表示,对选择的负例知识节点进行编码得到负例知识的隐层表示;对话生成模块,用于根据输入序列的上下文表示、潜在本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于人物属性的知识增强对话生成方法,其特征在于,包括:根据人物属性三元组构建个性化知识图谱,并训练所述个性化知识图谱;所述人物属性三元组包括:对话历史中的知识、对应回复中的知识、人物属性;获取用户的输入信息,所述输入信息包括对话历史和人物属性,将所述对话历史转化为输入序列;从所述对话历史中提取已经出现的知识,将其作为个性化知识图谱的头节点,在个性化知识图谱中选择与头节点相关的潜在知识节点,并在个性化知识图谱中选择与所述输入信息中的人物属性不同的知识作为对比学习的负例,记为负例知识节点;对所述输入序列进行编码得到输入序列的上下文的隐层表示,对选择的潜在知识节点进行编码得到潜在知识的隐层表示,对选择的负例知识节点进行编码得到负例知识的隐层表示;根据输入序列的上下文的隐层表示、潜在知识的隐层表示、负例知识的隐层表示,利用对比学习生成对话。2.根据权利要求1所述的基于人物属性的知识增强对话生成方法,其特征在于,所述在个性化知识图谱中选择与头节点相关的潜在知识节点,包括:根据以下公式计算个性化知识图谱中潜在候选知识的得分t
s
:;其中,R为所述个性化知识图谱中存在的关系,d表示要生成回复的人物自然属性,仅当属于所述个性化知识图谱时才进行计算;为人物属性三元组的得分,h为头节点,t为尾节点,r为h和t的关系,为所述对话历史中提取已经出现的知识;选择得分t
s
大于1的潜在候选知识作为潜在知识节点。3.根据权利要求2所述的基于人物属性的知识增强对话生成方法,其特征在于,,h为头节点,t为尾节点,r为h和t的关系,T表示转置。4.根据权利要求1所述的基于人物属性的知识增强对话生成方法,其特征在于,对所述输入序列进行编码得到输入序列的上下文的隐层表示,如下:;其中,C
i
表示第i层的上下文的隐层表示,,Embedding表示嵌入层,X表示输入序列,表示的第i层编码器,最终得到输入序列的上下文的隐层表示 ,L为隐层的最大层数。5.根据权利要求1所述的基于人物属性的知识增强对话生成方法,其特征在于,对选择的潜在知识节点进行编码得到潜在知识的隐层表示,对选择的负例知识节点进行编码得到负例知识的隐层表示,如下:
;其中,...

【专利技术属性】
技术研发人员:夏凯歌付国宏
申请(专利权)人:苏州大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1