基于人物属性的知识增强对话生成方法及系统技术方案

技术编号：37851896 阅读：11 留言：0更新日期：2023-06-14 22:42

本发明专利技术公开了一种基于人物属性的知识增强对话生成方法及系统。本发明专利技术的基于人物属性的知识增强对话生成方法通过构建个性化知识图谱，将知识与人物属性结合起来，使得对话同时具备了理性和个性；同时，本发明专利技术将与人设的人物属性不同的知识当作对比学习的负例，具有一定的针对性，最终使得生成的对话更加合理，准确度更高，符合人设的人物属性。符合人设的人物属性。符合人设的人物属性。

全部详细技术资料下载

【技术实现步骤摘要】
基于人物属性的知识增强对话生成方法及系统

[0001]本专利技术涉及人机对话
，尤其是指一种基于人物属性的知识增强对话生成方法及系统。

技术介绍

[0002]人机对话通过模拟人类并旨在与人类形成连贯通顺对话，使得人类能够用更自然的方式与机器进行交流。根据应用场景的不同，可以将人机对话分成两类，即任务型和非任务型对话。任务型对话主要面向垂直领域，需要特定领域的知识，目的是在有限的对话轮次内解决用户的需求，如智能客服、个人助理等。而非任务型对话一般面相的是开放领域，即闲聊，对话内容更为自由，要求其回复具有一致性、多样化和个性化。为了达到这些目的，一般会给系统设定特定的人设，并结合知识、个性（性别、地域等）等因素进行对话生成。
[0003]目前常见的对话系统还可以分为两种方式：检索式和生成式。
[0004]检索式对话系统是根据对话历史和当前用户话语选择最合适的系统回复来与用户进行对话的系统。顾名思义，检索式对话系统的任务就是在大量的候选回复中选择一个最佳的回复反馈给用户。
[0005]生成式对话系统通常是基于深度学习的技术，使用Encoder（编码器）
‑
Decoder架构来完成，不依赖于特定的答案库或模板，而依据从大量语料中习得的语言能力来进行对话，根据问题内容直接生成回答。
[0006]其中，检索式对话系统虽然不需要定义结构化的领域本体，减少人工；避免了困难的语言生成问题；回复选择模型的输出更方便进行约束和组合等。但是，想要将对话系统应用于新的领域就需要足够多的域...

【技术保护点】

【技术特征摘要】
1.基于人物属性的知识增强对话生成方法，其特征在于，包括：根据人物属性三元组构建个性化知识图谱，并训练所述个性化知识图谱；所述人物属性三元组包括：对话历史中的知识、对应回复中的知识、人物属性；获取用户的输入信息，所述输入信息包括对话历史和人物属性，将所述对话历史转化为输入序列；从所述对话历史中提取已经出现的知识，将其作为个性化知识图谱的头节点，在个性化知识图谱中选择与头节点相关的潜在知识节点，并在个性化知识图谱中选择与所述输入信息中的人物属性不同的知识作为对比学习的负例，记为负例知识节点；对所述输入序列进行编码得到输入序列的上下文的隐层表示，对选择的潜在知识节点进行编码得到潜在知识的隐层表示，对选择的负例知识节点进行编码得到负例知识的隐层表示；根据输入序列的上下文的隐层表示、潜在知识的隐层表示、负例知识的隐层表示，利用对比学习生成对话。2.根据权利要求1所述的基于人物属性的知识增强对话生成方法，其特征在于，所述在个性化知识图谱中选择与头节点相关的潜在知识节点，包括：根据以下公式计算个性化知识图谱中潜在候选知识的得分t
s
：；其中，R为所述个性化知识图谱中存在的关系，d表示要生成回复的人物自然属性，仅当属于所述个性化知识图谱时才进行计算；为人物属性三元组的得分，h为头节点，t为尾节点，r为h和t的关系，为所述对话历史中提取已经出现的知识；选择得分t
s
大于1的潜在候选知识作为潜在知识节点。3.根据权利要求2所述的基于人物属性的知识增强对话生成方法，其特征在于，，h为头节点，t为尾节点，r为h和t的关系，T表示转置。4.根据权利要求1所述的基于人物属性的知识增强对话生成方法，其特征在于，对所述输入序列进行编码得到输入序列的上下文的隐层表示，如下：；其中，C
i
表示第i层的上下文的隐层表示，，Embedding表示嵌入层，X表示输入序列，表示的第i层编码器，最终得到输入序列的上下文的隐层表示，L为隐层的最大层数。5.根据权利要求1所述的基于人物属性的知识增强对话生成方法，其特征在于，对选择的潜在知识节点进行编码得到潜在知识的隐层表示，对选择的负例知识节点进行编码得到负例知识的隐层表示，如下：
;其中，...

【专利技术属性】
技术研发人员：夏凯歌，付国宏，
申请(专利权)人：苏州大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人