一种基于用户个性化的对话回复生成方法及其模型技术

技术编号：37633523 阅读：37 留言：0更新日期：2023-05-20 08:54

本发明专利技术涉及一种基于用户个性化的对话回复生成方法及其模型。本发明专利技术所述的对话回复生成方法包括：S1、获取当轮输入语句与历史输入语句中包含的个性化信息的匹配程度得分；S2、根据所述匹配程度得分，得到个性化信息选择性保存向量；S3、根据个性化信息选择性保存向量，得到用户个性化表征向量；在获得用户个性化表征向量后，根据用户个性化表征向量，在候选知识语句中选择最符合用户个性的知识语句，再利用所选择的知识语句，生成对话回复语句。本发明专利技术的方案，无须引入外部的对话者信息标注数据来获得用户的个性化信息，从而降低了对话系统的数据处理的负担，并且提高了对话系统的灵活性和应用范围。性和应用范围。性和应用范围。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于用户个性化的对话回复生成方法及其模型

[0001]本专利技术涉及自然语言处理
，特别是涉及一种基于用户个性化的对话回复生成方法及其模型。

技术介绍

[0002]近年来，以深度学习为代表的新一代人工智能技术的兴起，推动了自然语言处理技术(NLP，Natural Language Processing)的蓬勃发展。而对话系统则是在自然语言处理领域中研究机器如何以文字的形式与人进行交流的重要课题，并吸引了不少来自学术界和工业界的关注。
[0003]在现有技术中，基于序列到序列(sequence to sequence model，Seq2Seq)框架的端到端的生成式对话系统可以在训练后对输入对话序列生成相应回复序列，但是上述端到端的生成式对话系统趋向于生成呆板、无意义、不够恰当的通用重复性答复(如“好的”，“是的”，“我不知道”等)，并且缺少扩展对话内容的能力。
[0004]目前，以知识为基础的对话系统在提升回复的信息量方面有着不错的效果。其中，以知识为基础的对话系统中所涉及的基于知识的对话(Knowledge
本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于用户个性化的对话回复生成方法，其特征在于：包括如下步骤：S1、根据当前对话中用户的历史输入语句和当轮输入语句，得到当轮输入语句与历史输入语句中包含的个性化信息的匹配程度得分；S2、根据所述匹配程度得分，得到所述历史输入语句的个性化信息选择性保存向量；S3、根据所述个性化信息选择性保存向量，得到所述当轮输入语句所对应的用户个性化表征向量；S4、根据所述用户个性化表征向量，得到每一候选知识语句与所述用户个性化表征向量在信息上的信息关联向量；S5、根据所述信息关联向量，得到所述候选知识语句的知识选择分布向量；S6、根据所述知识选择分布向量，计算每个候选知识语句的注意力得分，并将注意力得分最高的候选知识语句定为当轮对话中所选择的知识语句；S7、根据上下文语句和所选择的知识语句，初始化循环神经网络的解码隐藏状态向量；S8、更新循环神经网络的解码隐藏状态向量，从而得到更新后的解码隐藏状态向量；S9、根据所述更新的解码隐藏状态向量和上下文语句，计算词语表中词语的第一注意力值，以及根据所述更新的解码隐藏状态向量和所选择的知识语句，计算所选择的所述知识语句中词语的第二注意力值；S10、利用所述第一注意力值和第二注意力值，计算词语的最终概率值；S11、选择最终概率值最高的词语作为当前时间步的生成词。2.根据权利要求1所述的对话回复生成方法，其特征在于：所述步骤S1包括：对所述历史输入语句和当轮输入语句分别进行编码，得到第一历史输入语句个性化信息隐藏向量和当轮输入语句个性化信息隐藏向量，并利用所述第一历史输入语句个性化信息隐藏向量和所述当轮输入语句个性化信息隐藏向量获得所述匹配程度得分；所述步骤S2包括：根据所述匹配程度得分和对所述历史输入语句编码所得的第二历史输入语句个性化信息隐藏向量，计算所述个性化信息选择性保存向量，其中，所述第二历史输入语句个性化信息隐藏向量与所述第一历史输入语句个性化信息隐藏向量的编码方式相同但参数不同。3.根据权利要求2所述的对话回复生成方法，其特征在于：所述步骤S3包括：计算所述个性化信息选择性保存向量与所述当轮输入语句个性化信息隐藏向量两者所含信息的直接相关度，得到所述用户个性化表征向量。4.根据权利要求1或2或3所述的对话回复生成方法，其特征在于：所述步骤S4包括：根据对所述候选知识语句编码所得的候选知识语句隐藏向量与所述用户个性化表征向量，得到每一候选知识语句隐藏向量与所述用户个性化表征向量在信息上的信息关联向量。5.根据权利要求4所述的对话回复生成方法，其特征在于：所述步骤S5包括：S51、对当轮对话中的上下文语句进行编码，得到上下文语句信息隐藏向量，其中，所述上下文语句包括历史对话语句和用户的当轮输入语句；S52、根据所述信息关联向量、所述上下文语句信息隐藏向量和所述候选知识语句隐藏向量，得到所述知识选择分布向量。6.根据权利要求...

【专利技术属性】
技术研发人员：曾碧卿，曾威，冯灵聪，周斯颖，
申请(专利权)人：华南师范大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人