一种虚拟人的对话方法、系统及存储介质技术方案

技术编号：37988145 阅读：9 留言：0更新日期：2023-06-30 10:02

本发明专利技术提供了一种虚拟人的对话方法、系统及存储介质。所述对话方法包括以下步骤：获取用户与所述虚拟人的对话文本；解析所述对话文本，以从中提取指示字符内容的信令特征、指示字符位置的位置特征、指示说出字符者的角色特征，以及指示字符是否涉及人设内容的人设特征；根据所述信令特征、所述位置特征及所述角色特征，确定语境编码特征；以及将所述语境编码特征输入预先训练的对话模型的第一注意力模块，并将所述人设特征输入所述对话模型的第二注意力模块，以确定所述虚拟人的回答文本。通过执行这些步骤，本发明专利技术能够提升虚拟人对话的人设稳定性，从而提升用户体验。从而提升用户体验。从而提升用户体验。

全部详细技术资料下载

【技术实现步骤摘要】
一种虚拟人的对话方法、系统及存储介质

[0001]本专利技术涉及人工智能领域，尤其涉及一种虚拟人的对话方法、一种虚拟人的对话系统，以及一种计算机可读存储介质。

技术介绍

[0002]虚拟人是一种具有数字化外形的虚拟人物，依赖显示设备存在，是人工智能技术的重要应用。在用户与虚拟人对话时，用户会频繁问及关于虚拟人自身设定相关的问题。虚拟人的人设稳定程度对于其追求真实性的目标十分重要，人设相关的问题回答是否准确、流畅，对用户体验有着很大影响。然而，目前处理人设问题的方法使得虚拟人在这样的情境下其回答的准确率低，导致虚拟人人设混乱。
[0003]现有技术中，处理人设相关的问题多采用检索召回法或生成模型法。检索召回法通过搜索人设问题库的方式找到与用户问题最为匹配的问句后，将对应的答案返回给用户。该方法在收到用户问题后，会首先对于是否与人设相关进行判断。然而，由于用户问题表述的多样性，其判断准确程度不高，同时也很难在问题库中准确匹配到用户的问题，从而导致虚拟人答非所问。而且，由于问题的答案是提前准备的，故而在任何问题下虚拟人都只有固定回复，使得回答流畅性较差，与上下文的匹配程度低，语言风格差异也较大。生成模型法则是将人设问题当作一般问题处理，在训练模型时不对用户的人设信息进行特别的区分。然而，这样生成的结果不稳定，同样的问题可能在两次问答中会给出不同的答案。
[0004]为了克服现有技术存在的上述缺陷，本邻域亟需一种提升虚拟人的对话技术，用于提升虚拟人对话的人设稳定性，从而提升用户体验。

技术实现思路
r/>[0005]以下给出一个或多个方面的简要概述以提供对这些方面的基本理解。此概述不是所有构想到的方面的详尽综览，并且既非旨在指认出所有方面的关键性或决定性要素亦非试图界定任何或所有方面的范围。其唯一的目的是要以简化形式给出一个或多个方面的一些概念以为稍后给出的更加详细的描述之前序。
[0006]为了克服现有技术存在的上述缺陷，本专利技术提供了一种虚拟人的对话方法、一种虚拟人的对话系统，以及一种计算机可读存储介质，能够提升虚拟人对话时的人设稳定性，从而提升用户体验。
[0007]具体来说，根据本专利技术的第一方面提供的上述虚拟人的对话方法包括以下步骤：获取用户与虚拟人的对话文本；解析该对话文本，以从中提取指示字符内容的信令特征、指示字符位置的位置特征、指示说出字符者的角色特征，以及指示字符是否涉及人设内容的人设特征；根据信令特征、位置特征及角色特征，确定语境编码特征；以及将语境编码特征输入预先训练的对话模型的第一注意力模块，并将人设特征输入对话模型的第二注意力模块，以确定虚拟人的回答文本。
[0008]优选地，在本专利技术的一实施例中，获取用户与虚拟人的对话文本的步骤包括：获取
用户提供的语音数据；解析语音数据，以确定对应的第一对话文本；获取对话模型输出的回答文本，以作为回答第一对话文本的第二对话文本；以及按序记录各第一对话文本及其对应的第二对话文本，以确定用户与虚拟人的对话文本。
[0009]优选地，在本专利技术的一实施例中，解析对话文本，以从中提取指示字符内容的信令特征、指示字符位置的位置特征、指示说出字符者的角色特征，以及指示字符是否涉及人设内容的人设特征的步骤包括：查询编码词典，以确定对话文本中各字符对应的数字，再依序排列各字符对应的数字，以确定信令特征；和/或依序为对话文本中的各字符编号，再依序排列各编号，以确定位置特征；和/或根据预先规定的数字，依序标记说出对话文本中各字符的角色，再依序排列标记的各数字，以确定角色特征；和/或根据对话文本中的各字符是否涉及虚拟人的人设内容，依序标记对话文本中的各字符，再依序排列各标记，以确定人设特征。
[0010]优选地，在本专利技术的一实施例中，训练对话模型的步骤包括：准备涉及普通问题的多组第三对话文本，并准备涉及虚拟人的人设内容的多组第四对话文本；根据预设比例，将多组第四对话文本穿插到多组第三对话文本之间，以构建对话模型的训练数据样本集；以及使用训练数据样本集，训练对话模型。
[0011]优选地，在本专利技术的一实施例中，准备涉及虚拟人的人设内容的多组第四对话文本的步骤包括：准备虚拟人的多维人设数据；针对每一维度的人设数据，分别准备至少一个人设问题及至少一个人设回答，并对至少一个人设问题及至少一个人设回答进行全排列，以分别获得关于各维度的人设数据的多个问答对；以及根据关于各维度的人设数据的多个问答对，确定多组第四对话文本。
[0012]优选地，在本专利技术的一实施例中，使用训练数据样本集，训练对话模型的步骤包括：从训练数据样本集获取用户与虚拟人的对话文本样本；解析对话文本样本，以从中提取对应的信令特征、位置特征、角色特征及人设特征；根据信令特征、位置特征及角色特征，确定语境编码特征；将语境编码特征输入待训练的对话模型的第一注意力模块，并将人设特征输入对话模型的第二注意力模块，以确定输出回答文本；以及响应于输出回答文本与对话文本样本对应的真实回答文本不一致，使用反向传播算法优化对话模型的学习参数。
[0013]优选地，在本专利技术的一实施例中，将语境编码特征输入预先训练的对话模型的第一注意力模块，并将人设特征输入对话模型的第二注意力模块，以确定虚拟人的回答文本的步骤包括：将语境编码特征输入预先训练的对话模型的第一注意力模块，并将人设特征输入对话模型的第二注意力模块，由对话模型确定多个回答标签的置信概率；以及根据预设的置信概率阈值，确定至少一个回答标签，并根据回答标签确定虚拟人的回答文本。
[0014]优选地，在本专利技术的一实施例中，对话模型的输出结果包括多个回答标签。根据回答标签确定虚拟人的回答文本的步骤包括：根据多个回答标签，确定多个候选回答文本；根据各候选回答文本与对应的问句文本，确定多个候选问答对；分别确定各候选问答对与训练数据样本集中的多个关于人设数据的多个问答对之间的最高匹配度；以及根据最高匹配度最高的候选问答对，确定虚拟人的回答文本。
[0015]此外，根据本专利技术的第二方面提供的上述虚拟人的对话系统包括存储器及处理器。该存储器上存储有计算机指令。该处理器连接该存储器，并被配置用于执行该存储器上存储的计算机指令，以实施上述任意一个实施例所提供的虚拟人的对话方法。
[0016]此外，根据本专利技术的第三方面提供的上述计算机可读存储介质上存储有计算机指令。该计算机指令被处理器执行时，实施上述任意一个实施例所提供的虚拟人的对话方法。
附图说明
[0017]在结合以下附图阅读本公开的实施例的详细描述之后，能够更好地理解本专利技术的上述特征和优点。在附图中，各组件不一定是按比例绘制，并且具有类似的相关特性或特征的组件可能具有相同或相近的附图标记。
[0018]图1示出了根据本专利技术的一些实施例提供的训练对话模型的流程示意图。
[0019]图2示出了根据本专利技术的一些实施例提供的控制虚拟人对话的流程示意图。
具体实施方式
[0020]以下由特定的具体实施例说明本专利技术的实施方式，本领域技术人员可由本本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种虚拟人的对话方法，其特征在于，包括以下步骤：获取用户与所述虚拟人的对话文本；解析所述对话文本，以从中提取指示字符内容的信令特征、指示字符位置的位置特征、指示说出字符者的角色特征，以及指示字符是否涉及人设内容的人设特征；根据所述信令特征、所述位置特征及所述角色特征，确定语境编码特征；以及将所述语境编码特征输入预先训练的对话模型的第一注意力模块，并将所述人设特征输入所述对话模型的第二注意力模块，以确定所述虚拟人的回答文本。2.如权利要求1所述的对话方法，其特征在于，所述获取用户与所述虚拟人的对话文本的步骤包括：获取所述用户提供的语音数据；解析所述语音数据，以确定对应的第一对话文本；获取所述对话模型输出的回答文本，以作为回答所述第一对话文本的第二对话文本；以及按序记录各所述第一对话文本及其对应的第二对话文本，以确定所述用户与所述虚拟人的对话文本。3.如权利要求1所述的对话方法，其特征在于，所述解析所述对话文本，以从中提取指示字符内容的信令特征、指示字符位置的位置特征、指示说出字符者的角色特征，以及指示字符是否涉及人设内容的人设特征的步骤包括：查询编码词典，以确定所述对话文本中各所述字符对应的数字，再依序排列各所述字符对应的数字，以确定所述信令特征；和/或依序为所述对话文本中的各所述字符编号，再依序排列各所述编号，以确定所述位置特征；和/或根据预先规定的数字，依序标记说出所述对话文本中各所述字符的角色，再依序排列标记的各所述数字，以确定所述角色特征；和/或根据所述对话文本中的各所述字符是否涉及所述虚拟人的人设内容，依序标记所述对话文本中的各所述字符，再依序排列各所述标记，以确定所述人设特征。4.如权利要求1所述的对话方法，其特征在于，训练所述对话模型的步骤包括：准备涉及普通问题的多组第三对话文本，并准备涉及所述虚拟人的人设内容的多组第四对话文本；根据预设比例，将多组所述第四对话文本穿插到多组所述第三对话文本之间，以构建所述对话模型的训练数据样本集；以及使用所述训练数据样本集，训练所述对话模型。5.如权利要求4所述的对话方法，其特征在于，所述准备涉及所述虚拟人的人设内容的多组第四对话文本的步骤包括：准备所述虚拟人的多维人设数据；针对每一维度的人设数据，分别准备至少一个人设问题及至少一个人设回答，并对所述至少...

【专利技术属性】
技术研发人员：张旭，顾文元，张雪源，
申请(专利权)人：元梦人文智能国际有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人