一种对话回复生成方法、装置、电子设备及存储介质制造方法及图纸

技术编号：38749821 阅读：18 留言：0更新日期：2023-09-09 11:16

本申请公开了一种对话回复生成方法、装置、电子设备及存储介质，涉及人工智能领域。本申请中，由于目标对话场景的场景标识，与目标对话场景所涉及目标对象画像和回复对象画像关联；这样，在针对初始文本信息进行回复时，可从目标对象画像中，筛选出与初始文本信息，满足属性相似度条件的目标对象属性，以及从回复对象画像中，选取出与目标对象属性，满足属性相关性条件的回复对象属性，从而提高了目标回复信息与初始文本信息的相关性，即目标回复信息的准确性；并且，采用对话回复生成模型，对目标对象属性模糊虚化处理，基于模糊虚化处理后的目标对象属性和回复对象属性，针对初始文本信息生成目标回复信息，还提高了对话生成回复的多样性。的多样性。的多样性。

全部详细技术资料下载

【技术实现步骤摘要】
一种对话回复生成方法、装置、电子设备及存储介质

[0001]本申请涉及人工智能领域，尤其涉及一种对话回复生成方法、装置、电子设备及存储介质。

技术介绍

[0002]自然语言处理(Natural Language Processing，NLP)是人工智能(Artificial Intelligence，AI)领域中的一个重要的分支，主要研究人与计算机之间，利用自然语言进行有效通信的各种理论和方法。
[0003]其中，文本生成(即自然语言生成)，可以利用各种不同类型的信息(比如，文本、结构化信息、图像等)，自动生成流畅、通顺、语义清晰的高质量自然语言文本。
[0004]鉴于此，作为文本生成和人机交互领域中重要研究方向的对话系统，得以蓬勃发展，故而，涌现出了各式各样的对话回复生成方法，并被应用于各类对话系统中。
[0005]相关技术中，对话系统通常采用深度神经网络，来实现对话系统的对话回复生成，示例性的，对话系统中使用的深度神经网络包括但不限于：循环神经网络(Recurrent Neural Network，RNN)，通过天然的序列结构捕捉文本序列中的信息；强化学习(Reinforcement Learning，RL)，通过模仿人类学习方式学习自然语言中的隐藏规律；变分自编码器(Variational Autoencoder，VAE)，通过隐藏变量分布为模型引入变化性。
[0006]然而，采用上述的对话回复生成方法，会因存在全量个性化画像使用、多编码模块融合以及多模型堆叠产生误差累积等问题，...

【技术保护点】

【技术特征摘要】
1.一种对话回复生成方法，其特征在于，包括：获取目标对象在目标对话场景中的初始文本信息，并基于所述目标对话场景的场景标识，确定所述场景标识关联的目标对象画像和回复对象画像；其中，所述目标对象画像包含：所述目标对象的各种目标对象属性，所述回复对象画像包含：所述目标对话场景中，回复对象的各种回复对象属性；从所述目标对象画像中，筛选出与所述初始文本信息，满足预设的属性相似度条件的目标对象属性，并从所述回复对象画像中，选取出与所述目标对象属性，满足预设的属性相关性条件的回复对象属性；采用预设的对话回复生成模型，对所述目标对象属性进行模糊虚化处理，并基于模糊虚化处理后的目标对象属性和所述回复对象属性，生成与所述初始文本信息，满足预设的对话回复相关性条件的目标回复信息。2.如权利要求1所述的方法，其特征在于，所述获取目标对象在目标对话场景中的初始文本信息之前，还包括：针对多个样本对话场景，分别执行以下操作：获取一个样本对话场景所涉及的至少两个样本对象各自的样本对话信息；分别对获得的至少两个样本对话信息进行属性特征提取，获得所述至少两个样本对象各自的样本对象属性集；基于所述至少两个样本对象各自的样本对象属性集，生成所述至少两个样本对象各自的样本对象漫画，并将所述一个样本对话场景的场景标识，与所述至少两个样本对象各自的样本对象漫画关联。3.如权利要求2所述的方法，其特征在于，所述获取一个样本对话场景所涉及的至少两个样本对象各自的样本对话信息的过程中，还包括：若获得的至少两个样本对话信息中，存在不满足预设对话信息规范条件的样本对话信息，则丢弃所述一个样本对话场景；和/或，若所述至少两个样本对话信息中，存在不满足所述预设对话信息规范条件的样本对话信息，则丢弃所述至少两个样本对话信息。4.如权利要求2所述的方法，其特征在于，所述将所述一个样本对话场景的场景标识，与所述至少两个样本对象各自的样本对象漫画关联之后，还包括：针对至少两个样本对象漫画各自包含的样本对象属性，分别执行以下操作：确定基于所述样本对象属性的属性类型设置的内容提示标签；基于所述内容提示标签和预设的内容填充标签，将所述样本对象属性的初始数据格式修改为预设的标准数据格式。5.如权利要求2
‑
4中任一项所述的方法，其特征在于，所述对话回复生成模型是采用如下方式训练的：针对所述多个样本对话场景，分别执行以下操作：获取第一样本对话场景中每两个样本对象的样本对话内容；其中，所述第一样本对话场景为所述多个样本对话场景中的任意一个；基于所述样本对话内容包含的历史文本信息和历史回复信息，以及预设的预测损失函
数，对所述对话回复生成模型进行迭代训练，直至所述对话回复生成模型满足所述对话回复相关性条件为止。6.如权利要求5所述的方法，其特征在于，若满足以下条件，则确定所述对话回复生成模型满足所述对话回复相关性条件：采用所述预测损失函数，确定基于所述历史文本信息对应的样本对象属性获得的实际回复信息与其他回复信息之间的第一损失值，以及实际回复信...

【专利技术属性】
技术研发人员：郑冬，郑佳斌，
申请(专利权)人：宁波吉利汽车研究开发有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人