一种对话回复生成方法、装置、电子设备及存储介质制造方法及图纸

技术编号:38749821 阅读:18 留言:0更新日期:2023-09-09 11:16
本申请公开了一种对话回复生成方法、装置、电子设备及存储介质,涉及人工智能领域。本申请中,由于目标对话场景的场景标识,与目标对话场景所涉及目标对象画像和回复对象画像关联;这样,在针对初始文本信息进行回复时,可从目标对象画像中,筛选出与初始文本信息,满足属性相似度条件的目标对象属性,以及从回复对象画像中,选取出与目标对象属性,满足属性相关性条件的回复对象属性,从而提高了目标回复信息与初始文本信息的相关性,即目标回复信息的准确性;并且,采用对话回复生成模型,对目标对象属性模糊虚化处理,基于模糊虚化处理后的目标对象属性和回复对象属性,针对初始文本信息生成目标回复信息,还提高了对话生成回复的多样性。的多样性。的多样性。

【技术实现步骤摘要】
一种对话回复生成方法、装置、电子设备及存储介质


[0001]本申请涉及人工智能领域,尤其涉及一种对话回复生成方法、装置、电子设备及存储介质。

技术介绍

[0002]自然语言处理(Natural Language Processing,NLP)是人工智能(Artificial Intelligence,AI)领域中的一个重要的分支,主要研究人与计算机之间,利用自然语言进行有效通信的各种理论和方法。
[0003]其中,文本生成(即自然语言生成),可以利用各种不同类型的信息(比如,文本、结构化信息、图像等),自动生成流畅、通顺、语义清晰的高质量自然语言文本。
[0004]鉴于此,作为文本生成和人机交互领域中重要研究方向的对话系统,得以蓬勃发展,故而,涌现出了各式各样的对话回复生成方法,并被应用于各类对话系统中。
[0005]相关技术中,对话系统通常采用深度神经网络,来实现对话系统的对话回复生成,示例性的,对话系统中使用的深度神经网络包括但不限于:循环神经网络(Recurrent Neural Network,RNN),通过天然的序列结构捕捉文本序列中的信息;强化学习(Reinforcement Learning,RL),通过模仿人类学习方式学习自然语言中的隐藏规律;变分自编码器(Variational Autoencoder,VAE),通过隐藏变量分布为模型引入变化性。
[0006]然而,采用上述的对话回复生成方法,会因存在全量个性化画像使用、多编码模块融合以及多模型堆叠产生误差累积等问题,从而导致对话系统在对话过程中,无法根据用户输入进行相关性较高的对话生成回复,进而降低了对话生成回复的准确度。
[0007]因此,采用上述方式,对话生成回复的准确度较低。

技术实现思路

[0008]本申请实施例提供了一种对话回复生成方法、装置、电子设备及存储介质,用以提高对话生成回复的准确度,并且,还提高了对话生成回复的多样性。
[0009]第一方面,本申请实施例提供了一种对话生成回复方法,所述方法包括:
[0010]获取目标对象在目标对话场景中的初始文本信息,并基于目标对话场景的场景标识,确定场景标识关联的目标对象画像和回复对象画像;其中,目标对象画像包含:目标对象的各种目标对象属性,回复对象画像包含:目标对话场景中,回复对象的各种回复对象属性;
[0011]从目标对象画像中,筛选出与初始文本信息,满足预设的属性相似度条件的目标对象属性,并从回复对象画像中,选取出与目标对象属性,满足预设的属性相关性条件的回复对象属性;
[0012]采用预设的对话回复生成模型,对目标对象属性进行模糊虚化处理,并基于模糊虚化处理后的目标对象属性和回复对象属性,生成与初始文本信息,满足预设的对话回复相关性条件的目标回复信息。
[0013]第二方面,本申请实施例还提供了一种对话生成回复装置,所述装置包括:
[0014]获取模块,用于获取目标对象在目标对话场景中的初始文本信息,并基于目标对话场景的场景标识,确定场景标识关联的目标对象画像和回复对象画像;其中,目标对象画像包含:目标对象的各种目标对象属性,回复对象画像包含:目标对话场景中,回复对象的各种回复对象属性;
[0015]筛选模块,用于从目标对象画像中,筛选出与所述初始文本信息,满足预设的属性相似度条件的目标对象属性,并从回复对象画像中,选取出与所述目标对象属性,满足预设的属性相关性条件的回复对象属性;
[0016]生成模块,用于采用预设的对话回复生成模型,对目标对象属性进行模糊虚化处理,并基于模糊虚化处理后的目标对象属性和回复对象属性,生成与初始文本信息,满足预设的对话回复相关性条件的目标回复信息。
[0017]可选的,在获取目标对象在目标对话场景中的初始文本信息之前,所述筛选模块还用于:
[0018]针对多个样本对话场景,分别执行以下操作:
[0019]获取一个样本对话场景所涉及的至少两个样本对象各自的样本对话信息;
[0020]分别对获得的至少两个样本对话信息进行属性特征提取,获得至少两个样本对象各自的样本对象属性集;
[0021]基于至少两个样本对象各自的样本对象属性集,生成至少两个样本对象各自的样本对象漫画,并将一个样本对话场景的场景标识,与至少两个样本对象各自的样本对象漫画关联。
[0022]可选的,在获取一个样本对话场景所涉及的至少两个样本对象各自的样本对话信息的过程中,所述筛选模块还用于:
[0023]若获得的至少两个样本对话信息中,存在不满足预设对话信息规范条件的样本对话信息,则丢弃一个样本对话场景;
[0024]和/或,
[0025]若至少两个样本对话信息中,存在不满足预设对话信息规范条件的样本对话信息,则丢弃至少两个样本对话信息。
[0026]可选的,在将一个样本对话场景的场景标识,与至少两个样本对象各自的样本对象漫画关联之后,所述筛选模块还用于:
[0027]针对至少两个样本对象漫画各自包含的样本对象属性,分别执行以下操作:
[0028]确定基于样本对象属性的属性类型设置的内容提示标签;
[0029]基于内容提示标签和预设的内容填充标签,将样本对象属性的初始数据格式修改为预设的标准数据格式。
[0030]可选的,对话回复生成模型是采用如下方式训练的:
[0031]针对多个样本对话场景,分别执行以下操作:
[0032]获取第一样本对话场景中每两个样本对象的样本对话内容;其中,第一样本对话场景为多个样本对话场景中的任意一个;
[0033]基于样本对话内容包含的历史文本信息和历史回复信息,以及预设的预测损失函数,对对话回复生成模型进行迭代训练,直至对话回复生成模型满足对话回复相关性条件
为止。
[0034]可选的,若满足以下条件,则确定对话回复生成模型满足对话回复相关性条件:
[0035]采用预测损失函数,确定基于历史文本信息对应的样本对象属性获得的实际回复信息与其他回复信息之间的第一损失值,以及实际回复信息与历史回复信息之间的第二损失值;其中,历史回复信息和其他回复信息满足预设的回复信息相似度条件;
[0036]基于第一损失值和第二损失值,获得相应的预测损失值,若预测损失值收敛于预设的损失值阈值,则确定对话回复生成模型满足对话回复相关性条件。
[0037]可选的,在基于模糊虚化处理后的目标对象属性和回复对象属性,生成与初始文本信息,满足预设的对话回复相关性条件的目标回复信息时,所述生成模块具体用于:
[0038]基于模糊虚化处理后的目标对象属性和回复对象属性,预测目标回复信息的初始回复词,并将初始回复词保存至预设的初始回复信息;
[0039]对初始回复信息进行迭代修改,直至获得满足对话回复相关性条件的目标回复信息为止;其中,在一轮迭代修改的过程中,执行以下操作:
[0040]基于初始回复信息包含的当前回复本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种对话回复生成方法,其特征在于,包括:获取目标对象在目标对话场景中的初始文本信息,并基于所述目标对话场景的场景标识,确定所述场景标识关联的目标对象画像和回复对象画像;其中,所述目标对象画像包含:所述目标对象的各种目标对象属性,所述回复对象画像包含:所述目标对话场景中,回复对象的各种回复对象属性;从所述目标对象画像中,筛选出与所述初始文本信息,满足预设的属性相似度条件的目标对象属性,并从所述回复对象画像中,选取出与所述目标对象属性,满足预设的属性相关性条件的回复对象属性;采用预设的对话回复生成模型,对所述目标对象属性进行模糊虚化处理,并基于模糊虚化处理后的目标对象属性和所述回复对象属性,生成与所述初始文本信息,满足预设的对话回复相关性条件的目标回复信息。2.如权利要求1所述的方法,其特征在于,所述获取目标对象在目标对话场景中的初始文本信息之前,还包括:针对多个样本对话场景,分别执行以下操作:获取一个样本对话场景所涉及的至少两个样本对象各自的样本对话信息;分别对获得的至少两个样本对话信息进行属性特征提取,获得所述至少两个样本对象各自的样本对象属性集;基于所述至少两个样本对象各自的样本对象属性集,生成所述至少两个样本对象各自的样本对象漫画,并将所述一个样本对话场景的场景标识,与所述至少两个样本对象各自的样本对象漫画关联。3.如权利要求2所述的方法,其特征在于,所述获取一个样本对话场景所涉及的至少两个样本对象各自的样本对话信息的过程中,还包括:若获得的至少两个样本对话信息中,存在不满足预设对话信息规范条件的样本对话信息,则丢弃所述一个样本对话场景;和/或,若所述至少两个样本对话信息中,存在不满足所述预设对话信息规范条件的样本对话信息,则丢弃所述至少两个样本对话信息。4.如权利要求2所述的方法,其特征在于,所述将所述一个样本对话场景的场景标识,与所述至少两个样本对象各自的样本对象漫画关联之后,还包括:针对至少两个样本对象漫画各自包含的样本对象属性,分别执行以下操作:确定基于所述样本对象属性的属性类型设置的内容提示标签;基于所述内容提示标签和预设的内容填充标签,将所述样本对象属性的初始数据格式修改为预设的标准数据格式。5.如权利要求2

4中任一项所述的方法,其特征在于,所述对话回复生成模型是采用如下方式训练的:针对所述多个样本对话场景,分别执行以下操作:获取第一样本对话场景中每两个样本对象的样本对话内容;其中,所述第一样本对话场景为所述多个样本对话场景中的任意一个;基于所述样本对话内容包含的历史文本信息和历史回复信息,以及预设的预测损失函
数,对所述对话回复生成模型进行迭代训练,直至所述对话回复生成模型满足所述对话回复相关性条件为止。6.如权利要求5所述的方法,其特征在于,若满足以下条件,则确定所述对话回复生成模型满足所述对话回复相关性条件:采用所述预测损失函数,确定基于所述历史文本信息对应的样本对象属性获得的实际回复信息与其他回复信息之间的第一损失值,以及实际回复信...

【专利技术属性】
技术研发人员:郑冬郑佳斌
申请(专利权)人:宁波吉利汽车研究开发有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1