对话文本生成方法、装置、电子设备及存储介质制造方法及图纸

技术编号:32548994 阅读:15 留言:0更新日期:2022-03-05 11:48
本申请实施例提供了一种对话文本生成方法、装置、电子设备及存储介质,属于人工智能技术领域。该方法包括:获取原始对话数据;对原始对话数据进行特征提取,得到目标对话数据;对目标对话数据进行编码处理,得到初始对话隐变量;根据预设的属性特征数据对初始对话隐变量进行重采样处理,得到标准对话隐变量;对标准对话隐变量进行解码处理,得到目标对话文本;对目标对话文本进行语义分析处理,得到标准对话文本。本申请实施例能够提高对话文本的准确性。性。性。

【技术实现步骤摘要】
对话文本生成方法、装置、电子设备及存储介质


[0001]本申请涉及人工智能
,尤其涉及一种对话文本生成方法、装置、电子设备及存储介质。

技术介绍

[0002]随着人工智能技术的发展,对话机器人的使用率也逐渐提升,对话机器人能够根据用户输入的信息来识别用户语义,然后根据用户语义生成相应的回复。目前对话机器人主要是利用基于Encoder

decoder或者seq2seq形式的对话生成模型生成对话文本,这一方式往往会使得对话文本的回复语句比较单一,无法在不同的应用场景下使用,影响对话文本的准确性。因此,如何能够使得对话文本运用于不同的对话场景,提高对话文本的准确性,成为了亟待解决的技术问题。

技术实现思路

[0003]本申请实施例的主要目的在于提出一种对话文本生成方法、装置、电子设备及存储介质,旨在提高对话文本的准确性。
[0004]为实现上述目的,本申请实施例的第一方面提出了一种对话文本生成方法,所述方法包括:
[0005]获取原始对话数据;
[0006]对所述原始对话数据进行特征提取,得到目标对话数据;
[0007]对所述目标对话数据进行编码处理,得到初始对话隐变量;
[0008]根据预设的属性特征数据对所述初始对话隐变量进行重采样处理,得到标准对话隐变量
[0009]对所述标准对话隐变量进行解码处理,得到目标对话文本;
[0010]对所述目标对话文本进行语义分析处理,得到标准对话文本。
[0011]在一些实施例,所述对所述原始对话数据进行特征提取,得到目标对话数据的步骤,包括:
[0012]提取所述原始对话数据中的实体对话特征;
[0013]通过预先训练的序列分类器对所述实体对话特征进行分类处理,得到对话参数特征;
[0014]对所述对话参数特征进行卷积处理,得到所述目标对话数据。
[0015]在一些实施例,所述对所述目标对话数据进行编码处理,得到初始对话隐变量的步骤,包括:
[0016]将所述目标对话数据映射到预设的向量空间,得到目标对话特征;
[0017]根据预设的编码顺序和编码维度,对所述目标对话特征进行编码处理,得到第一对话隐变量;
[0018]对所述第一对话隐变量进行下采样处理,得到所述初始对话隐变量。
[0019]在一些实施例,所述根据预设的属性特征数据对所述初始对话隐变量进行重采样处理,得到标准对话隐变量的步骤,包括:
[0020]对所述属性特征数据进行解析处理,生成目标高斯分布网络;
[0021]通过所述目标高斯分布网络对所述初始对话隐变量进行重采样处理,得到标准对话隐变量。
[0022]在一些实施例,所述对所述标准对话隐变量进行解码处理,得到目标对话文本的步骤,包括:
[0023]对所述标准对话隐变量进行解码处理,得到第二对话隐变量;
[0024]对所述第二对话隐变量进行上采样处理,得到目标对话隐变量;
[0025]通过预设函数对所述目标对话隐变量进行激活处理,得到所述目标对话文本。
[0026]在一些实施例,所述对所述目标对话文本进行语义分析处理,得到标准对话文本的步骤,包括:
[0027]提取所述目标对话文本的语义特征;
[0028]根据所述语义特征对所述目标对话文本进行分割处理,得到目标对话字段;
[0029]计算所述目标对话字段和参考对话字段的相似度;
[0030]根据所述相似度,得到所述标准对话文本。
[0031]在一些实施例,所述根据所述相似度,得到所述标准对话文本的步骤,包括:
[0032]根据所述相似度,对预设的语句数据库内的对话语句进行筛选处理,得到候选语句集合;
[0033]对所述候选语句集合内的对话语句进行增补处理,得到标准对话语句;
[0034]对所述标准对话语句进行融合处理,得到所述标准对话文本。
[0035]为实现上述目的,本申请实施例的第二方面提出了一种对话文本生成装置,所述装置包括:
[0036]原始对话数据获取模块,用于获取原始对话数据;
[0037]特征提取模块,用于对所述原始对话数据进行特征提取,得到目标对话数据;
[0038]编码模块,用于对所述目标对话数据进行编码处理,得到初始对话隐变量;
[0039]重采样模块,用于根据预设的属性特征数据对所述初始对话隐变量进行重采样处理,得到标准对话隐变量;
[0040]解码模块,用于对所述标准对话隐变量进行解码处理,得到目标对话文本;
[0041]语义分析模块,用于对所述目标对话文本进行语义分析处理,得到标准对话文本。
[0042]为实现上述目的,本申请实施例的第三方面提出了一种电子设备,所述电子设备包括存储器、处理器、存储在所述存储器上并可在所述处理器上运行的计算机程序以及用于实现所述处理器和所述存储器之间的连接通信的数据总线,所述计算机程序被所述处理器执行时实现上述第一方面所述的方法。
[0043]为实现上述目的,本申请实施例的第四方面提出了一种存储介质,所述存储介质为计算机可读存储介质,用于计算机可读存储,所述存储介质存储有一个或者多个计算机程序,所述一个或者多个计算机程序可被一个或者多个处理器执行,以实现上述第一方面所述的方法。
[0044]本申请提出的对话文本生成方法、装置、电子设备及存储介质,其通过获取原始对
话数据;对原始对话数据进行特征提取,得到目标对话数据,能够有效地剔除对话数据中相关性不高的数据,缩小数据总量,提高数据合理性。进而,对目标对话数据进行编码处理,得到初始对话隐变量,再根据预设的属性特征数据对初始对话隐变量进行重采样处理,得到标准对话隐变量,通过这一方式能够将符合需求的文本属性信息添加在初始对话隐变量上,从而提高生成的对话文本的准确性与多样性。进而,对标准对话隐变量进行解码处理,得到目标对话文本,这样一来,能够使得生成的目标对话文本中的每一对话语句更为合理,从而提高目标对话文本中询问语句和回复语句的匹配性,使得对话文本能够满足不同对话场景的需求。最后,对目标对话文本进行语义分析处理,通过对目标对话文本中的语句进行词性分析以及语义纠错,得到标准对话文本,能够进一步地提高对话文本的质量。
附图说明
[0045]图1是本申请实施例提供的对话文本生成方法的流程图;
[0046]图2是图1中的步骤S102的流程图;
[0047]图3是图1中的步骤S103的流程图;
[0048]图4是图1中的步骤S104的流程图;
[0049]图5是图1中的步骤S105的流程图;
[0050]图6是图1中的步骤S106的流程图;
[0051]图7是图6中的步骤S604的流程图;
[0052]图8是本申请实施例提供的对话文本生成装置的结构示意图;
[0053]图9是本申请实施例提供的电子设备的硬件结本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种对话文本生成方法,其特征在于,所述方法包括:获取原始对话数据;对所述原始对话数据进行特征提取,得到目标对话数据;对所述目标对话数据进行编码处理,得到初始对话隐变量;根据预设的属性特征数据对所述初始对话隐变量进行重采样处理,得到标准对话隐变量;对所述标准对话隐变量进行解码处理,得到目标对话文本;对所述目标对话文本进行语义分析处理,得到标准对话文本。2.根据权利要求1所述的对话文本生成方法,其特征在于,所述对所述原始对话数据进行特征提取,得到目标对话数据的步骤,包括:提取所述原始对话数据中的实体对话特征;通过预先训练的序列分类器对所述实体对话特征进行分类处理,得到对话参数特征;对所述对话参数特征进行卷积处理,得到所述目标对话数据。3.根据权利要求1所述的对话文本生成方法,其特征在于,所述对所述目标对话数据进行编码处理,得到初始对话隐变量的步骤,包括:将所述目标对话数据映射到预设的向量空间,得到目标对话特征;根据预设的编码顺序和编码维度,对所述目标对话特征进行编码处理,得到第一对话隐变量;对所述第一对话隐变量进行下采样处理,得到所述初始对话隐变量。4.根据权利要求1所述的对话文本生成方法,其特征在于,所述根据预设的属性特征数据对所述初始对话隐变量进行重采样处理,得到标准对话隐变量的步骤,包括:对所述属性特征数据进行解析处理,生成目标高斯分布网络;通过所述目标高斯分布网络对所述初始对话隐变量进行重采样处理,得到标准对话隐变量。5.根据权利要求1所述的对话文本生成方法,其特征在于,所述对所述标准对话隐变量进行解码处理,得到目标对话文本的步骤,包括:对所述标准对话隐变量进行解码处理,得到第二对话隐变量;对所述第二对话隐变量进行上采样处理,得到目标对话隐变量;通过预设函数对所述目标对话隐变量进行激活处理,得到所述目标对话文本。6.根据权利要求1至5任一项所述...

【专利技术属性】
技术研发人员:袁梦菲
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1