文本生成方法及电子设备技术

技术编号：37344322 阅读：13 留言：0更新日期：2023-04-22 21:36

本公开涉及文本生成方法、装置、电子设备、计算机可读存储介质和计算机程序产品。该方法包括：获取经训练的并行生成模型，其中经训练的并行生成模型包括编码器和解码器，在训练过程中解码器包括多步学习，多步学习中的第一步学习的学习目标对应第一数目的输出模式，在第一步学习之后的第二步学习的学习目标对应第二数目的输出模式，第一数目不大于第二数目；以及将输入文本输入到经训练的并行生成模型中，得到输出文本。以此，本公开实施例能够基于输入文本通过使用并行生成模型得到输出文本，相比于自左向右模型，文本生成速度更快。并且由于在训练过程中的多步学习可以从少到多地学习到多种输出模式，从而模型所生成的输出文本更加准确。本更加准确。本更加准确。

全部详细技术资料下载

【技术实现步骤摘要】
文本生成方法及电子设备

[0001]本公开总体上涉及计算机领域，并且更具体地涉及文本生成方法及电子设备。

技术介绍

[0002]可以借助于人工智能技术，通过文本生成模型生成需要的文本。一般地，可以将文本作为离散序列，通过自左向右的方式得到。例如，以机器学习为例，可以自左向右地逐个生成词(或字)，从而生成整个句子。
[0003]但是，自左向右生成模型中，由于需要等待上一个词(或字)生成结束之后再生成下一个词(或字)，因此生成效率低。另外，在生成下一个词(或字)时只能依赖于已经生成的左边的词(或字)，这样导致在文本生成时只能利用已生成的词的局部信息。

技术实现思路

[0004]根据本公开的示例实施例，提供了一种基于并行生成模型的文本生成方案。
[0005]在本公开的第一方面，提供了一种文本生成方法，包括：获取经训练的并行生成模型，其中经训练的并行生成模型包括编码器和解码器，在训练过程中解码器包括多步学习，多步学习中的第一步学习的学习目标对应第一数目的输出模式，多步学习中在第一步学习之后的第二步学习的学习目标对应第二数目的输出模式，并且第一数目不大于第二数目；以及将输入文本输入到经训练的并行生成模型中，得到输出文本。
[0006]在本公开的第二方面，提供了一种电子设备，包括：至少一个处理单元；至少一个存储器，至少一个存储器被耦合到至少一个处理单元并且存储用于由至少一个处理单元执行的指令，该指令当由至少一个处理单元执行时使得电子设备执行根据本公开的第一方面所描述的方法。
[00...

【技术保护点】

【技术特征摘要】
1.一种文本生成方法，包括：获取经训练的并行生成模型，其中所述经训练的并行生成模型包括编码器和解码器，在训练过程中所述解码器包括多步学习，所述多步学习中的第一步学习的学习目标对应第一数目的输出模式，所述多步学习中在所述第一步学习之后的第二步学习的学习目标对应第二数目的输出模式，并且所述第一数目不大于所述第二数目；以及将输入文本输入到所述经训练的并行生成模型中，得到输出文本。2.根据权利要求1所述的方法，还包括：构建训练数据集，所述训练数据集包括多个数据项，所述多个数据项中的每个数据项包括输入数据和输出数据；以及基于所述训练数据集生成所述经训练的并行生成模型。3.根据权利要求2所述的方法，还包括在所述训练过程中，针对每个数据项：将所述输入数据输入到所述编码器以得到输入向量；以及将所述输入向量输入到所述解码器，其中所述解码器的所述第一步学习的学习目标是基于所述第一步学习的下一步学习的中间输出以及所述输出数据被确定的。4.根据权利要求3所述的方法，其中所述第一步学习的学习目标通过下式方式得到：确定所述第一步学习的下一步学习的中间输出的第一概率分布；确定所述第一概率分布与所述输出数据之间的第一乘积；确定所述输出数据与所述第一步学习的中间输出之间的逐元素相乘的第二乘积；基于所述第一概率分布、所述第一乘积和所述第二乘积来确定所述第一步学习的目标概率分布；以及基于所述第一步学习的目标概率分布，确定所述第一步学习的学习目标。5.根据权利要求4所述的方法，其中所述输出数据与所述第一步学习的中间输出都被表示为独热编码形式。6.根据权利要求1所述的方法，其中所述训练过程的训练目标包括所述多步学习中各步学习的训练目标之和，其中所述各步学习的训练目标基于所述各步学习的学习目标被确定。7.根据权利要求1所述的方法，其中在所述训练过程中，所述第一步学习的中间输出被作为所述第一步学习的下一步学习的中间输入。8.根据权利要求1所述的方法，其中在所述训练过程中，所述第一步学习的下一步学习的中间输入通过下式方式得到：通过将所述第一步学习的中间输出与所述第一步的下一步的学习目...

【专利技术属性】
技术研发人员：钱利华，周浩，王明轩，
申请(专利权)人：北京有竹居网络技术有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人