文本生成模型生成方法、文本生成方法、装置及设备制造方法及图纸

技术编号：28039690 阅读：8 留言：0更新日期：2021-04-09 23:22

本公开实施例公开了一种文本生成模型生成方法、文本生成方法、装置及设备，其中，文本生成模型生成方法包括：利用多个语种的文本样本以及多个语种间的平行语料训练初始化语言编码器；根据初始化语言编码器的参数初始化文本生成模型，得到初始文本生成模型；基于文本样本、平行语料以及由文本样本构造生成的关键词与目标文本样本对，对初始文本生成模型进行范式训练；通过关键词与目标文本样本对，对经过范式训练的初始文本生成模型进行参数调整，得到最终的文本生成模型。本公开实施例解决了非汉语语种的文本样本数量少，不能充分利用多语种的丰富文本资源生成相关的目标文本的问题，实现了根据不同语种的关键字生成对应语种的文案。

全部详细技术资料下载

【技术实现步骤摘要】
文本生成模型生成方法、文本生成方法、装置及设备
本公开实施例涉及计算机应用领域，尤其涉及一种文本生成模型生成方法、文本生成方法、装置及设备。
技术介绍
在产品推广的过程中，由于推广目标人群使用的语言不同，相应的推广文案就需要使用不同的语言，例如将一件产品推广给中国人就用汉语广告文案，将这件产品推广给日本人或欧美人就用日语或英语广告文案。广告平台希望能够根据广告主提供的任意语言的广告关键词，为广告主提供对应语言种类的相关且多样的广告文本。但是，在目前能够生成广告文案的神经网络模型中，仅是根据单一语言的文本样本训练得到的，不能利用到多种语言的文本样本数据，也不能直接根据关键词生成对应的广告文案，以用于广告业务中为广告主提供服务。公开内容本公开实施例提供一种文本生成模型生成方法、文本生成方法、装置及设备，以实现根据某一种语言的查询关键字生成同种语言的对应的文本。第一方面，本公开实施例提供了一种文本生成模型生成方法，该方法包括：利用多个语种的文本样本以及所述多个语种间的平行语料训练初始化语言编码器；根据所述初始化语言编码器的参数初始化文本生成模型，得到初始文本生成模型；基于所述多个语种的文本样本、所述平行语料以及由所述多个语种的文本样本构造生成的关键词与目标文本样本对，对所述初始文本生成模型进行范式训练；通过所述关键词与目标文本样本对，对经过范式训练的初始文本生成模型进行参数调整，得到最终的文本生成模型。第二方面，本公开实施例还提供了一种文本生成...

【技术保护点】
1.一种文本生成模型生成方法，其特征在于，包括：/n利用多个语种的文本样本以及所述多个语种间的平行语料训练初始化语言编码器；/n根据所述初始化语言编码器的参数初始化文本生成模型，得到初始文本生成模型；/n基于所述多个语种的文本样本、所述平行语料以及由所述多个语种的文本样本构造生成的关键词与目标文本样本对，对所述初始文本生成模型进行范式训练；/n通过所述关键词与目标文本样本对，对经过范式训练的初始文本生成模型进行参数调整，得到最终的文本生成模型。/n

【技术特征摘要】
1.一种文本生成模型生成方法，其特征在于，包括：
利用多个语种的文本样本以及所述多个语种间的平行语料训练初始化语言编码器；
根据所述初始化语言编码器的参数初始化文本生成模型，得到初始文本生成模型；
基于所述多个语种的文本样本、所述平行语料以及由所述多个语种的文本样本构造生成的关键词与目标文本样本对，对所述初始文本生成模型进行范式训练；
通过所述关键词与目标文本样本对，对经过范式训练的初始文本生成模型进行参数调整，得到最终的文本生成模型。

2.根据权利要求1所述的方法，其特征在于，所述利用多个语种的文本样本以及所述多个语种间的平行语料训练初始化语言编码器，包括：
基于各语种文本样本，使用掩码语言模型的范式进行模型训练，获得第一双向编码器；
将每两个语种的平行语料中的两种语言文本进行拼接之后，使用所述掩码语言模型的范式，在所述第一双向编码器基础上进行模型训练得到所述初始文本生成模型。

3.根据权利要求1所述的方法，其特征在于，所述基于所述多个语种的文本样本、所述平行语料以及由所述多个语种的文本样本构造生成的关键词与目标文本样本对，对所述初始文本生成模型进行范式训练，包括：
通过各语种的文本样本对所述初始文本生成模型训练，得到一个去噪自编码器；
在所述去噪自编码器的基础上，基于所述平行语料进行模型训练得到跨语言自编码器；
利用所述关键词与目标文本样本对，对所述跨语言自编码器进行模型训练，完成所述初始文本生成模型的范式训练。

4.根据权利要求3所述的方法，其特征在于，所述通过各语种的文本样本对所述初始文本生成模型训练，得到一个去噪自编码器，包括：
将每一个文本样本中指定位置的预设长度的序列替换为掩码符号输入至所述初始文本生成模型的编码器进行模型训练，使所述初始文本生成模型的解码器输出未进行序列替换的原始文本样本。

5.根据权利要求3所述的方法，其特征在于，所述在所述去噪自编码器的基础上，基于所述平行语料进行模型训练得到跨语言自编码器，包括：
将每一个文本样本中指定位置的预设长度的序列替换为掩码符号输入至所述去噪自编码器的编码器进行模型训练，使所述去噪自编码器的解码器输出未进行序列替换的原始文本样本的平行语料。

6.根据权利要求3所述的方法，其特征在于，所述利用所述关键词与目标文本样本对，对所述跨语言自编码器进行模型训练，完成所述初始文本生成模型的范式训练，包括：
针对每个关键词与目标文本样本对，将关键词输入至所述跨语言自编码器的编码器，并将目标文本中的部分词语输入至所述跨语言自编码器的解码器进行模型训练，使所述跨语言自编码器的解码器输出所述目标文本中未被输入解码器的词语。

7.根据权利要求1所述的方法，其特征在于，所述通过所述关键词与目标文本样本对，对经过范式训练的初始文本生成模型进行参数调整，包括：
根据样本数据质量将所述关键词与目标文本样本对分为第一样本集合和第二样本集合，其中，所述第二样本集合中的样本质量优于所述第一样本集合中的样本质量；
使用所述第一样本集合中的样本数据对经过范式训练的初始文本生成模型进行初步参数调整；
在初...

【专利技术属性】
技术研发人员：宋珍巧，陈家泽，周浩，李磊，
申请(专利权)人：北京有竹居网络技术有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人