【技术实现步骤摘要】
文本生成模型的生成方法、装置和电子设备
本公开涉及文本生成领域,尤其涉及一种文本生成模型的生成方法、装置、电子设备及计算机可读存储介质。
技术介绍
随着互联网技术的发展,互联网的传播形态正在不断的变革之中,从早期的PC电脑端,到今天的智能手机端,网民接入网络的方式越来越便捷,人们进入了一个移动互联网时代,以智能手机、平板电脑等为代表的移动终端已经日益大众化,移动互联网应用逐渐渗透到人们的日常生活当中,人们可以随时随地的享受着新技术带来的便利。搜索是互联网的常用技术,通常搜索引擎在召回用户搜索的内容时会在召回的内容中插入广告,以希望用户可以点击广告。一般来说用户的搜索词和广告之间用广告关键词作为桥梁,也即是说搜索词与广告关键词有对应关系,而广告关键词和广告有对应关系,这样当用户使用搜索词进行内容搜索时,可以插入与其所对应的关键词所对应的广告。在这种情况下,产生与搜索词和广告相关的关键词是至关重要的。近年来,现有技术中通常使用深度学习的方法,自动生成所述关键词,如使用训练好的关键词生成模型,通过输入搜索词或广告生成对应的关键词,但是这种方法受制于训练数据的准确度,如从搜索词到关键词的训练数据以及从广告到关键词的数据难以获取,并且训练数据的噪音很大,因此无法训练生成好用的关键词生成模型。
技术实现思路
提供该
技术实现思路
部分以便以简要的形式介绍构思,这些构思将在后面的具体实施方式部分被详细描述。该
技术实现思路
部分并不旨在标识要求保护的技术方案的关键特征或必要特征,也不旨在用于限制所要求的 ...
【技术保护点】
1.一种文本生成模型的生成方法,其特征在于,包括:/n根据第一训练文本数据集训练生成第一文本生成模型,所述第一文本生成模型用于根据第一文本生成第二文本;/n根据所述第一训练文本数据集、所述第一文本生成模型、第二训练文本数据集和第三训练文本数据集训练生成第二文本生成模型和第三文本生成模型,其中所述第二文本生成模型用于根据第一文本生成第三文本,所述第三文本生成模型用于根据第三文本生成第二文本。/n
【技术特征摘要】
1.一种文本生成模型的生成方法,其特征在于,包括:
根据第一训练文本数据集训练生成第一文本生成模型,所述第一文本生成模型用于根据第一文本生成第二文本;
根据所述第一训练文本数据集、所述第一文本生成模型、第二训练文本数据集和第三训练文本数据集训练生成第二文本生成模型和第三文本生成模型,其中所述第二文本生成模型用于根据第一文本生成第三文本,所述第三文本生成模型用于根据第三文本生成第二文本。
2.如权利要求1所述的文本生成模型的生成方法,其中所述根据所述第一训练文本数据集、所述第一文本生成模型、第二训练文本数据集和第三训练文本数据集训练生成第二文本生成模型和第三文本生成模型,包括:
获取第二文本生成模型的参数和第三文本生成模型的参数;
根据第一联合损失函数以及所述第二训练文本数据迭代更新所述第二文本生成模型的参数;
根据第一联合损失函数以及所述第三训练文本数据迭代更新所述第三文本生成模型的参数;
重复上述迭代过程直至达到收敛条件;
其中在所述第一联合损失函数中,将所述第一文本生成模型在所述第一训练文本数据集中生成的预测值作为训练所述第二文本生成模型和所述第三文本生成模型的标注值。
3.如权利要求2所述的文本生成模型的生成方法,其中所述第一联合损失函数中包括:似然损失函数和交叉熵损失函数,其中所述似然损失函数包括所述第二文本生成模型和所述第三文本生成模型的预测值,所述交叉熵损失函数包括由所述第一文本生成模型生成的标注值以及由所述第二文本生成模型和所述第三文本生成模型的预测值所表示的第一文本生成模型的预测值。
4.如权利要求1所述的文本生成模型的生成方法,其中所述根据第一训练文本数据集训练生成第一文本生成模型,还包括:
在根据所述第一训练文本数据集训练生成第一文本生成模型的同时,根据所述第一训练文本数据集训练生成第四文本生成模型,其中所述第四文本生成模型用于根据第二文本生成第一文本。
5.如权利要求4所述的文本生成模型的生成方法,其中所述在根据所述第一训练文本数据集训练生成第一文本生成模型的同时,根据所述第一训练文本数据集训练生成第四文本生成模型,包括:
获取第二文本生成模型的参数和第三文本生成模型的参数;
根据第二联合损失函数以及所述第一训练文本数据迭代更新所述第一文本生成模型的参数和所述第四文本生成模型的参数;
重复上述迭代过程直至达到收敛条件;
其中所述第二联合损失函数为表示所述第一训练文本数据中的第一训练文本和第二训练文本之间的互信息的下界的函数。
6.如权利要求4所述的文本生成本生成模型的生成方法,其中所述根据所述第一训练文本数据集、所述第一文本生成模型、第二训练文本数据集和第三训练文本数据集训练生成第二文本生成模型和第三文本生成模型,还包括:
在训练生成所述第二文本生成模型和所述第三文本生成模型的同时,还训练生成第五文本生成模型和第六文本生成模型;其中,所述第五文本生成模型用于根据第三文本生成第一文本,所述第六文本生成模型用于根据第...
【专利技术属性】
技术研发人员:宋珍巧,周浩,陈家泽,李磊,
申请(专利权)人:北京字节跳动网络技术有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。