一种文案生成方法和装置制造方法及图纸

技术编号:35088489 阅读:20 留言:0更新日期:2022-10-01 16:43
本发明专利技术公开了一种文案生成方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:获取对象的属性、类别以及特征词;将属性、类别以及特征词输入预先训练好的文案生成模型,其中,文案生成模型的解码阶段引入重复惩罚系数;基于文案生成模型以及重复惩罚系数,为对象生成多条候选文案,其中,多条候选文案之间存在差异;从多条候选文案中,为对象筛选目标文案。该实施方式能够使生成的多种文案具有多样性。有多样性。有多样性。

【技术实现步骤摘要】
一种文案生成方法和装置


[0001]本专利技术涉及计算机
,尤其涉及一种文案生成方法和装置。

技术介绍

[0002]电商平台上的销售方为了吸引消费方,会为推广的产品提供长文案描述,并对产品的特点进行描述,以让消费方能够快速获知产品的特性。
[0003]目前文案生成方式主要是,基于预设的模板,销售方将产品的特征、属性等信息输入该模板,直接将产品的特征、属性等信息填充到该模板中,得到文案。现有的这种文案生成方式导致文案比较单一。

技术实现思路

[0004]有鉴于此,本专利技术实施例提供一种文案生成方法和装置,能够使生成的多种文案具有多样性。
[0005]为实现上述目的,根据本专利技术实施例的一个方面,提供了一种文案生成方法,包括:
[0006]获取对象的属性、类别以及特征词;
[0007]将所述属性、所述类别以及所述特征词输入预先训练好的文案生成模型,其中,所述文案生成模型的解码阶段引入重复惩罚系数;
[0008]基于所述文案生成模型以及所述重复惩罚系数,为所述对象生成多条候选文案,其中,多条所述候选文案之间存在差异;
[0009]从多条所述候选文案中,为所述对象筛选目标文案。
[0010]优选地,为所述对象生成多条候选文案,包括:
[0011]通过所述文案生成模型中的编码器,将所述属性、所述类别以及所述特征词转化为初始编码;
[0012]基于所述初始编码,为所述对象生成多条候选文案。
[0013]优选地,基于所述初始编码,为所述对象生成多条候选文案,包括:
[0014]循环执行下述步骤,直至满足循环停止条件:
[0015]转换所述初始编码中属于所述属性的编码部分;
[0016]将转换后的结果输入所述文案生成模型中的解码器,通过所述解码器输出转换后的结果对应的候选文案。
[0017]优选地,上述文案生成方法,进一步包括:为所述属性、所述类别以及所述特征词生成目标向量矩阵;
[0018]将所述属性、所述类别以及所述特征词转化为初始编码,包括:
[0019]通过多个连续的所述编码器,将所述目标向量矩阵转化为初始编码。
[0020]优选地,为所述属性、所述类别以及所述特征词生成目标向量矩阵,包括:
[0021]根据预先构建的词表,将所述属性、所述类别以及所述特征词转换为映射向量矩
阵;
[0022]根据所述属性的位置信息、所述类别的位置信息以及所述特征词的位置信息,生成位置向量矩阵;
[0023]根据所述映射向量矩阵和所述位置向量矩阵,生成目标向量矩阵。
[0024]优选地,在所述循环中,进一步包括:
[0025]将所述初始编码输入预先训练好的变分自编码器,计算所述初始编码中所述属性对应的编码部分的均值分布和方差分布;
[0026]根据所述均值分布和所述方差分布,执行转换所述初始编码中属于所述属性的编码部分的步骤。
[0027]优选地,计算所述初始编码中所述属性对应的编码部分的均值分布和方差分布,包括:
[0028]针对所述属性对应的编码部分中的每一个所述属性的最后一个属性维度,执行:计算所述最后一个属性维度的均值和方差;
[0029]将所述属性对应的编码部分中所有所述属性对应的均值和方差,组合成所述均值分布和所述方差分布。
[0030]优选地,转换所述初始编码中属于所述属性的编码部分,包括:
[0031]根据正太分布,对所述方差分布进行采样;
[0032]根据采样的结果与所述均值分布,得到所述初始编码中属于所述属性的编码部分。
[0033]优选地,针对每一个循环周期,进一步包括:
[0034]将当前循环周期之前得到的候选文案与预设的属性信息表进行匹配;
[0035]当匹配的结果指示所述候选文案中包括至少一个属性时,根据匹配的结果,对所述候选文案中包括至少一个属性对应的编码部分进行标注;
[0036]将标注后的属性的编码并入变分自编码器输出的结果中。
[0037]优选地,为所述对象筛选目标文案,包括:
[0038]针对每一条所述候选文案,执行:
[0039]判断所述候选文案中的属性是否与输入所述文案生成模型一致,如果否,则过滤掉所述候选文案。
[0040]优选地,上述文案生成方法,进一步包括:
[0041]利用训练集包括的样本属性、类别、特征词以及样本文案,训练模型,以得到多种模型参数组合;
[0042]利用联合损失函数和验证集包括的样本属性、类别、特征词以及样本文案,从多种所述模型参数组合中,选择联合损失函数最小的目标模型参数组合;
[0043]基于所述目标模型参数组合,得到训练好的文案生成模型。
[0044]第二方面,本专利技术实施例提供一种文案生成装置,包括:获取单元、候选文案生成单元以及筛选单元,其中,
[0045]所述获取单元,用于获取对象的属性、类别以及特征词;
[0046]所述候选文案生成单元,用于将所述属性、所述类别以及所述特征词输入预先训练好的文案生成模型,其中,所述文案生成模型的解码阶段引入重复惩罚系数;基于所述文
案生成模型以及所述重复惩罚系数,为所述对象生成多条候选文案,其中,多条所述候选文案之间存在差异;
[0047]所述筛选单元,用于从多条所述候选文案中,为所述对象筛选目标文案。
[0048]上述专利技术中的一个实施例具有如下优点或有益效果:通过为预先训练好的文案生成模型的解码阶段引入重复惩罚系数,通过多次将获取到的对象的属性、类别以及特征词输入文案生成模型,可以得到多种候选文案,由于重复惩罚系数的引入,可以尽可能地避免多条候选文案重复,进一步通过从多条候选文案中,为对象筛选目标文案,可以进一步增强不同对象的目标文案的差异性,因此,本专利技术实施例提供的方案能够使生成的多种文案具有多样性。
[0049]上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。
附图说明
[0050]附图用于更好地理解本专利技术,不构成对本专利技术的不当限定。其中:
[0051]图1是根据本专利技术实施例的模型结构的示意图;
[0052]图2是根据本专利技术实施例的文案生成方法的主要流程的示意图;
[0053]图3是根据本专利技术实施例的为对象生成多条候选文案的主要流程的示意图;
[0054]图4是根据本专利技术另一实施例的为对象生成多条候选文案的主要流程的示意图;
[0055]图5是根据本专利技术实施例的生成目标向量矩阵的主要流程的示意图;
[0056]图6是根据本专利技术实施例的转换初始编码中属于属性的编码部分的主要流程的示意图;
[0057]图7是根据本专利技术实施例的模型结构实现自编码的示意图;
[0058]图8是根据本专利技术另一实施例的模型结构实现自编码的示意图;
[0059]图9是根据本专利技术实施本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种文案生成方法,其特征在于,包括:获取对象的属性、类别以及特征词;将所述属性、所述类别以及所述特征词输入预先训练好的文案生成模型,其中,所述文案生成模型的解码阶段引入重复惩罚系数;基于所述文案生成模型以及所述重复惩罚系数,为所述对象生成多条候选文案,其中,多条所述候选文案之间存在差异;从多条所述候选文案中,为所述对象筛选目标文案。2.根据权利要求1所述的文案生成方法,其特征在于,为所述对象生成多条候选文案,包括:通过所述文案生成模型中的编码器,将所述属性、所述类别以及所述特征词转化为初始编码;基于所述初始编码,为所述对象生成多条候选文案。3.根据权利要求2所述的文案生成方法,其特征在于,基于所述初始编码,为所述对象生成多条候选文案,包括:循环执行下述步骤,直至满足循环停止条件:转换所述初始编码中属于所述属性的编码部分;将转换后的结果输入所述文案生成模型中的解码器,通过所述解码器输出转换后的结果对应的候选文案。4.根据权利要求2所述的文案生成方法,其特征在于,进一步包括:为所述属性、所述类别以及所述特征词生成目标向量矩阵;将所述属性、所述类别以及所述特征词转化为初始编码,包括:通过多个连续的所述编码器,将所述目标向量矩阵转化为初始编码。5.根据权利要求4所述的文案生成方法,其特征在于,为所述属性、所述类别以及所述特征词生成目标向量矩阵,包括:根据预先构建的词表,将所述属性、所述类别以及所述特征词转换为映射向量矩阵;根据所述属性的位置信息、所述类别的位置信息以及所述特征词的位置信息,生成位置向量矩阵;根据所述映射向量矩阵和所述位置向量矩阵,生成目标向量矩阵。6.根据权利要求3所述的文案生成方法,其特征在于,在所述循环中,进一步包括:将所述初始编码输入预先训练好的变分自编码器,计算所述初始编码中所述属性对应的编码部分的均值分布和方差分布;根据所述均值分布和所述方差分布,执行转换所述初始编码中属于所述属性的编码部分的步骤。7.根据权利要求6所述的文案生成方法,其特征在于,计算所述初始编码中所述属性对应的编码部分的均值分布和方差分布,包括:针对所述属性对应的编码部分中的每一个所述属性的最后一个属性维度,执行:计算所述最后一个属性维度的均值和方差;将所述属性对应的编码部分中所有所述属性对应的均值和方差,组合成所述均值分布和所...

【专利技术属性】
技术研发人员:刘庚徐亮陶通赫阳
申请(专利权)人:北京沃东天骏信息技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1