一种属性增强的文本生成方法及存储介质和终端设备技术

技术编号:40540266 阅读:13 留言:0更新日期:2024-03-05 18:55
本发明专利技术涉及一种属性增强的文本生成方法及存储介质和终端设备,包括:构建基于语义检索、目标属性的生成模型和对应检索库,以及用于判断文本属性的属性判别器;确定待生成文本的目标属性,将当前文本序列输入生成模型,生成下一词,并与当前文本序列拼接,得到下一文本序列;将下一文本序列输入属性判别器,判断其是否与目标属性一致;若一致则确定生成最终的下一文本序列,若不一致,则反馈更新属性判别器,检索得到更新的下一词,并与当前文本序列拼接,得到更新的下一文本序列;迭代判断直至更新的下一文本序列的属性与目标属性一致或满足迭代结束条件,则确定生成最终的下一文本序列。

【技术实现步骤摘要】

本专利技术涉及机器学习领域,特别是涉及一种文本生成方法。


技术介绍

1、现有的可控文本生成方法,主要通过基于微调训练的方法,用包含属性的相关数据集对预训练语言模型进行二次训练,微调其模型参数,以适应带属性的样本分布;该基于微调的方法虽然可以保证生成文本的高控制度,但模型的生成过程中,属性信息可能与训练语料的领域信息纠缠,导致生成的文本虽然符合目标属性,但仅限于在某些特定的文本领域。进而导致生成的文本倾向于偏向训练语料所属的领域,因而使得生成结果失去通用性,并且随着预训练模型的不断增大,微调模型的成本也越来越高。

2、少部分无需微调训练,仅在推理阶段的文本生成中进行控制,根据目标属性提高相关单词的生成概率,进而生成完整的符合目标属性要求的文本片段。但直接根据与目标属性的相关性而改变文本生成概率将导致生成的句子流畅度降低,导致生成的文本的质量受到限制。当前的方法难以在生成流畅通顺的句子的前提下保证文本内容的高度可控。

3、因此,如何解决上述至少一个技术问题,以提高文本生成效果,是本领域亟待解决的技术问题。

r/>

技本文档来自技高网...

【技术保护点】

1.一种属性增强的文本生成方法,其特征在于,包括:

2.根据权利要求1所述的文本生成方法,其特征在于,生成下一词的步骤,包括:

3.根据权利要求2所述的文本生成方法,其特征在于,步骤S23,具体为:

4.根据权利要求1所述的文本生成方法,其特征在于,步骤S3,包括:

5.根据权利要求1所述的文本生成方法,其特征在于,步骤S5,包括:

6.根据权利要求1所述的文本生成方法,其特征在于,步骤S51,具体为:

7.根据权利要求1-6任意一项所述的文本生成方法,其特征在于,生成模型,包括第一编码器和语言建模层;

...

【技术特征摘要】

1.一种属性增强的文本生成方法,其特征在于,包括:

2.根据权利要求1所述的文本生成方法,其特征在于,生成下一词的步骤,包括:

3.根据权利要求2所述的文本生成方法,其特征在于,步骤s23,具体为:

4.根据权利要求1所述的文本生成方法,其特征在于,步骤s3,包括:

5.根据权利要求1所述的文本生成方法,其特征在于,步骤s5,包括:

6.根据权利要求1所述的文本生成方法,其特征在于,步骤s51,具体为:

7.根据权利要求1...

【专利技术属性】
技术研发人员:李东升文智华田植良黄震孙重豪黄静远
申请(专利权)人:中国人民解放军国防科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1