【技术实现步骤摘要】
本专利技术涉及机器学习领域,特别是涉及一种文本生成方法。
技术介绍
1、现有的可控文本生成方法,主要通过基于微调训练的方法,用包含属性的相关数据集对预训练语言模型进行二次训练,微调其模型参数,以适应带属性的样本分布;该基于微调的方法虽然可以保证生成文本的高控制度,但模型的生成过程中,属性信息可能与训练语料的领域信息纠缠,导致生成的文本虽然符合目标属性,但仅限于在某些特定的文本领域。进而导致生成的文本倾向于偏向训练语料所属的领域,因而使得生成结果失去通用性,并且随着预训练模型的不断增大,微调模型的成本也越来越高。
2、少部分无需微调训练,仅在推理阶段的文本生成中进行控制,根据目标属性提高相关单词的生成概率,进而生成完整的符合目标属性要求的文本片段。但直接根据与目标属性的相关性而改变文本生成概率将导致生成的句子流畅度降低,导致生成的文本的质量受到限制。当前的方法难以在生成流畅通顺的句子的前提下保证文本内容的高度可控。
3、因此,如何解决上述至少一个技术问题,以提高文本生成效果,是本领域亟待解决的技术问题。
r/>技本文档来自技高网...
【技术保护点】
1.一种属性增强的文本生成方法,其特征在于,包括:
2.根据权利要求1所述的文本生成方法,其特征在于,生成下一词的步骤,包括:
3.根据权利要求2所述的文本生成方法,其特征在于,步骤S23,具体为:
4.根据权利要求1所述的文本生成方法,其特征在于,步骤S3,包括:
5.根据权利要求1所述的文本生成方法,其特征在于,步骤S5,包括:
6.根据权利要求1所述的文本生成方法,其特征在于,步骤S51,具体为:
7.根据权利要求1-6任意一项所述的文本生成方法,其特征在于,生成模型,包括第一编码器和语言建
...
【技术特征摘要】
1.一种属性增强的文本生成方法,其特征在于,包括:
2.根据权利要求1所述的文本生成方法,其特征在于,生成下一词的步骤,包括:
3.根据权利要求2所述的文本生成方法,其特征在于,步骤s23,具体为:
4.根据权利要求1所述的文本生成方法,其特征在于,步骤s3,包括:
5.根据权利要求1所述的文本生成方法,其特征在于,步骤s5,包括:
6.根据权利要求1所述的文本生成方法,其特征在于,步骤s51,具体为:
7.根据权利要求1...
【专利技术属性】
技术研发人员:李东升,文智华,田植良,黄震,孙重豪,黄静远,
申请(专利权)人:中国人民解放军国防科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。