一种基于预训练语言模型的可控文本生成方法技术

技术编号：36359346 阅读：40 留言：0更新日期：2023-01-14 18:16

本发明专利技术提供了一种基于预训练语言模型的可控文本生成方法，分别训练主题、情感和写作风格判别器模型，利用贝叶斯公式的概率分解联合预训练语言模型的输出概率和判别器模型的输出概率，从而生成同时满足所需要的主题、情感和写作风格的文本。该方法相较于直接针对满足约束条件单独训练的模型而言，无需对预训练语言模型本身做任何改动，而是在模型推理阶段通过属性判别器来引导模型生成满足约束条件的内容，因此节省了训练大规模预训练语言模型的计算资源。另外，本发明专利技术的方法可以通过灵活的组合属性判别器来生成满足不同约束条件的文本，从而避免针对每种需求单独训练一个模型。型。型。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于预训练语言模型的可控文本生成方法

[0001]本专利技术涉及自动文本生成技术，特别涉及基于预训练语言模型的可控文本生成技术。

技术介绍

[0002]自然语言生成（又称文本生成）被认为是对自然语言理解的补充，是自然语言处理的一个重要分支。自然语言理解的任务是对输入的文本消除歧义，产生文本中所表达的思想的单一规范化表示；与此相反，文本生成主要侧重于将潜在的语义表示转化为具体的、符合逻辑的自然语言文本。换句话说，自然语言理解旨在开发一种能够阅读和理解人类语言的智能机器，而文本生成则使计算机能够像人类一样写作。作为先进的人工智能的体现，文本生成技术在诸如对话系统、写作辅助、数据增强和广告营销等应用领域中发挥着至关重要的作用。
[0003]对文本生成研究的一个重要和基本的问题是如何使生成的文本可控。在实际应用中，文本生成系统应该能够按照使用者的意愿可靠地生成满足某些控制属性的文本。一般来说，这些控制属性是针对具体任务的。例如，对于故事生成任务需要控制生成的故事的情节和结局；在对话生成的任务中，需要控制生成对话的情感、角色、语气等；对于基于文本生成的数据增强，有必要对生成数据进行控制以确保不同领域的数据分布平衡；在营销文案写作任务中，通过控制生成的广告营销文案围绕产品主题、表达用户情感以及采用特殊的写作风格，更容易吸引消费者注意力，建立品牌信任。此外，出于人工智能应用对社会道德伦理方面带来影响的考虑，如何对文本生成系统进行控制以避免生成攻击性的内容——如性别偏见、敏感词汇——是非常重要的。
[0004]近...

【技术保护点】

【技术特征摘要】
1.一种基于预训练语言模型的可控文本生成方法，其特征在于，包括以下步骤：训练步骤：步骤1、收集符合当前文本应用场景的文本样本数据并生成训练样本；将训练样本输入预训练语言模型进行微调，生成符合当前文本应用场景的预训练语言模型；步骤2、训练主题判别器模型、情感判别器模型和写作风格判别器模型；主题判别器模型用于接收输入的句子前缀和关键词来计算主题关键词集合中的所有关键词在句子中出现的概率，输出句子是否满足围绕文本主题这一控制属性的对数几率；情感判别器模型用于接收输入的句子前缀来计算句子的情感极性是正面的还是负面的概率，输出句子是否满足情感极性这一控制属性的对数几率；写作风格判别器模型用于接收输入的句子前缀来计算句子满足期望的写作风格的概率，输出句子是否满足写作风格这一控制属性的对数几率；文本生成步骤：步骤3、预训练语言模型接收输入的句子前缀，输出当前生成的候选词的预测概率；步骤4、训练完成的主题判别器模型、情感判别器模型和写作风格判别器模型分别接收输入的句子前缀，分别输出其控制属性的对数几率并相加，相加的结果为生成的候选词满足当前文本应用场景的控制属性的对数几率；步骤5、从控制属性的对数几率得到当前生成的候选词的属性概率，将预测概率与属性概率相乘得到最终生成的候选词的输出概率，选择输出概率最大的候选词作为句子的词输出，再判断句子是否达到最大长度，如否将当前生成的句子作为句子前缀，返回步骤3，如是，则输出生成的句子。2.如权利要求1所述方法，其特征...

【专利技术属性】
技术研发人员：廖俊伟，刘万隆，程绍欢，屈鸿，
申请(专利权)人：电子科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人