一种文本生成的多样性控制方法、装置、设备及存储介质制造方法及图纸

技术编号:43612587 阅读:26 留言:0更新日期:2024-12-11 14:56
本发明专利技术属于文本改写技术领域,具体提供一种文本生成的多样性控制方法、装置、设备及存储介质,所述方法包括如下步骤:对输入文本进行预处理生成词序列;对文本进行句法成分分析,根据分析结果划分成分类型并将类型结果标记在每个词上;设置每种成分类型的惩罚系数;使用文本生成模型计算下一个词的概率分布并根据词的成分类型对应的惩罚系数将概率进行调整;根据调整后的概率分布采用文本生成算法生成下一个字或词,直至完成整个文本改写。通过设置可调节的惩罚系数,本发明专利技术使得文本生成模型能够根据不同业务场景或用户需求进行灵活调整。提高了模型的适用性。

【技术实现步骤摘要】

所属的技术人员能够理解,文本生成的多样性控制装置各个方面可以实现为系统、方法或程序产品。因此,本公开的各个方面可以具体实现为以下形式,即:完全的硬件实施方式、完全的软件实施方式(包括固件、微代码等),或硬件和软件方面结合的实施方式,这里可以统称为“电路”、“模块”或“系统”。尽管通过参考附图并结合优选实施例的方式对本专利技术进行了详细描述,但本专利技术并不限于此。在不脱离本专利技术的精神和实质的前提下,本领域普通技术人员可以对本专利技术的实施例进行各种等效的修改或替换,而这些修改或替换都应在本专利技术的涵盖范围内/任何熟悉本的技术人员在本专利技术揭露的技术范围内,可轻易想到变化或替换,都应涵盖在本专利技术的保护范围之内。


技术介绍

1、在一些特定领域可能要求文本改写模型生成的内容具有较高的多样性,即保证语义不变的前提下和输入文本的差异尽可能大。

2、通常的做法是在生成输入文本的过程中,对已经在输入文本中出现过的字词施加惩罚:即设置一个惩罚系数k(0<k<1),当文本生成模型计算出了下一个字的概率分布后,对那些在输入文本中出现过的字词本文档来自技高网...

【技术保护点】

1.一种文本生成的多样性控制方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的文本生成的多样性控制方法,其特征在于,对输入文本进行预处理生成词序列的步骤包括:

3.根据权利要求2所述的文本生成的多样性控制方法,其特征在于,对文本进行句法成分分析,根据分析结果划分成分类型并将类型结果标记在每个词上的步骤包括:

4.根据权利要求3所述的文本生成的多样性控制方法,其特征在于,设置每种成分类型的惩罚系数的步骤包括:

5.根据权利要求4所述的文本生成的多样性控制方法,其特征在于,使用文本生成模型计算下一个词的概率分布并根据词的成分类型对应的惩...

【技术特征摘要】

1.一种文本生成的多样性控制方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的文本生成的多样性控制方法,其特征在于,对输入文本进行预处理生成词序列的步骤包括:

3.根据权利要求2所述的文本生成的多样性控制方法,其特征在于,对文本进行句法成分分析,根据分析结果划分成分类型并将类型结果标记在每个词上的步骤包括:

4.根据权利要求3所述的文本生成的多样性控制方法,其特征在于,设置每种成分类型的惩罚系数的步骤包括:

5.根据权利要求4所述的文本生成的多样性控制方法,其特征在于,使用文本生成模型计算下一个词的概率分布并根据词的成分类型对应的惩罚系数将概率进行调整的步骤包括:

6.根据权利要求5所述的文本生成的多样性控制方法,其特征在于,根据调整后的概率分布采用文本生成算法生成下一个字或词,直至完...

【专利技术属性】
技术研发人员:龚承启王珂张再胜郭翌寒
申请(专利权)人:浪潮智慧科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1