System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种文章生成的方法、装置、设备及介质制造方法及图纸_技高网

一种文章生成的方法、装置、设备及介质制造方法及图纸

技术编号:40307332 阅读:4 留言:0更新日期:2024-02-07 20:51
本发明专利技术涉及计算机领域,提供了一种文章生成的方法、装置、设备及可读介质,方法包括:获取文本数据集和图文数据集;基于文本数据集对第一类基础模型进行微调以得到第一初始模型,并基于图文数据集对第二类基础模型进行微调以得到第二初始模型;基于第一初始模型通过近端策略优化强化学习获得文本模型并根据预设奖惩策略优化文本模型,基于第二初始模型通过近端策略优化强化学习获得图文模型并根据预设奖惩策略优化图文模型;基于优化好的文本模型生成文章。通过使用本发明专利技术的方案,能够生成特定场景下文章格式、文本风格和图像风格,能够增强生成内容的创新性和图文匹配性,进一步提高用户的使用感。

【技术实现步骤摘要】

本专利技术涉及计算机领域,并且更具体地涉及一种文章生成的方法、装置、设备及可读介质。


技术介绍

1、近年来在互联网融媒体飞速发展的背景下,文案也在新媒体平台上迸发了新的生机。文案是一种将创意广而告之的图文呈现方式与表现过程,是营销推广活动中不可或缺的组成部分。随着预训练大模型的兴起,文案写作也进入了数字化智能写作时代,涌现出了各种新技术和工具。但是它们都存在一些问题,如撰写的文案内容缺乏特定风格、生成内容缺乏创新性、图文不匹配等问题,ai只承担检索或重复文本工作等问题。


技术实现思路

1、有鉴于此,本专利技术实施例的目的在于提出一种文章生成的方法、装置、设备及可读介质,通过使用本专利技术的技术方案,能够生成特定场景下文章格式、文本风格和图像风格,能够增强生成内容的创新性和图文匹配性,进一步提高用户的使用感。

2、基于上述目的,本专利技术的实施例的一个方面提供了一种文章生成的方法,包括以下步骤:

3、获取文本数据集和图文数据集;

4、基于文本数据集对第一类基础模型进行微调以得到第一初始模型,并基于图文数据集对第二类基础模型进行微调以得到第二初始模型;

5、基于第一初始模型通过近端策略优化强化学习获得文本模型并根据预设奖惩策略优化文本模型,基于第二初始模型通过近端策略优化强化学习获得图文模型并根据预设奖惩策略优化图文模型;

6、基于优化好的文本模型生成文章,并基于优化好的图文模型生成相应配图。

7、根据本专利技术的一个实施例,获取文本数据集和图文数据集的步骤包括:

8、将文档按照预设格式组成文本数据集和图文数据集,并按预设比例将文本数据集划分为第一数据集和第二数据集,将图文数据集划分为第三数据集和第四数据集。

9、根据本专利技术的一个实施例,基于文本数据集对第一类基础模型进行微调以得到第一初始模型,并基于图文数据集对第二类基础模型进行微调以得到第二初始模型的步骤包括:

10、基于第一数据集对第一类基础模型进行微调以得到第一初始模型,并基于第三数据集对第二类基础模型进行微调以得到第二初始模型。

11、根据本专利技术的一个实施例,基于第一初始模型通过近端策略优化强化学习获得文本模型并根据预设奖惩策略优化文本模型,基于第二初始模型通过近端策略优化强化学习获得图文模型并根据预设奖惩策略优化图文模型的步骤包括:

12、通过近端策略优化强化学习初始化第一初始模型以得到文本模型,并使用第二数据集根据预设奖惩策略优化文本模型;

13、通过近端策略优化强化学习初始化第二初始模型以得到图文模型,并使用第四数据集根据预设奖惩策略优化图文模型。

14、根据本专利技术的一个实施例,将文档按照预设格式组成文本数据集和图文数据集的步骤包括:

15、将网络文档中的文本提取出来;

16、按照一篇文章为一行,并以第一预设标签作为终止标签,以第二预设标签作为间隔标签的形式组成文本数据集;

17、提取出文本中对应的图片,并提取出图片对应的文本描述,将图片和文本描述组成图文数据集。

18、根据本专利技术的一个实施例,按预设比例将文本数据集划分为第一数据集和第二数据集,将图文数据集划分为第三数据集和第四数据集的步骤包括:

19、将文本数据集中的第一预设数量的数据划分为第一数据集,将第二预设数量的数据划分为第二数据集;

20、将图文数据集中的第一预设数量的数据划分为第三数据集,将第二预设数量的数据划分为第四数据集。

21、根据本专利技术的一个实施例,按照一篇文章为一行,并以第一预设标签作为终止标签,以第二预设标签作为间隔标签的形式组成文本数据集的步骤包括:

22、将文本数据集中的每行数据划分为输入内容、标题、正文、致谢和结语,其中输入内容为用户想要撰写的文案的核心思想;

23、在输入内容、标题、正文、致谢和结语之间分别加入第二预设标签进行分隔,并在每行数据的最后加入第一预设标签作为终止。

24、根据本专利技术的一个实施例,基于第一数据集对第一类基础模型进行微调以得到第一初始模型,并基于第三数据集对第二类基础模型进行微调以得到第二初始模型的步骤包括:

25、选择第一类基础模型中的一个基础模型,其中第一类基础模型为自注意力模型;

26、使用第一数据集的数据对选择的第一类基础模型进行微调以得到第一初始模型;

27、选择第二类基础模型中的一个基础模型,其中第二类基础模型包括dall-e模型和stable diffusion模型;

28、使用第三数据集的数据对选择的第二类基础模型进行微调以得到第二初始模型。

29、根据本专利技术的一个实施例,通过近端策略优化强化学习初始化第一初始模型以得到文本模型,并使用第二数据集根据预设奖惩策略优化文本模型包括:

30、基于第一初始模型初始化出ppo文本模型;

31、基于文本模型生成第二数据集的文案内容;

32、根据第一预设奖惩策略计算生成的文案内容的得分,并将得分作为激励不断微调文本模型;

33、重复以上步骤直到生成的文案内容得分超过设定阈值,并输出优化后的文本模型。

34、根据本专利技术的一个实施例,第一预设奖惩策略的计算公式为:

35、,

36、其中是生成文本的创新性和流畅性制定的规则,是提示输入,是文本模型的输出,是惩罚项。

37、根据本专利技术的一个实施例,的计算公式为:

38、,

39、其中,和为固定的可设置超参数;为输出与训练集之间的相似度,取值在0-1之间;是语言模型中的衡量困惑度的指标;是用来评价指标判断机器回复的多样性指标。

40、根据本专利技术的一个实施例,的计算公式为:

41、,

42、其中为根据上文词语预测第i个词的概率,n代表句子长度。

43、根据本专利技术的一个实施例,distinct的计算公式为:

44、,

45、其中表示回复中不重复的ngram数量,表示回复中ngram词语的总数量。

46、根据本专利技术的一个实施例,通过近端策略优化强化学习初始化第二初始模型以得到图文模型,并使用第四数据集根据预设奖惩策略优化图文模型的步骤包括:

47、基于第二初始模型初始化出ppo图文模型;

48、基于图文模型生成第四数据集的图片内容;

49、根据第二预设奖惩策略计算生成的图片内容的得分,并将得分作为激励不断微调图文模型;

50、重复以上步骤直到生成的图片内容得分超过设定阈值,并输出优化后的图文模型。

51、根据本专利技术的一个实施例,第二预设奖惩策略的计算公式为:

52、,

53、其中和为固定的可设置超参数,为图片美观度打分,为图文相关性打分。

54、根据本本文档来自技高网...

【技术保护点】

1.一种文章生成的方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的方法,其特征在于,所述获取文本数据集和图文数据集的步骤包括:

3.根据权利要求2所述的方法,其特征在于,所述基于所述文本数据集对第一类基础模型进行微调以得到第一初始模型,并基于图文数据集对第二类基础模型进行微调以得到第二初始模型的步骤包括:

4.根据权利要求3所述的方法,其特征在于,所述基于所述第一初始模型通过近端策略优化强化学习获得文本模型并根据预设奖惩策略优化所述文本模型,基于所述第二初始模型通过所述近端策略优化强化学习获得图文模型并根据所述预设奖惩策略优化所述图文模型的步骤包括:

5.根据权利要求2所述的方法,其特征在于,所述将文档按照预设格式组成文本数据集和图文数据集的步骤包括:

6.根据权利要求5所述的方法,其特征在于,所述按预设比例将文本数据集划分为第一数据集和第二数据集,将图文数据集划分为第三数据集和第四数据集的步骤包括:

7.根据权利要求5所述的方法,其特征在于,所述按照一篇文章为一行,并以第一预设标签作为终止标签,以第二预设标签作为间隔标签的形式组成所述文本数据集的步骤包括:

8.根据权利要求4所述的方法,其特征在于,所述基于所述第一数据集对第一类基础模型进行微调以得到第一初始模型,并基于第三数据集对第二类基础模型进行微调以得到第二初始模型的步骤包括:

9.根据权利要求8所述的方法,其特征在于,所述通过所述近端策略优化强化学习初始化所述第一初始模型以得到文本模型,并使用所述第二数据集根据所述预设奖惩策略优化所述文本模型包括:

10.根据权利要求9所述的方法,其特征在于,所述第一预设奖惩策略的计算公式为:

11.根据权利要求10所述的方法,其特征在于,所述的计算公式为:

12.根据权利要求11所述的方法,其特征在于,所述的计算公式为:

13.根据权利要求11所述的方法,其特征在于,Distinct的计算公式为:

14.根据权利要求8所述的方法,其特征在于,所述通过所述近端策略优化强化学习初始化所述第二初始模型以得到图文模型,并使用所述第四数据集根据所述预设奖惩策略优化所述图文模型的步骤包括:

15.根据权利要求14所述的方法,其特征在于,所述第二预设奖惩策略的计算公式为:

16.根据权利要求1所述的方法,其特征在于,所述基于所述优化好的文本模型生成文章的步骤包括:

17.根据权利要求1所述的方法,其特征在于,还包括:

18.一种文章生成的装置,其特征在于,所述装置包括:

19. 一种计算机设备,其特征在于,包括:

20.一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1-17任意一项所述方法的步骤。

...

【技术特征摘要】

1.一种文章生成的方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的方法,其特征在于,所述获取文本数据集和图文数据集的步骤包括:

3.根据权利要求2所述的方法,其特征在于,所述基于所述文本数据集对第一类基础模型进行微调以得到第一初始模型,并基于图文数据集对第二类基础模型进行微调以得到第二初始模型的步骤包括:

4.根据权利要求3所述的方法,其特征在于,所述基于所述第一初始模型通过近端策略优化强化学习获得文本模型并根据预设奖惩策略优化所述文本模型,基于所述第二初始模型通过所述近端策略优化强化学习获得图文模型并根据所述预设奖惩策略优化所述图文模型的步骤包括:

5.根据权利要求2所述的方法,其特征在于,所述将文档按照预设格式组成文本数据集和图文数据集的步骤包括:

6.根据权利要求5所述的方法,其特征在于,所述按预设比例将文本数据集划分为第一数据集和第二数据集,将图文数据集划分为第三数据集和第四数据集的步骤包括:

7.根据权利要求5所述的方法,其特征在于,所述按照一篇文章为一行,并以第一预设标签作为终止标签,以第二预设标签作为间隔标签的形式组成所述文本数据集的步骤包括:

8.根据权利要求4所述的方法,其特征在于,所述基于所述第一数据集对第一类基础模型进行微调以得到第一初始模型,并基于第三数据集对第二类基础模型进行微调以得到第二初始模型的步骤包括:

9...

【专利技术属性】
技术研发人员:刘红丽
申请(专利权)人:苏州元脑智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1