System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种文字处理方法、装置、计算机设备及存储介质制造方法及图纸_技高网

一种文字处理方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:40051254 阅读:5 留言:0更新日期:2024-01-16 21:14
本公开提供了一种文字处理方法、装置、计算机设备及存储介质,包括:获取目标文字,以及所述目标文字对应的风格提示信息;按照所述风格提示信息,生成与所述目标文字对应的风格化文字图像;基于所述风格化文字图像以及动态风格化模型,生成多张与所述风格化文字图像对应的视频帧;基于所述视频帧,生成与所述目标文字对应的风格化文字视频。通过这种方式可以实时的生成个性化的风格化文字视频,提升了风格化文字视频的处理速度和处理质量。

【技术实现步骤摘要】

本公开涉及计算机,具体而言,涉及一种文字处理方法、装置、计算机设备及存储介质


技术介绍

1、在很多场景中,例如:视频编辑、动态海报制作等,都需要添加一些动态文字,以提高视觉效果的丰富性。一般的,在添加动态文字时,添加的动态文字往往是艺术字,而艺术字一般都是由专业的设计师设计的,这就导致可以提供给用户的艺术字是可选的几种,类型较少;并且设计师设计动态艺术字需要耗费大量的时间,效率较低。


技术实现思路

1、本公开实施例至少提供一种文字处理方法、装置、计算机设备及存储介质。

2、第一方面,本公开实施例提供了一种文字处理方法,包括:

3、获取目标文字,以及所述目标文字对应的风格提示信息;

4、按照所述风格提示信息,生成与所述目标文字对应的风格化文字图像;

5、基于所述风格化文字图像以及动态风格化模型,生成多张与所述风格化文字图像对应的视频帧;

6、基于所述视频帧,生成与所述目标文字对应的风格化文字视频。

7、一种可能的实施方式中,所述按照所述风格提示信息,生成与所述目标文字对应的风格化文字图像,包括:

8、确定所述目标文字对应的字体信息;

9、按照所述字体信息生成与所述目标文字对应的文字图像;

10、确定与所述文字图像中的目标文字对应的掩模图像,并将所述掩模图像和与所述目标文字对应的风格提示信息输入至风格化模型中,确定与所述目标文字对应的风格化文字图像。

11、一种可能的实施方式中,所述基于所述风格化文字图像以及动态风格化模型,生成多张与所述风格化文字图像对应的视频帧,包括:

12、对所述风格化文字图像进行堆叠处理,得到目标数量张初始图像;

13、对所述目标数量张初始图像进行特征提取,得到第一图像特征,并为所述第一图像特征添加噪声;

14、基于添加噪声后的所述第一图像特征和所述动态风格化模型,生成多张与所述风格化文字图像对应的视频帧。

15、一种可能的实施方式中,所述第一图像特征包括各初始图像分别对应的子图像特征;

16、所述为所述第一图像特征添加噪声,包括:

17、分别为所述第一图像特征中的各子图像特征添加噪声;其中,不同子图像特征添加的噪声不同。

18、一种可能的实施方式中,所述分别为所述第一图像特征中的各子图像特征添加噪声,包括:

19、针对所述子图像特征,确定与所述子图像特征对应的噪声特征;

20、将所述子图像特征与所述噪声特征进行融合,得到添加噪声后的子图像特征。

21、一种可能的实施方式中,所述第一图像特征包括各初始图像分别对应的子图像特征;

22、所述基于添加噪声后的所述第一图像特征和所述动态风格化模型,生成多张与所述风格化文字图像对应的视频帧,包括:

23、确定添加噪声后的第一图像特征中各子图像特征分别对应的掩码约束特征;

24、将添加噪声后的各子图像特征和对应的掩码约束特征进行融合,得到第二图像特征;

25、将所述第二图像特征输入至所述动态风格化模型中,生成多张与所述风格化文字图像对应的视频帧。

26、一种可能的实施方式中,所述将所述第二图像特征输入至所述动态风格化模型中,生成多张与所述风格化文字图像对应的视频帧,包括:

27、将所述第二图像特征作为输入特征,输入至所述动态风格化模型中,得到输出特征;

28、将所述输出特征重新作为输入特征,并返回执行输入所述动态风格化模型的步骤,直至循环预设次数;

29、对最后一次循环得到的输出特征进行解码,得到多张与所述风格化文字图像对应的视频帧。

30、一种可能的实施方式中,所述动态风格化模型基于以下方法调整得到:

31、获取参考视频;

32、提取所述参考视频的视频帧的参考图像特征;

33、为所述参考图像特征添加监督噪声,并将添加监督噪声后的参考图像特征输入至待调整的动态风格化模型中,确定所述待调整的动态风格化模型预测的,输入至所述动态风格化模型中的图像特征所包含的预测噪声;

34、基于所述预测噪声和所述监督噪声对所述待调整的动态风格化模型进行调整。

35、第二方面,本公开实施例还提供一种文字处理装置,包括:

36、获取模块,用于获取目标文字,以及所述目标文字对应的风格提示信息;

37、第一生成模块,用于按照所述风格提示信息,生成与所述目标文字对应的风格化文字图像;

38、第二生成模块,用于基于所述风格化文字图像以及动态风格化模型,生成多张与所述风格化文字图像对应的视频帧;

39、确定模块,用于基于所述视频帧,生成与所述目标文字对应的风格化文字视频。

40、第三方面,本公开实施例还提供一种计算机设备,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当计算机设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行上述第一方面,或第一方面中任一种可能的实施方式中的步骤。

41、第四方面,本公开实施例还提供一种计算机可读存储介质,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行上述第一方面,或第一方面中任一种可能的实施方式中的步骤。

42、本公开实施例提供的文字处理方法、装置、计算机设备及存储介质,可以在获取目标文字以及目标文字对应的风格提示信息之后,可以按照所述风格提示信息生成与所述目标文字对应的风格化文字图像,然后基于所述风格化文字图像以及三维风格化模式,生成多张视频帧,并基于视频帧,生成与所述目标文字对应的风格化文字视频。通过这种方式,可以实时的生成个性化的风格化文字视频,提升了风格化文字视频的处理速度和处理质量。

43、为使本公开的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。

本文档来自技高网...

【技术保护点】

1.一种文字处理方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述按照所述风格提示信息,生成与所述目标文字对应的风格化文字图像,包括:

3.根据权利要求1所述的方法,其特征在于,所述基于所述风格化文字图像以及动态风格化模型,生成多张与所述风格化文字图像对应的视频帧,包括:

4.根据权利要求3所述的方法,其特征在于,所述第一图像特征包括各初始图像分别对应的子图像特征;

5.根据权利要求4所述的方法,其特征在于,所述分别为所述第一图像特征中的各子图像特征添加噪声,包括:

6.根据权利要求3所述的方法,其特征在于,所述第一图像特征包括各初始图像分别对应的子图像特征;

7.根据权利要求6所述的方法,其特征在于,所述将所述第二图像特征输入至所述动态风格化模型中,生成多张与所述风格化文字图像对应的视频帧,包括:

8.根据权利要求1~7任一所述的方法,其特征在于,所述动态风格化模型基于以下方法调整得到:

9.一种文字处理装置,其特征在于,包括:

10.一种计算机设备,其特征在于,包括:处理器、存储器和总线,所述存储器存储有所述处理器可执行的机器可读指令,当计算机设备运行时,所述处理器与所述存储器之间通过总线通信,所述机器可读指令被所述处理器执行时执行如权利要求1至8任一项所述的文字处理方法的步骤。

11.一种计算机可读存储介质,其特征在于,该计算机可读存储介质上存储有计算机程序,该计算机程序被处理器运行时执行如权利要求1至8任一项所述的文字处理方法的步骤。

...

【技术特征摘要】

1.一种文字处理方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述按照所述风格提示信息,生成与所述目标文字对应的风格化文字图像,包括:

3.根据权利要求1所述的方法,其特征在于,所述基于所述风格化文字图像以及动态风格化模型,生成多张与所述风格化文字图像对应的视频帧,包括:

4.根据权利要求3所述的方法,其特征在于,所述第一图像特征包括各初始图像分别对应的子图像特征;

5.根据权利要求4所述的方法,其特征在于,所述分别为所述第一图像特征中的各子图像特征添加噪声,包括:

6.根据权利要求3所述的方法,其特征在于,所述第一图像特征包括各初始图像分别对应的子图像特征;

7.根据权利要求6所述的方法,其特征在于...

【专利技术属性】
技术研发人员:张涛苏俊杰欧阳双
申请(专利权)人:北京字跳网络技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1