当前位置: 首页 > 专利查询>OPPO专利>正文

信息播报视频的生成方法技术

技术编号:39423485 阅读:7 留言:0更新日期:2023-11-19 16:11
本申请实施例公开了一种信息播报视频的生成方法

【技术实现步骤摘要】
信息播报视频的生成方法、装置、设备及存储介质


[0001]本申请实施例涉及人工智能
,特别涉及一种信息播报视频的生成方法

装置

设备及存储介质


技术介绍

[0002]在信息时代,人们通过电视

手机

电脑

平板等各种设备获取信息资讯,尤其在短视频行业崛起的当下,人们倾向于通过观看信息播报视频来满足自己的信息获取需求

[0003]然而,传统的信息播报视频需要摄影

剪辑

编辑

主播等各行专业人员的配合协作,需要消耗大量人力物力,并且制作成本高

制作周期长

同时,考虑到视频制作的专业化需求,信息播报视频对视频制作人员存在技术门槛限制,导致信息播报视频无法批量制作


技术实现思路

[0004]本申请实施例提供了一种信息播报视频的生成方法

装置

设备及存储介质

所述技术方案如下:
[0005]一方面,本申请实施例提供了一种信息播报视频的生成方法,所述方法包括:
[0006]将虚拟主播样图以及形象需求输入图生成模型,得到虚拟主播形象图,所述虚拟主播形象图中的虚拟主播符合所述形象需求;
[0007]通过大语言模型对原始语料进行关键信息提取,得到所述原始语料中的关键语料;
[0008]基于所述关键语料生成播报脚本;
[0009]将所述虚拟主播形象图以及所述播报脚本对应的播报音频输入视频生成模型,得到信息播报视频,所述信息播报视频包含所述虚拟主播的动态播报画面,且所述动态播报画面与所述播报音频同步

[0010]另一方面,本申请实施例提供了一种信息播报视频的生成装置,所述装置包括:
[0011]虚拟主播形象图生成模块,用于将虚拟主播样图以及形象需求输入图生成模型,得到虚拟主播形象图,所述虚拟主播形象图中的虚拟主播符合所述形象需求;
[0012]关键信息提取模块,用于通过大语言模型对原始语料进行关键信息提取,得到所述原始语料中的关键语料;
[0013]播报脚本生成模块,用于基于所述关键语料生成播报脚本;
[0014]信息播报视频生成模块,将所述虚拟主播形象图以及所述播报脚本对应的播报音频输入视频生成模型,得到信息播报视频,所述信息播报视频包含所述虚拟主播的动态播报画面,且所述动态播报画面与所述播报音频同步

[0015]另一方面,本申请实施例提供了一种计算机设备,所述计算机设备包括处理器

存储器,所述存储器中存储至少一条程序代码,所述至少一条程序代码由所述处理器加载并执行以实现如上述方面所述的信息播报视频的生成方法

[0016]另一方面,本申请实施例提供了一种计算机可读存储介质,所述存储介质存储有
至少一条程序代码,所述至少一条程序代码用于被处理器执行以实现如上述方面所述的信息播报视频的生成方法

[0017]另一方面,本申请实施例提供了一种计算机程序产品,该计算机程序产品包括计算机指令,该计算机指令存储在计算机可读存储介质中

计算机设备的处理器从计算机可读存储介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备实现如上述方面提供的信息播报视频的生成方法

[0018]在本申请实施例中,计算机设备既利用了图生成模型,得到虚拟主播形象图,又利用大语言模型从原始语料中提取关键语料,并将其用于生成播报脚本

最后,将虚拟主播形象图以及播报脚本对应的播报音频输入视频生成模型,得到信息播报视频

与人工制作信息播报视频的方式相比,本申请实施例从图像

文本和视频等方面进行多模态处理,使计算机设备自动生成信息播报视频,提高了信息播报视频的制作效率,降低了信息播放视频的制作成本

附图说明
[0019]图1示出了本申请一个示例性实施例提供的实施环境的示意图;
[0020]图2示出了本申请一个示例性实施例提供的信息播报视频的生成方法的流程图;
[0021]图3是本申请一个示例性实施例示出的信息播报视频的生成过程的实施示意图;
[0022]图4示出了本申请另一个示例性实施例提供的信息播报视频的生成方法的流程图;
[0023]图5是本申请一个示例性实施例示出的数据挖掘过程的实施示意图;
[0024]图6是本申请一个示例性实施例示出的信息播报视频生成过程的流程图;
[0025]图7是本申请一个示例性实施例示出的信息播报视频生成过程的实施示意图;
[0026]图8是本申请一个示例性实施例示出的可视化图表插入过程的实施示意图;
[0027]图9示出了本申请一个示例性实施例提供的信息播报视频生成装置的结构框图;
[0028]图
10
示出了本申请一个示例性实施例提供的计算机设备的结构方框图

具体实施方式
[0029]为使本申请的目的

技术方案和优点更加清楚,下面将结合附图对本申请实施方式作进一步地详细描述

[0030]在本文中提及的“多个”是指两个或两个以上
。“和
/
或”,描述关联对象的关联关系,表示可以存在三种关系,例如,
A

/

B
,可以表示:单独存在
A
,同时存在
A

B
,单独存在
B
这三种情况

字符“/”一般表示前后关联对象是一种“或”的关系

[0031]请参考图1,其示出了本申请一个示例性实施例提供的实施环境的示意图,该实施环境中包含终端
101
以及服务器
102。
[0032]终端
101
具有信息播报视频展示需求的电子设备,其可以是智能手机

平板电脑

个人计算机等

其中,信息播报视频展示需求可以是终端的系统层面需求,也可以是应用程序的应用需求

[0033]服务器
102
是用于提供信息视频播报服务的服务器

其中,服务器
102
可以是终端操作系统的后台服务器,也可以是应用程序的后台服务器

[0034]在一种可能的实施方式中,用户将虚拟主播样图以及形象需求输入终端
101
,终端
101
将虚拟主播样图以及形象需求传送到服务器
102。
服务器
102
根据用户本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种信息播报视频的生成方法,其特征在于,所述方法包括:将虚拟主播样图以及形象需求输入图生成模型,得到虚拟主播形象图,所述虚拟主播形象图中的虚拟主播符合所述形象需求;通过大语言模型对原始语料进行关键信息提取,得到所述原始语料中的关键语料;基于所述关键语料生成播报脚本;将所述虚拟主播形象图以及所述播报脚本对应的播报音频输入视频生成模型,得到信息播报视频,所述信息播报视频包含所述虚拟主播的动态播报画面,且所述动态播报画面与所述播报音频同步
。2.
根据权利要求1所述的方法,其特征在于,所述通过大语言模型对原始语料进行关键信息提取,得到所述原始语料中的关键语料之后,所述方法还包括:对所述关键语料中的关键数据进行数据挖掘,得到深度挖掘数据;通过所述大语言模型对所述深度挖掘数据进行语料生成,得到深度挖掘语料;通过所述深度挖掘语料对所述关键语料进行语料扩充;所述基于所述关键语料生成播报脚本,包括:基于扩充后的所述关键语料生成所述播报脚本
。3.
根据权利要求2所述的方法,其特征在于,所述对所述关键语料中的关键数据进行数据挖掘,得到深度挖掘数据之后,所述方法还包括:基于所述关键数据以及所述深度挖掘数据生成可视化图表;将所述可视化图表插入所述信息播报视频
。4.
根据权利要求3所述的方法,其特征在于,所述将所述可视化图表插入所述信息播报视频,包括:确定所述关键数据以及所述深度挖掘数据在所述播报脚本中对应的脚本内容块;确定所述脚本内容块在所述播报音频对应的目标播放区间;在所述信息播报视频中位于所述目标播放区间内的视频帧中插入所述可视化图表
。5.
根据权利要求1所述的方法,其特征在于,所述通过大语言模型对原始语料进行关键信息提取,得到所述原始语料中的关键语料,包括:将所述原始语料以及第一提示信息输入所述大语言模型,得到所述原始语料中的所述关键语料,所述第一提示信息用于提示进行关键信息提取,且所述提示信息中包含播报时长范围,所述关键语料对应的播报时长位于所述播报时长范围内
。6.
根据权利要求1所述的方法,其特征在于,所述基于所述关键语料生成播报脚本,包括:将所述关键语料

脚本模板以及第二提示信息输入所述大语言模型,得到所述播报脚本,所述第二提示信息用于提示按照所述脚本模板生成所述播报脚本
。7.
根据权利要求1所述的方法,其特征在于,所述将虚拟主播样图以及形象需求输入图生成模型,得到虚拟主播形象图之前,所述方法还包括:将所述原始语料和第三提示信息输入所述大语言模型,得到所述形象需求,所述第三...

【专利技术属性】
技术研发人员:苏婧文王凡祎
申请(专利权)人:OPPO
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1