利用文本生成视频的方法、装置、计算设备及存储介质制造方法及图纸

技术编号:35473719 阅读:16 留言:0更新日期:2022-11-05 16:20
本发明专利技术公开了利用文本生成视频的方法、装置、计算设备及存储介质。其中,利用文本生成视频的方法包括步骤:基于业务场景,从视频模板库中选取任一个视频模板,其中视频模板库中包含不同业务场景下的至少一个视频模板;确定视频模板中的动态资源参数,动态资源参数包括动态资源的显示位置、显示时间、显示顺序;基于动态资源参数,从文本中获取相应的动态资源;以及将所获取的动态资源写入视频模板,以生成视频。频。频。

【技术实现步骤摘要】
利用文本生成视频的方法、装置、计算设备及存储介质


[0001]本公开涉及计算机网络
,尤其涉及利用文本生成视频的方法、装置、计算设备及存储介质。

技术介绍

[0002]随着手机、平板等移动终端的普及和网络的提速,短视频逐渐变得流行起来,相比于静态的文字和图片,短视频更受人们的欢迎。此外,短视频在线上广告业务等领域也有重要的作用。相比采用文章形式的广告,采用短视频形式的广告可以带来更多的流量并提升广告转化率。
[0003]现有的制作短视频方案大多是基于人工制作短视频,其需要投入较大的人力、物力和时间成本。还有一种方案是利用深度学习的GAN网络自动生成短视频,然而基于深度学习生成的短视频,其视频质量极度依赖于训练数据,无法保证百分百可靠,有可能会制作出整体效果很差的短视频,换言之,短视频的生成质量不可控。
[0004]因此,需要一种既能节省成本、又能控制短视频质量的生成短视频的方案。

技术实现思路

[0005]本公开提供了利用文本生成视频的方案,以力图解决或者至少缓解上面存在的至少一个问题。
[0006]根据本公开的一个方面,提供了一种利用文本生成视频的方法,包括步骤:基于业务场景,从视频模板库中选取任一个视频模板,其中视频模板库中包含不同业务场景下的至少一个视频模板;确定视频模板中的动态资源参数,动态资源参数包括动态资源的显示位置、显示时间、显示顺序;基于动态资源参数,从文本中获取相应的动态资源;以及将所获取的动态资源写入视频模板,以生成视频。
[0007]可选地,根据本公开的方法还包括构建视频模板库的步骤:对各业务场景对应的文章分别进行解析,获取对应的关键信息,关键信息包括文字、图片;针对每个文章的关键信息,生成至少一个视频模板;基于所生成的视频模块,构建视频模板库。
[0008]可选地,在根据本公开的方法中,针对每个文章的关键信息,生成至少一个视频模板的步骤包括:针对每个文章,基于该文章的关键信息,确定静态资源和动态资源,其中静态资源包括与所述视频模板相关联的图片、文字、背景、动画效果中的至少一个,动态资源包括待写入的文本、图片和音频中的至少一个;定义动态资源参数;基于静态资源和动态资源参数,生成该文章对应的一个视频模板。
[0009]可选地,在根据本公开的方法中,定义动态资源参数的步骤包括:生成用于依序指示各待写入文本的位置的第一序列;生成用于依序指示各待写入图片的位置的第二序列;生成至少包含多个背景音乐的第三序列。
[0010]可选地,在根据本公开的方法中,第三序列还包括是否开启语音合成,且若开启语音合成,则需获取与语音相关的文本。
[0011]可选地,在根据本公开的方法中,将所获取的动态资源写入视频模板,以生成视频的步骤包括:将所获取的除待写入音频之外的动态资源写入视频模板,生成初始的视频模板;将初始的视频模板分割成多个片段并实现各片段的视频效果,得到对应的视频片段;将各视频片段按顺序连接,形成视频段;以及将获取的待写入音频与视频段融合,得到完整的视频。
[0012]可选地,根据本公开的方法还包括:当开启语音合成时,获取与语音相关的文本;基于语音合成技术,将与语音相关的文本转换为语音;将语音与所获取的背景音乐融合,作为待写入音频。
[0013]根据本公开的另一方面,提供了一种利用文本生成视频的装置,包括:视频模板匹配单元,适于基于业务场景,从视频模板库中选取任一个视频模板,其中视频模板库中包含不同业务场景下的至少一个视频模板;解析单元,适于确定视频模板中的动态资源参数,其中动态资源参数包括动态资源的显示位置、显示时间、显示顺序;资源获取单元,适于基于动态资源参数,从文本中获取相应的动态资源;以及视频合成单元,适于将所获取的动态资源写入视频模板,以生成视频。
[0014]根据本公开的再一方面,提供了一种计算设备,包括:一个或多个处理器存储器;一个或多个程序,其中所述一个或多个程序存储在存储器中并被配置为由一个或多个处理器执行,一个或多个程序包括用于执行如上任一方法的指令。
[0015]根据本公开的再一方面,提供了一种存储一个或多个程序的计算机可读存储介质,一个或多个程序包括指令,指令在被计算设备执行时,使得计算设备执行如上所述的任一方法。
[0016]综上所述,根据本公开的方案,根据业务场景选定视频模板,通过解析视频模板的动态资源参数,从文本中提取出需要的动态资源写入视频模板,以生成短视频。利用文本自动生成视频,能够大大地节省人力成本和时间成本。
[0017]另外,根据本方案,在每个业务场景下均提供了不止一个视频模板,因此,针对一个文本,可以生成多种视频,提高了生成视频的多样性。同时,由文本提供生成视频的动态资源,以保证生成视频的效果。
[0018]将本方案应用到广告业务中,相比传统的文章广告的方式,采用此方法的短视频广告形式可以大大提升点击量,提高广告转化率。
附图说明
[0019]为了实现上述以及相关目的,本文结合下面的描述和附图来描述某些说明性方面,这些方面指示了可以实践本文所公开的原理的各种方式,并且所有方面及其等效方面旨在落入所要求保护的主题的范围内。通过结合附图阅读下面的详细描述,本公开的上述以及其它目的、特征和优势将变得更加明显。遍及本公开,相同的附图标记通常指代相同的部件或元素。
[0020]图1示出了根据本公开一些实施例的计算设备100的示意图;
[0021]图2示出了根据本公开一些实施例的利用文本生成短视频的方法200的流程示意图;
[0022]图3示出了根据本公开一些实施例的利用文本生成短视频的装置300的示意图。
具体实施方式
[0023]下面将参照附图更详细地描述本公开的示例性实施例。虽然附图中显示了本公开的示例性实施例,然而应当理解,可以以各种形式实现本公开而不应被这里阐述的实施例所限制。相反,提供这些实施例是为了能够更透彻地理解本公开,并且能够将本公开的范围完整的传达给本领域的技术人员。
[0024]如前文所述,针对现有方案中存在的问题,本公开提出了一种利用文本生成视频(尤其是短视频)的方案。短视频一般是指时长在5分钟以内的视频。根据本公开,文本可以是一个完整的文本段落、一篇文章,也可以是包含短视频构思的几个句子、关键词、图片等,本公开对此不做过多限制。
[0025]图1示出了根据本公开一个实施例的计算设备100的结构框图。
[0026]如图1所示,在基本配置102中,计算设备100典型地包括系统存储器106和一个或者多个处理器104。存储器总线108可以用于在处理器104和系统存储器106之间的通信。
[0027]取决于期望的配置,处理器104可以是任何类型的处理器,包括但不限于:微处理器(μP)、微控制器(μC)、数字信息处理器(DSP)或者它们的任何组合。处理器104可以包括诸如一级高速缓存110和二级高速缓存112之类的一个或者多个级别的高速缓存、处理器核心114和寄存器116。本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种利用文本生成视频的方法,包括步骤:基于业务场景,从视频模板库中选取任一个视频模板,其中,所述视频模板库中包含不同业务场景下的至少一个视频模板;确定所述视频模板中的动态资源参数,所述动态资源参数包括动态资源的显示位置、显示时间、显示顺序;基于所述动态资源参数,从文本中获取相应的动态资源;以及将所获取的动态资源写入所述视频模板,以生成视频。2.如权利要求1所述的方法,还包括构建所述视频模板库的步骤:对各业务场景对应的文章分别进行解析,获取对应的关键信息,所述关键信息包括文字、图片;针对每个文章的关键信息,生成至少一个视频模板;基于所生成的视频模块,构建视频模板库。3.如权利要求2所述的方法,其中,所述针对每个文章的关键信息,生成至少一个视频模板的步骤包括:针对每个文章,基于该文章的关键信息,确定静态资源和动态资源,其中,所述静态资源包括与所述视频模板相关联的图片、文字、背景、动画效果中的至少一个,所述动态资源包括待写入的文本、图片和音频中的至少一个;定义动态资源参数;基于所述静态资源和所述动态资源参数,生成该文章对应的一个视频模板。4.如权利要求3所述的方法,其中,所述定义动态资源参数的步骤包括:生成用于依序指示各待写入文本的位置的第一序列;生成用于依序指示各待写入图片的位置的第二序列;生成至少包含多个背景音乐的第三序列。5.如权利要求4所述的方法,其中,所述第三序列还包括是否开启语音合成,且若开启语音合成,则需获取与语音相关的文本。6.如权利要求1

5中任一项所述的方法,其中,所述将所获取的动态资源写入视频模板...

【专利技术属性】
技术研发人员:黄萧李林徐丞申刘荣
申请(专利权)人:北京皮尔布莱尼软件有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1