视频生成方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:39423216 阅读:8 留言:0更新日期:2023-11-19 16:11
本申请涉及人工智能技术领域,用于提高视频生成效率,公开了一种视频生成方法,用于后端服务器,方法部分包括:获取用户音频和视频模板标识,并获取目标文案;解析所述用户音频,以确定用户音色;按照所述用户音色,将所述目标文案记载的内容转换为目标文案配音;从视频模板库下载与所述视频模板标识匹配的目标视频模板;根据所述目标文案配音和目标视频模板生成目标视频。生成目标视频。生成目标视频。

【技术实现步骤摘要】
视频生成方法、装置、计算机设备及存储介质


[0001]本申请涉及人工智能
,尤其涉及一种视频生成方法、装置、计算机设备及存储介质。

技术介绍

[0002]目前短视频创作正流行,很多自媒体创作者通过短视频分享一些专业的知识讲解,一段几分钟的视频就能够简明扼要的介绍一些专业详细的知识,极大的吸引了用户浏览的兴趣,同时也吸引了一部分普通创作者去跟拍同类型视频,因此,短视频技术目前比较流行。
[0003]然而,传统的方案中,跟拍此类视频的专业要求高,拍摄难度大,需要大量时间才能完成一个高质量的专业内容讲解视频,并且有部分视频创作者并不想真人出镜拍摄视频,只想单纯分享一个专业知识点的视频,然后自己添加素材、音乐、添加字幕和剪辑视频,而且用户必须提前拍摄一段视频,如果用户不能自己拍摄视频,则不能进行跟拍创作视频,上述缺陷导致现有的短视频生成技术需要花费大量时间,短视频生成效率不高。

技术实现思路

[0004]本申请提供一种视频生成方法、装置、计算机设备及存储介质,以解决短视频生成效率不高的问题。
[0005]一种视频生成方法,用于后端服务器,包括:
[0006]获取用户音频和视频模板标识,并获取目标文案;
[0007]解析所述用户音频,以确定用户音色;
[0008]按照所述用户音色,将所述目标文案记载的内容转换为目标文案配音;
[0009]从视频模板库下载与所述视频模板标识匹配的目标视频模板;
[0010]根据所述目标文案配音和目标视频模板生成目标视频
[0011]一种视频生成方法,用于终端设备,包括:
[0012]当进入配音模式页面后,响应用户录音指令以接收所述用户录入的用户音频,并响应文案选择指令,以确定所述用户选择的目标文案和所述目标文案对应的视频模板标识;
[0013]将所述用户音频和目标文案上传至文件服务器,使所述文件服务器反馈回对应的下载链接;
[0014]将所述下载链接和视频模板标识发送给后端服务器,以使后端服务器基于所述下载链接和视频模板标识生成目标视频。
[0015]一种视频生成装置,用于后端服务器,所述装置包括:
[0016]获取模块,用于获取用户音频和视频模板标识,并获取目标文案;
[0017]解析模块,用于解析所述用户音频,以确定用户音色;
[0018]转换模块,用于按照所述用户音色,将所述目标文案记载的内容转换为目标文案
配音;
[0019]下载模块,用于从视频模板库下载与所述模板标识匹配的目标视频模板;
[0020]生成模块,用于根据所述目标文案配音和目标视频模板生成目标视频。
[0021]一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述视频生成方法。
[0022]一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述视频生成方法。
[0023]上述视频生成方法、装置、计算机设备及存储介质所实现的方案中,与传统的方案相比,提出了另外一种快速短视频生成方式,提出的方案中,后端服务器只需一段包含用户音色的用户音频,结合视频模板和转换后的用户音色即可快速生成相应的视频,大大降低了视频制作的门槛,节约了用户的时间,帮助用户快速的创作具有自身音色的特色视频,拉近用户与客户之间的距离,潜在帮助用户提升个人形象,且有效地提升视频创造效率,帮助用户更快速的生成视频,更好的完成视频创作,而且利用后端服务器,避免终端设备合成,也能够进一步提高处理效率。
附图说明
[0024]为了更清楚地说明本申请实施例的技术方案,下面将对本申请实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。
[0025]图1是本申请一实施例中视频生成系统的一系统示意图;
[0026]图2是本申请一实施例中视频生成方法的一流程示意图;
[0027]图3是本申请图2中步骤S105的一流程示意图;
[0028]图4是本申请一实施例中视频生成方法的另一流程示意图;
[0029]图5是本申请一实施例中视频生成装置的一结构示意图;
[0030]图6是本申请一实施例中视频生成装置的另一结构示意图;
[0031]图7是本申请一实施例中计算机设备的一结构示意图。
具体实施方式
[0032]下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本申请一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。
[0033]本申请实施例提供的视频生成方法,该视频生成方法可应用如图1所示的应用环境中,具体地,该视频生成方法应用在视频生成系统中,该视频生成系统包括如图1所示的终端设备、文件服务器和远端服务器,终端设备上安装有客户端,客户端又称为用户端,是指与服务器相对应,为客户提供本地服务的程序。客户端可安装在但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备等终端设备上。服务器可以用独立的服务器或者是多个服务器组成的服务器集群来实现。下面,分别通过终端设备侧以及
后端服务器侧,描述本申请提供的视频生成方法。
[0034]在一实施例中,如图1所示,提供一种视频生成方法,以该方法应用在图1中的后端服务器为例进行说明,包括如下步骤:
[0035]S101:获取用户音频和视频模板标识,并获取目标文案。
[0036]用户可通过终端设备触发视频生成任务,视频生成任务可以理解为是一种短视频生成任务,也可以是一般的视频生成任务,具体不做限定。在用户通过终端设备触发视频生成任务之后,后端服务器会响应该视频生成任务,获取用户音频和视频模板标识,并获取目标文案。
[0037]其中,用户音频是一段包含用户音色的音频,视频模板标识与视频模板一一对应,目标文案为候选文案的其中一个文案。目标文案是包含文字内容的文字记载,具体文案内容不做限定,比如,该文案内容可以是一段剧本,也可以是一段散文等等,依据短视频特点,该文案的剧本内容通常为一段简单的文案内容。
[0038]S102:解析所述用户音频,以确定用户音色。
[0039]S103:按照所述用户音色,将所述目标文案记载的文字内容转换为目标文案配音。
[0040]后端服务器在得到用户音频、视频模板标识和目标文案之后,解析用户音频得到用户音色,用户音色可以理解为音品,是反映用户声音特殊的特征。可以理解的是,每个人发出的声音是具有其相应的音色特点的,也即每个人的声音具有相应的音色特征,该实施例,需解释用户音频从而得到该用户音色。本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种视频生成方法,用于后端服务器,其特征在于,包括:获取用户音频和视频模板标识,并获取目标文案;解析所述用户音频,以确定用户音色;按照所述用户音色,将所述目标文案记载的内容转换为目标文案配音;从视频模板库下载与所述视频模板标识匹配的目标视频模板;根据所述目标文案配音和目标视频模板生成目标视频。2.如权利要求1所述的视频生成方法,其特征在于,所述获取用户音频和视频模板标识,包括:接收文件服务器发送的下载链接和终端设备发送的视频模板标识,所述下载链接为所述文件服务器接收到终端设备将录制的所述用户音频时所生成,所述视频模板标识为所述用户在录制所述用户音频时所选择;按照所述下载链接,从所述文件服务器下载所述用户音频。3.如权利要求1所述的视频生成方法,其特征在于,所述用户音频为所述用户通过终端设备开启音频录制后所录入的任意一段用户音频;或者,所述用户音频为所述用户通过所述终端设备开启音频录制后,按照所述目标文案所录入的任意一段用户音频。4.如权利要求1所述的视频生成方法,其特征在于,所述根据所述目标文案配音和目标视频模板生成目标视频,包括:解析所述目标文案配音的配音持续时长,以及所述目标视频模板的视频持续时长;当所述配音持续时长在所述视频持续时长的时长范围内,则将所述目标文案配音插入所述目标视频模板中的对应播放位置,以生成所述目标视频;当所述配音持续时长超过所述视频持续时长的时长范围,则压缩所述目标文案配音的配音速度且保持配音原始内容,以缩短所述配音持续时长在所述时长范围内,将经过压缩的所述目标文案配音插入所述目标视频模板中的对应播放位置,以生成所述目标视频。5.如权利要求1

4任一项所述的视频生成方法,其特征在于,所述视频模板库中的视频模板为通过如下方式构建:获取大量候选视频模板,并按照预设检验规则对所述候选视频模板进行校验,所述预设校验...

【专利技术属性】
技术研发人员:杨丹
申请(专利权)人:中国平安人寿保险股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1