一种视频字幕添加方法、装置、电子设备和可读存储介质制造方法及图纸

技术编号:37666712 阅读:23 留言:0更新日期:2023-05-26 04:25
本申请提供了一种视频字幕添加方法、装置、电子设备和可读存储介质,涉及视频处理技术领域。该方法包括:获取待添加视频和字幕文案,并按照视频播放顺序,将待添加视频拆分为多帧图像,以及以标点符号为分隔符,将字幕文案拆分为多个语句;确定每个语句对应的图像帧数,以及确定每个语句对应的起始图像和结尾图像,并将每个语句包含的文字,添加至其对应的起始图像与结尾图像之间的图像上,得到添加字幕后的多帧目标图像;按照视频播放顺序,将多帧目标图像进行合并,生成添加字幕后的目标视频。本申请实现了更加简便的视频字幕添加,提高了添加效率,降低了添加错误率,并且两句话的字幕之间具有一定的时间间隔,实现语句之间的停顿。的停顿。的停顿。

【技术实现步骤摘要】
一种视频字幕添加方法、装置、电子设备和可读存储介质


[0001]本申请涉及视频处理
,尤其是涉及到一种视频字幕添加方法、视频字幕添加装置、电子设备和可读存储介质。

技术介绍

[0002]近年来,自媒体的发展如火如荼,各大短视频平台应运而生,用户利用短视频生成技术实现短视频的生成,进而进行发布。具体地,将文案文本转译为对应的音频,利用嘴形驱动技术,用音频让某一形象“动起来”,最后再利用语音识别技术将音频识别为文字,将文字添加至视频。
[0003]但是,语音识别算法的训练需要大量训练数据,且为更好的效果,针对不同的话术场景需要不同的训练数据,开发过程耗时费力;并且,由于语音识别算法存在错误率,这就导致生成的字幕存在一定量的错别字,则需要人工进行检查修改。

技术实现思路

[0004]有鉴于此,本申请提供了一种视频字幕添加方法、视频字幕添加装置、电子设备和可读存储介质,实现了更加简便的视频字幕添加,提高了视频字幕添加效率,降低了视频字幕添加错误率。
[0005]第一方面,本申请实施例提供了一种视频字幕添加方法,包括:获取待添加视频和字幕文案,并按照视频播放顺序,将待添加视频拆分为多帧图像,以及以标点符号为分隔符,将字幕文案拆分为多个语句;确定每个语句对应的图像帧数,以及确定每个语句对应的起始图像和结尾图像,并将每个语句包含的文字,添加至其对应的起始图像与结尾图像之间的图像上,得到添加字幕后的多帧目标图像;按照视频播放顺序,将多帧目标图像进行合并,生成添加字幕后的目标视频。
[0006]根据本申请实施例的上述方法,还可以具有以下附加技术特征:
[0007]在上述技术方案中,可选地,根据每个语句向每帧图像添加字幕,得到添加字幕后的多帧目标图像,具体包括:确定每个语句对应的图像帧数,以及确定每个语句对应的起始图像和结尾图像;将每个语句包含的文字,添加至其对应的起始图像与结尾图像之间的图像上,得到添加字幕后的多帧目标图像。
[0008]在上述任一技术方案中,可选地,确定每个语句对应的图像帧数,具体包括:根据多帧图像的总数量和字幕文案的文字总字数,计算字幕文案的每个文字对应的图像帧数;根据每个文字对应的图像帧数和语句包含的文字字数,计算每个语句对应的图像帧数。
[0009]在上述任一技术方案中,可选地,字幕文案的文字总字数不包括标点符号的数量。
[0010]在上述任一技术方案中,可选地,在将每个语句包含的文字,添加至其对应的起始图像与结尾图像之间的图像上之前,还包括:若语句对应的图像帧数不为整数,且图像帧数的小数部分大于或等于0.5,则图像帧数向上取整;若语句对应的图像帧数不为整数,且图像帧数的小数部分小于0.5,则图像帧数向下取整。
[0011]在上述任一技术方案中,可选地,对于第i个语句,将第i个语句包含的文字,添加至其对应的起始图像与结尾图像之间的图像上,具体包括:将第i个语句包含的文字,添加至第一图像与第二图像之间的每帧图片上;其中,第一图像为第i个语句的起始图像的后a个图像,第二图像为第i个语句的结尾图像的前b个图像,a、b均为大于或等于1,且小于或等于4的整数,i为大于或等于1,且小于或等于多个语句的总数量。
[0012]在上述任一技术方案中,可选地,目标视频的视频时长小于或等于3分钟。
[0013]在上述任一技术方案中,可选地,字幕文案为文案编辑人员所编辑的,且在以标点符号为分隔符,将字幕文案拆分为多个语句之前,还包括:对字幕文案进行校正,保留有效文案。
[0014]第二方面,本申请实施例提供了一种视频字幕添加装置,包括:获取模块,用于获取待添加视频和字幕文案;拆分模块,用于按照视频播放顺序,将待添加视频拆分为多帧图像,以及以标点符号为分隔符,将字幕文案拆分为多个语句;字幕添加模块,用于确定每个语句对应的图像帧数,以及确定每个语句对应的起始图像和结尾图像,并将每个语句包含的文字,添加至其对应的起始图像与结尾图像之间的图像上,得到添加字幕后的多帧目标图像;图像合并模块,用于按照视频播放顺序,将多帧目标图像进行合并,生成添加字幕后的目标视频。
[0015]第三方面,本申请实施例提供了一种电子设备,该电子设备包括处理器和存储器,存储器存储可在处理器上运行的程序或指令,程序或指令被处理器执行时实现如第一方面的方法的步骤。
[0016]第四方面,本申请实施例提供了一种可读存储介质,该可读存储介质上存储程序或指令,程序或指令被处理器执行时实现如第一方面的方法的步骤。
[0017]第五方面,本申请实施例提供了一种芯片,该芯片包括处理器和通信接口,通信接口和处理器耦合,处理器用于运行程序或指令,实现如第一方面的方法。
[0018]第六方面,本申请实施例提供一种计算机程序产品,该程序产品被存储在存储介质中,该程序产品被至少一个处理器执行以实现如第一方面的方法。
[0019]在本申请实施例中,在获取到待添加视频后,按照视频播放顺序,也即图像帧的时间顺序,将待添加视频拆分为M帧图像,以及获取需要添加为视频字幕的字幕文案,该字幕文案由文字、字母、标点符号等构成,并将字幕文案按照其包含的标点符号拆分为Z个语句,M为大于1的整数,Z为大于1的整数。进一步地,将图像帧数与字幕字数映射起来,从而实现向图像添加字幕,得到添加字幕后的多帧目标图像。最后,再按照视频播放顺序,也即图像帧的时间顺序,将多帧目标图像进行合并,得到添加字幕后的目标视频。并且,在根据每个语句向每帧图像添加字幕时,对于任一语句,确定该语句对应的图像帧数,再确定该语句对应的起始图像和结尾图像,最后将该语句包含的文字,添加至起始图像与结尾图像之间的图像上。也就是说,该语句对应的起始图像和结尾图像上不添加文字,使得每个语句之间至少有两帧图像上没有文字,由此使得两句话的字幕之间具有一定的时间间隔,实现语句之间的停顿。
[0020]本申请实施例中,一方面,添加至视频的字幕直接来自于原字幕文案,方法操作简单,字幕添加速度快。相比于相关技术中利用语音识别模型的方法,无需收集语音数据训练语音识别模型,避免视频开发过程耗时费力,且降低了视频字幕添加错误率。另一方面,在
语句对应的起始图像与结尾图像之间的图像上添加文字,使得两句话的字幕之间具有一定的时间间隔,实现语句之间的停顿,保证更好的视觉感觉。
[0021]上述说明仅是本申请技术方案的概述,为了能够更清楚了解本申请的技术手段,而可依照说明书的内容予以实施,并且为了让本申请的上述和其它目的、特征和优点能够更明显易懂,以下特举本申请的具体实施方式。
附图说明
[0022]此处所说明的附图用来提供对本申请的进一步理解,构成本申请的一部分,本申请的示意性实施例及其说明用于解释本申请,并不构成对本申请的不当限定。在附图中:
[0023]图1示出了本申请实施例的视频字幕添加方法的流程示意图;
[0024]图2示出了本申请实施例的视频字幕添加装置的结构框图;
[0025]图3示出了本申本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种视频字幕添加方法,其特征在于,包括:获取待添加视频和字幕文案,并按照视频播放顺序,将所述待添加视频拆分为多帧图像,以及以标点符号为分隔符,将所述字幕文案拆分为多个语句;确定每个所述语句对应的图像帧数,以及确定每个所述语句对应的起始图像和结尾图像,并将每个所述语句包含的文字,添加至其对应的起始图像与结尾图像之间的图像上,得到添加字幕后的多帧目标图像;按照所述视频播放顺序,将多帧所述目标图像进行合并,生成添加字幕后的目标视频。2.根据权利要求1所述的方法,其特征在于,确定每个所述语句对应的图像帧数,具体包括:根据多帧所述图像的总数量和所述字幕文案的文字总字数,计算所述字幕文案的每个文字对应的图像帧数;根据每个文字对应的图像帧数和所述语句包含的文字字数,计算每个所述语句对应的图像帧数。3.根据权利要求1所述的方法,其特征在于,所述字幕文案的文字总字数不包括所述标点符号的数量。4.根据权利要求1所述的方法,其特征在于,在将每个所述语句包含的文字,添加至其对应的起始图像与结尾图像之间的图像上之前,还包括:若所述语句对应的图像帧数不为整数,且图像帧数的小数部分大于或等于0.5,则所述图像帧数向上取整;若所述语句对应的图像帧数不为整数,且图像帧数的小数部分小于0.5,则所述图像帧数向下取整。5.根据权利要求1所述的方法,其特征在于,对于第i个语句,将所述第i个语句包含的文字,添加至其对应的起始图像与结尾图像之间的图像上,具体包括:将所述第i个语句包含的文字,添加至第一图像与第二图像之间的每帧图片上;其中,所述第一图像为...

【专利技术属性】
技术研发人员:王月宝黄明星李银锋刘海伦许垒沈鹏胡尧周晓波
申请(专利权)人:北京水滴科技集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1