字幕处理方法、系统、电子设备和存储介质技术方案

技术编号:28848918 阅读:23 留言:0更新日期:2021-06-11 23:51
本申请提供了一种字幕处理方法、系统、电子设备和存储介质。所述方法包括:获取第一视频对应的文本集合;对于任意一个字幕文本,基于第一时间信息,确定第二视频中与字幕文本所对应的目标视频区间;基于目标视频区间与第一视频之间的映射关系、第一时间信息,确定字幕文本的目标时间信息;将字幕文本携带的第一时间信息,修改为目标时间信息。本申请实施例可以基于字幕文本所携带的时间信息,在第二视频中确定该字幕文本所对应的目标视频区间,并基于目标视频区间与第一视频之间的映射关系,确定字幕文本对应的目标时间信息,从而修改字幕文本所携带的时间信息,实现字幕文本与第一视频之间的时间戳匹配与关联。

【技术实现步骤摘要】
字幕处理方法、系统、电子设备和存储介质
本专利技术涉及网络
,特别是涉及一种字幕处理方法、系统、电子设备和存储介质。
技术介绍
随着互联网技术的发展,越来越多的用户使用电子设备观看影视作品和视频,为了使用户更加了解视频内容,需要对视频中的字幕进行翻译。例如,在原始视频为中文视频的情况下,对原始视频进行翻译,得到原始视频对应的英文字幕;或者,在原始视频为英文视频的情况下,对原始视频进行翻译,得到原始视频对应的中文字幕。目前,对于字幕翻译的前后期处理,大多由操作人员手动进行。翻译人员依据原始视频的原音,或者原始视频的原始字幕,对原始视频进行翻译得到字幕文件,这要求翻译人员将原始视频逐帧进行内容确定,导致对视频的翻译需要消耗大量时间。在获取到原始视频对应的字幕文件后,仍然需要操作人员进行手动操作,以将字幕文件中各字幕内容的时间戳与原始视频的时间戳,进行逐个校对与关联更正。显然,由人工进行字幕翻译工作的后期处理,影响处理效率与处理成本,更重要的是,由人工进行字幕与原始视频的时间戳匹配,存在字幕和原始视频匹配的准确度较低的问题。
技术实现思路
本专利技术实施例的目的在于提供一种字幕处理方法、系统、电子设备和存储介质,解决字幕与原始视频匹配的准确度较低的技术问题。具体技术方案如下:在本专利技术实施例的第一方面,首先提供了一种字幕处理方法,包括以下步骤:获取第一视频对应的文本集合,所述文本集合包括N个字幕文本,每个字幕文本携带第一时间信息;所述文本集合与第二视频相关联,所述第二视频为所述第一视频中包含人声的部分视频,N为正整数;对于任意一个所述字幕文本,基于所述第一时间信息,确定第二视频中与所述字幕文本所对应的目标视频区间;基于所述目标视频区间与所述第一视频之间的映射关系、所述第一时间信息,确定所述字幕文本的目标时间信息,所述目标时间信息用于指示在所述第一视频播放过程中,所述字幕文本的显示时间段;将所述字幕文本携带的所述第一时间信息,修改为所述目标时间信息。在本专利技术实施例的第二方面,还提供了一种字幕处理系统,所述字幕处理系统包括:第一获取模块,用于获取第一视频对应的文本集合,所述文本集合包括N个字幕文本,每个字幕文本携带第一时间信息;所述文本集合与第二视频相关联,所述第二视频为所述第一视频中包含人声的部分视频,N为正整数;第一确定模块,用于对于任意一个所述字幕文本,基于所述第一时间信息,确定第二视频中与所述字幕文本所对应的目标视频区间;第二确定模块,用于基于所述目标视频区间与所述第一视频之间的映射关系、所述第一时间信息,确定所述字幕文本的目标时间信息,所述目标时间信息用于指示在所述第一视频播放过程中,所述字幕文本的显示时间段;第一修改模块,用于将所述字幕文本携带的所述第一时间信息,修改为所述目标时间信息。在本专利技术实施例的第三方面,还提供了一种计算机可读存储介质,所述计算机可读存储介质中存储有指令,当其在计算机上运行时,使得计算机执行上述任一实施例所述的字幕处理方法。在本专利技术实施的第四方面,还提供了一种包含指令的计算机程序产品,当其在计算机上运行时,使得计算机执行上述任一实施例所述的字幕处理方法。本专利技术实施例中,第一视频可以视为原始视频,第二视频则为第一视频中包含人声的部分视频,而第一视频对应的文本集合实际关联于第二视频,换言之,字幕文本的文本集合实际是对第二视频进行字幕处理得到的。基于此,本专利技术实施例可以基于字幕文本所携带的时间信息,在第二视频中确定该字幕文本所对应的目标视频区间,并基于目标视频区间与第一视频之间的映射关系,来确定字幕文本所对应的目标时间信息,从而修改字幕文本所携带的时间信息,自动实现了字幕文本与第一视频之间的时间戳匹配与关联。换言之,通过前述处理,能够自动实现字幕文本到第一视频的反向映射,得到与第一视频完整适配的字幕文件,提高了字幕和原始视频的匹配准确度,有利于为用户提高较好的字幕观看体验;并且,该过程无需人工进行手动处理,能够避免人工处理所带来的对处理效率、处理成本与反向映射准确度方面带来的不利影响,提高了字幕处理效率,并能够降低字幕处理过程的时间成本与人工成本。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍。图1为本专利技术实施例中字幕处理方法的流程图;图2为本专利技术实施例中确定目标时间信息的应用场景示意图;图3为本专利技术实施例中对目标时间信息进行修正的应用场景示意图;图4为本专利技术实施例中确定目标截取区间的一应用场景示意图;图5为本专利技术实施例中确定目标截取区间的另一应用场景示意图;图6为本专利技术实施例中字幕处理方法的应用场景图;图7为本专利技术实施例中字幕处理系统的结构示意图;图8为本专利技术实施例中一种电子设备的结构示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行描述。现有技术中,当需要对视频字幕进行翻译时,将原始视频提供给翻译人员进行字幕翻译。然后,获取翻译人员对原始视频进行翻译后得到的字幕文件。容易理解的是,由于字幕文件是翻译人员人工对原始视频进行翻译后得到的,因此上述字幕文件的时间戳与原始视频的时间戳不匹配,这就需要人工将每个翻译字幕文件的时间戳与原始视频的时间戳,进行逐个的匹配校正,工作量庞大且处理过程繁杂,且存在字幕与原始视频的匹配准确度较低的问题。基于上述可能存在的技术问题,本专利技术实施例提出以下技术构思:本专利技术实施例基于字幕文本携带的时间信息,在拼接视频中确定该字幕文本所对应的目标视频区间,并基于目标视频区间与原始视频之间的映射关系,确定字幕文本所对应的目标时间信息,其中,上述目标时间信息表征字幕文本在原始视频中的显示时间,从而修改字幕文本所携带的时间信息,实现字幕文本与原始视频之间的时间戳匹配与关联。请参阅图1,图1为本专利技术实施例中字幕处理方法的流程图。本实施例提供的字幕处理方法包括以下步骤:S101,获取第一视频对应的文本集合。本步骤中,上述第一视频包括但不限于电影、电视剧、短视频或综艺中的至少一种。具体而言,第一视频也可以理解为原始视频,即待翻译的视频,获取原始视频对应的文本集合。具体而言,可以具体为对的第一视频中的原始字幕进行二次处理后得到的字幕文本集合。本专利技术实施例所涉及到的对原始字幕进行的二次处理,可以包括但不限于:翻译、加密或个性化编辑中的至少一种;其中,翻译可以包括但不限于:任意两种语言的翻译;加密可以包括但不限于以下至少一种:利用密钥加密文本、添加加密水印、将文本转换为预设的密语文本等;个性化编辑可以包括但不限于针对字幕的任意二次编辑功能,此处不作穷举。示例性的一种实施例中,该文本集合可以是翻译人员对拼接视频进行字幕翻译后得到的字幕文本的集合。为便于说明,本文后续将第一视频中包含人声的部分视频称为第二视频。上述对第一视频中包含本文档来自技高网...

【技术保护点】
1.一种字幕处理方法,其特征在于,包括:/n获取第一视频对应的文本集合,所述文本集合包括N个字幕文本,每个字幕文本携带第一时间信息;所述文本集合与第二视频相关联,所述第二视频为所述第一视频中包含人声的部分视频,N为正整数;/n对于任意一个所述字幕文本,基于所述第一时间信息,确定第二视频中与所述字幕文本所对应的目标视频区间;/n基于所述目标视频区间与所述第一视频之间的映射关系、所述第一时间信息,确定所述字幕文本的目标时间信息,所述目标时间信息用于指示在所述第一视频播放过程中,所述字幕文本的显示时间段;/n将所述字幕文本携带的所述第一时间信息,修改为所述目标时间信息。/n

【技术特征摘要】
1.一种字幕处理方法,其特征在于,包括:
获取第一视频对应的文本集合,所述文本集合包括N个字幕文本,每个字幕文本携带第一时间信息;所述文本集合与第二视频相关联,所述第二视频为所述第一视频中包含人声的部分视频,N为正整数;
对于任意一个所述字幕文本,基于所述第一时间信息,确定第二视频中与所述字幕文本所对应的目标视频区间;
基于所述目标视频区间与所述第一视频之间的映射关系、所述第一时间信息,确定所述字幕文本的目标时间信息,所述目标时间信息用于指示在所述第一视频播放过程中,所述字幕文本的显示时间段;
将所述字幕文本携带的所述第一时间信息,修改为所述目标时间信息。


2.根据权利要求1所述的方法,其特征在于,所述目标时间信息包括第一目标端点时刻,所述基于所述目标视频区间与所述第一视频之间的映射关系、所述第一时间信息,确定所述字幕文本的目标时间信息,包括:
基于所述第一时间信息,确定所述字幕文本的第一端点时刻与所述目标视频区间的第二端点时刻之间的差值;
基于所述目标视频区间与所述第一视频之间的映射关系,确定所述第二端点时刻对应的第一视频的第三端点时刻;
基于所述第三端点时刻与所述差值,确定所述字幕文本的所述第一目标端点时刻。


3.根据权利要求2所述的方法,其特征在于,所述目标时间信息包括第二目标端点时刻,所述基于所述目标视频区间与所述第一视频之间的映射关系、所述第一时间信息,确定所述字幕文本的目标时间信息,还包括:
基于所述第一时间信息,确定所述字幕文本的持续时长;
基于所述持续时长和所述第一目标端点时刻,确定所述字幕文本的所述第二目标端点时刻。


4.根据权利要求1所述的方法,其特征在于,所述方法还包括:
获取所述第二视频的实际时长与理想时长之间的时长比例;
利用所述时长比例,对所述目标时间信息进行修正。


5.根据权利要求4所述的方法,其特征在于,所述利用所述时长比例,对所述目标时间信息进行修正,包括:
当所述目标时间信息包括第一目标端点时刻时,获取所述第一目标端点时刻的数值与所述时长比例之间的第一乘积,得到修正后的第一目标端点时刻;和/或,
当所述目标时间信息包括第二目标端点时刻时,获取所述第二目标端点时刻的数值与所述时长比例之间的第二乘积,得到修正后的第二目标端点时刻。


6.根据权利要求1-5任一项所述的方法,其特征在于,所述方法还包括:
提取所述第一视频中的音频数据;
提取所述音频数据中的人声数据;
基于所述人声数据,截取所述第一视频中包含人声的各视频区间;
将所述包含人声的各视频区间进行拼接,得到所述第二视频。


7.根据权利要求6所述的方法,其特征在于,所述方法还包括:
对于所述第二视频中的任意一个所述视频区间,基于所述视频区间在所述第一视频中的时间信息,构建所述视频区间与所述第一视频之间的映射关系。


8.根据权利要求6所述的方法,其特征在于,所述基于所述人声数据,截取所述第一视频中包含人声的各视频区间,包括:
基于所述人声数据确定目...

【专利技术属性】
技术研发人员:邵峰曹荣
申请(专利权)人:北京奇艺世纪科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1