System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 字幕处理方法、装置、计算机设备、存储介质和计算机程序产品制造方法及图纸_技高网

字幕处理方法、装置、计算机设备、存储介质和计算机程序产品制造方法及图纸

技术编号:42600652 阅读:21 留言:0更新日期:2024-09-03 18:12
本申请涉及一种字幕处理方法、装置、计算机设备、存储介质和计算机程序产品。所述方法包括:在客户端播放目标视频、且针对所述目标视频开启字幕功能的情况下,确定针对所述目标视频的已缓存字幕、以及所述目标视频中未缓存字幕的待播视频片段;基于在所述目标视频的播放过程中预先缓冲的视频流,从所述视频流中获取所述待播视频片段的音频数据;对所述音频数据进行语音识别,得到与所述待播视频片段同步的目标字幕;将所述目标字幕与所述已缓存字幕进行字幕融合,得到所述目标视频的更新缓存字幕。采样上述方法,能够有效提高针对目标视频进行字幕处理的资源利用率。

【技术实现步骤摘要】

本申请涉及数据处理,特别是涉及一种字幕处理方法、装置、计算机设备、存储介质和计算机程序产品


技术介绍

1、随着多媒体技术的发展,视频等多媒体数据已成为人们日常生活中获取信息与享受娱乐的主要载体。不同的多媒体软件的爆炸式增长使海量视频,视频中的字幕对用户极为重要,通过在无字幕视频或外文未翻译视频中显示字幕,可以帮助用户更好地理解视频内容。

2、在现有技术中,可以先将用户实时观看的视频发送到服务器,等待服务器识别完成后生成字幕,对于没有提供合适字幕的视频,每个用户在观看时,都需要实时生成字幕,存在较大的资源浪费。


技术实现思路

1、基于此,有必要针对上述技术问题,提供一种能够提高资源利用率的字幕处理方法、装置、计算机设备、计算机可读存储介质和计算机程序产品。

2、第一方面,本申请提供了一种字幕处理方法。所述方法包括:

3、在客户端播放目标视频、且针对所述目标视频开启字幕功能的情况下,确定针对所述目标视频的已缓存字幕、以及所述目标视频中未缓存字幕的待播视频片段;

4、基于在所述目标视频的播放过程中预先缓冲的视频流,从所述视频流中获取所述待播视频片段的音频数据;

5、对所述音频数据进行语音识别,得到与所述待播视频片段同步的字幕;

6、将所述目标字幕与所述已缓存字幕进行字幕融合,得到所述目标视频的更新缓存字幕。

7、第二方面,本申请还提供了一种字幕处理装置。所述装置包括:

8、字幕确定模块,用于在客户端播放目标视频、且针对所述目标视频开启字幕功能的情况下,确定针对所述目标视频的已缓存字幕、以及所述目标视频中未缓存字幕的待播视频片段;

9、音频获取模块,用于基于在所述目标视频的播放过程中预先缓冲的视频流,从所述视频流中获取所述待播视频片段的音频数据;

10、字幕处理模块,用于对所述音频数据进行语音识别,得到与所述待播视频片段同步的字幕;

11、字幕融合模块,用于将所述目标字幕与所述已缓存字幕进行字幕融合,得到所述目标视频的更新缓存字幕。

12、第三方面,本申请还提供了一种计算机设备。所述计算机设备包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现所述字幕处理方法的各实施例的步骤。

13、第四方面,本申请还提供了一种计算机可读存储介质。所述计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现所述字幕处理方法的各实施例的步骤。

14、第五方面,本申请还提供了一种计算机程序产品。所述计算机程序产品,包括计算机程序,该计算机程序被处理器执行时实现所述字幕处理方法的各实施例的步骤。

15、上述字幕处理方法、装置、计算机设备、存储介质和计算机程序产品,在开启字幕功能的目标视频包含未缓存字幕的待播视频片段的情况下,从视频流中获取待播视频片段的音频数据,能够有效利用客户端提前缓冲的视频流进行字幕识别,不需要下载完整的视频,即可实现字幕在用户观看视频内容前提前生成,并且针对已缓冲视频流,只需要从中获取音频数据,无需传输全部的视频流进行语言识别,能够节省带宽资源,在获取到音频数据之后,通过对音频数据进行语音识别得到与待播视频片段同步的字幕,最后将目标字幕与已缓存字幕进行字幕融合,得到目标视频的更新缓存字幕,能够利用不同用户播放相同的视频时各自的缓冲视频流分别得到的字幕,通过字幕融合优化,形成一个更加完整和准确的字幕缓存,解决了每个用户都要识别一遍音频浪费资源的问题,有效提高针对目标视频进行字幕处理的资源利用率。

本文档来自技高网...

【技术保护点】

1.一种字幕处理方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述字幕包括置信句和非置信句;

3.根据权利要求2所述的方法,其特征在于,所述方法还包括:

4.根据权利要求1所述的方法,其特征在于,所述已缓存字幕为第一客户端播放所述目标视频时对已缓冲视频流中的音频数据进行语言识别得到的字幕;

5.根据权利要求1所述的方法,其特征在于,所述从所述视频流中获取所述待播视频片段的音频数据,包括: 

6.根据权利要求1所述的方法,其特征在于,所述待播视频片段的音频数据包括按单位时长划分的多个音频片段;

7.根据权利要求6所述的方法,其特征在于,所述语音识别请求还携带有置信时间点,所述置信时间点基于所述语音识别请求的开始节点或同系列连续音频流中的前一字幕句的结束显示时间确定;

8.根据权利要求1所述的方法,其特征在于,所述在客户端播放目标视频、且针对所述目标视频开启字幕功能的情况下,确定针对所述目标视频的已缓存字幕、以及所述目标视频中未缓存字幕的待播视频片段,包括:

9.根据权利要求8所述的方法,其特征在于,所述目标视频的每一所述已缓存字幕均包括显示时间和字幕内容,各所述已缓存字幕按照所述显示时间顺序存储于字幕数组;

10.根据权利要求9所述的方法,其特征在于,所述显示时间包括开始显示时间和结束显示时间;

11.根据权利要求1至10中任一项所述的方法,其特征在于,所述字幕基于红黑树结构存储;所述方法还包括:

12.根据权利要求1至10中任一项所述的方法,其特征在于,所述对所述音频数据进行语音识别,得到与所述待播视频片段同步的目标字幕,包括:

13.一种字幕处理装置,其特征在于,所述装置包括:

14.一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,其特征在于,所述处理器执行所述计算机程序时实现权利要求1至12中任一项所述的方法的步骤。

15.一种计算机可读存储介质,其上存储有计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至12中任一项所述的方法的步骤。

16.一种计算机程序产品,包括计算机程序,其特征在于,所述计算机程序被处理器执行时实现权利要求1至12中任一项所述的方法的步骤。

...

【技术特征摘要】

1.一种字幕处理方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述字幕包括置信句和非置信句;

3.根据权利要求2所述的方法,其特征在于,所述方法还包括:

4.根据权利要求1所述的方法,其特征在于,所述已缓存字幕为第一客户端播放所述目标视频时对已缓冲视频流中的音频数据进行语言识别得到的字幕;

5.根据权利要求1所述的方法,其特征在于,所述从所述视频流中获取所述待播视频片段的音频数据,包括: 

6.根据权利要求1所述的方法,其特征在于,所述待播视频片段的音频数据包括按单位时长划分的多个音频片段;

7.根据权利要求6所述的方法,其特征在于,所述语音识别请求还携带有置信时间点,所述置信时间点基于所述语音识别请求的开始节点或同系列连续音频流中的前一字幕句的结束显示时间确定;

8.根据权利要求1所述的方法,其特征在于,所述在客户端播放目标视频、且针对所述目标视频开启字幕功能的情况下,确定针对所述目标视频的已缓存字幕、以及所述目标视频中未缓存字幕的待播视频片段,包括:

9.根据权利要求8所述的方法...

【专利技术属性】
技术研发人员:陈博陈宇罗阳
申请(专利权)人:腾讯科技成都有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1