【技术实现步骤摘要】
一种处理直播流的方法和装置
本专利技术涉及计算机
,特别是涉及一种处理直播流的方法和装置。
技术介绍
由于视频直播内容的多样性,越来越多受到用户的喜爱。通常情况下,视频直播不会显示与视频同步的字幕。在出现视频直播受到音频干扰,或者视频直播中人物的发音不准确或音速过快等导致视频直播的声音不清晰的情况下,用户仅根据声音无法完全理解视频直播的节目内容,影响了用户的观看体验。
技术实现思路
本专利技术实施例的目的在于提供一种处理直播流的方法和装置,以实现播放带字幕的视频直播。具体技术方案如下:在本专利技术实施的一方面,提供了一种处理直播流的方法,所述方法包括:将原始直播流解码为原始音频数据和原始视频数据;对所述原始音频数据进行语音识别,生成所述原始音频数据对应的文本字符;根据所述语音识别耗费的第一时长,对所述原始视频数据进行延迟处理;将所述文本字符添加到延迟后的视频数据中,生成目标视频数据;将所述目标视频数据与所述原始音频数据同步合成,生成目标直播流;播放所述目标直播流。可选的,所述将原始直播流解码为原始音频数据和原始视频数据的步骤,包括:将预设时长的原始直播流解码为原始音频数据和原始视频数据。可选的,所述将原始直播流解码为原始音频数据和原始视频数据的步骤,包括:在预设时长区间内的原始直播流中,确定语音停顿的时间点;将所述原始直播流中所述时间点之前且未解码的直播流片段,解码为原始音频数据和原始视频数据。可选的,所述根据所述语音识别耗费的第一时长,对所述原始视频数据进行延迟处理的步骤,包括:确定所述语音识别所耗费的第一时长;将所述原始视频数据的时间戳,延迟所述第一 ...
【技术保护点】
一种处理直播流的方法,其特征在于,所述方法包括:将原始直播流解码为原始音频数据和原始视频数据;对所述原始音频数据进行语音识别,生成所述原始音频数据对应的文本字符;根据所述语音识别耗费的第一时长,对所述原始视频数据进行延迟处理;将所述文本字符添加到延迟后的视频数据中,生成目标视频数据;将所述目标视频数据与所述原始音频数据同步合成,生成目标直播流;播放所述目标直播流。
【技术特征摘要】
1.一种处理直播流的方法,其特征在于,所述方法包括:将原始直播流解码为原始音频数据和原始视频数据;对所述原始音频数据进行语音识别,生成所述原始音频数据对应的文本字符;根据所述语音识别耗费的第一时长,对所述原始视频数据进行延迟处理;将所述文本字符添加到延迟后的视频数据中,生成目标视频数据;将所述目标视频数据与所述原始音频数据同步合成,生成目标直播流;播放所述目标直播流。2.根据权利要求1所述的方法,其特征在于,所述将原始直播流解码为原始音频数据和原始视频数据的步骤,包括:将预设时长的原始直播流解码为原始音频数据和原始视频数据。3.根据权利要求1所述的方法,其特征在于,所述将原始直播流解码为原始音频数据和原始视频数据的步骤,包括:在预设时长区间内的原始直播流中,确定语音停顿的时间点;将所述原始直播流中所述时间点之前且未解码的直播流片段,解码为原始音频数据和原始视频数据。4.根据权利要求1所述的方法,其特征在于,所述根据所述语音识别耗费的第一时长,对所述原始视频数据进行延迟处理的步骤,包括:确定所述语音识别所耗费的第一时长;将所述原始视频数据的时间戳,延迟所述第一时长。5.根据权利要求4所述的方法,其特征在于,在所述对所述原始音频数据进行语音识别,生成所述原始音频数据对应的文本字符的步骤之后,所述方法还包括:将所述文本字符翻译成预设的语言种类,生成第二时长,所述第二时长为将所述文本字符翻译成预设的语言种类所耗费的时长;所述将所述原始视频数据的时间戳,延迟所述第一时长的步骤,包括:将所述原始视频数据的时间戳,延迟所述第一时长和所述第二时长之和的时长;所述将所述文本字符添加到延迟后的视频数据中,生成目标视频数据的步骤,包括:将翻译后的文本字符添加到延迟后的视频数据中,生成目标视频数据。6.根据权利要求5所述的方法,其特征在于,在所述将所述文本字符翻译成预设的语言种类的步骤之后,所述方法还包括:对翻译后的文本字符进行纠错处理;确定所述纠错处理所耗费的第三时长;所述将所述原始视频数据的时间戳,延迟所述第一时长和所述第二时长之和的时长的步骤,包括:将所述原始视频数据的时间戳,延迟所述第一时长、所述第二时长和所述第三时长之和的时长;所述将所述文本字符添加到延迟后的视频数据中,生成目标视频数据的步骤,包括:将翻译并纠错后的文本字符添加到延迟后的视频数据中,生成目标视频数据。7.根据权利要求1所述的方法,其特征在于,所述将所述目标视频数据与所述原始音频数据同步合成,生成目标直播流的步骤,包括:基于预设的参考时间轴,根据所述目标视频数据中视频帧的时间戳,以及所述原始音频数据中音频帧的时间戳,将所述目标视频数据与所述原始音频数据进行同步合成,生成目标...
【专利技术属性】
技术研发人员:洪巨成,项东涛,
申请(专利权)人:北京奇艺世纪科技有限公司,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。