直播视频的播放方法和装置制造方法及图纸

技术编号:26263039 阅读:58 留言:0更新日期:2020-11-06 18:02
本申请公开了一种直播视频的播放方法和装置,涉及语音识别技术领域、视频处理技术领域和图像处理领域,其中,具体实现方案为:获取直播数据,其中,直播包括音频信息和视频流信息;识别音频信息对应的文本信息,并根据文本信息生成字幕信息;确定字幕信息对应的开始时间点和结束时间点,在视频流信息中确定与开始时间点和结束时间点对应的视频帧;在预设数据库中存储字幕信息和对应的视频帧的对应关系,以便于根据对应关系进行直播视频播放。由此,在实现了为直播视频流匹配字幕信息的基础上,由于字幕信息与视频流无需混合生成新的视频数据,降低了直播视频流的播放延时。

【技术实现步骤摘要】
直播视频的播放方法和装置
本申请涉及语音识别
、视频处理
和图像处理领域,尤其涉及一种直播视频的播放方法和装置。
技术介绍
直播广泛的应用于发布会、体育赛事、娱乐等,疫情期间更是在教育、销售方面起到了重要的作用。直播具有很强的实时性和交互性,导致视频流不能做后期处理,其中,视频流没有字幕会对观看者在理解上造成一定的负面影响。相关技术中,人工识别并添字幕,导致直播数据的延时较长,无法适应直播的高实时性的性质。
技术实现思路
本申请提供了一种直播视频播放方法和装置,在实现了为直播视频流匹配字幕信息的基础上,由于字幕信息与视频流无需混合生成新的视频数据,降低了直播视频流的播放延时。根据第一方面,提供了一种直播视频播放方法,包括以下步骤:获取直播数据,其中,所述直播数据包括音频信息和视频流信息;识别所述音频信息对应的文本信息,并根据所述文本信息生成字幕信息;确定所述字幕信息对应的开始时间点和结束时间点,在所述视频流信息中确定与所述开始时间点和所述结束时间点对应的视频帧;在预设数据库中存储所述字幕信本文档来自技高网...

【技术保护点】
1.一种直播视频播放方法,包括以下步骤:/n获取直播数据,其中,所述直播数据包括音频信息和视频流信息;/n识别所述音频信息对应的文本信息,并根据所述文本信息生成字幕信息;/n确定所述字幕信息对应的开始时间点和结束时间点,在所述视频流信息中确定与所述开始时间点和所述结束时间点对应的视频帧;/n在预设数据库中存储所述字幕信息和对应的所述视频帧的对应关系,以便于根据所述对应关系进行直播视频播放。/n

【技术特征摘要】
1.一种直播视频播放方法,包括以下步骤:
获取直播数据,其中,所述直播数据包括音频信息和视频流信息;
识别所述音频信息对应的文本信息,并根据所述文本信息生成字幕信息;
确定所述字幕信息对应的开始时间点和结束时间点,在所述视频流信息中确定与所述开始时间点和所述结束时间点对应的视频帧;
在预设数据库中存储所述字幕信息和对应的所述视频帧的对应关系,以便于根据所述对应关系进行直播视频播放。


2.如权利要求1所述的方法,其中,所述根据所述对应关系进行直播视频播放,包括:
响应于直播视频播放指令,获取待播放的目标视频帧;
查询所述预设数据库,确定与所述标目视频帧对应的目标字幕信息;
播放所述目标视频帧,并在所述目标视频帧上显示包含所述目标字幕信息的浮层。


3.如权利要求2所述的方法,其中,所述在所述目标视频帧上显示包含所述目标字幕信息的浮层之前,包括:
获取直播设备的直播界面尺寸;
根据所述直播界面尺寸,生成包含所述目标字幕信息的浮层。


4.如权利要求2所述的方法,其中,所述在所述目标视频帧上显示包含所述目标字幕信息的浮层之前,包括:
确定所述目标视频帧的视频背景区域;
在所述视频背景区域中确定浮层显示区域。


5.如权利要求4所述的方法,其中,所述在所述目标视频帧上显示包含所述目标字幕信息的浮层,包括:
在所述浮层显示区域上显示所述浮层。


6.一种直播视频播放装置,包括:
第一获取模块,用于获取...

【专利技术属性】
技术研发人员:赵晓昆
申请(专利权)人:北京百度网讯科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1