直播回放视频生成播放方法、装置、存储介质及电子设备制造方法及图纸

技术编号:27434047 阅读:29 留言:0更新日期:2021-02-25 03:14
本公开提供一种直播回放视频生成方法及装置、直播回放视频播放方法及装置、电子设备、存储介质;涉及通信技术领域。所述直播回放视频生成方法包括:获取直播过程中的直播视频流,并监测所述直播视频流是否与推介物关联;在监测到所述直播视频流与推介物关联时,确定该所述直播视频流对应的目标语音数据与所述推介物是否匹配;在所述目标语音数据与所述推介物匹配时,向该所述直播视频流添加标记;利用多个所述直播视频流生成直播回放视频;其中,所述多个所述直播视频流包括被添加标记的所述直播视频流。本公开可以帮助用户在观看直播回放视频时快速定位到感兴趣的视频片段。播回放视频时快速定位到感兴趣的视频片段。播回放视频时快速定位到感兴趣的视频片段。

【技术实现步骤摘要】
直播回放视频生成播放方法、装置、存储介质及电子设备


[0001]本公开涉及音视频
,具体而言,涉及一种直播回放视频生成方法、直播回放视频生成装置、直播回放视频播放方法、直播回放视频播放装置、电子设备以及计算机可读存储介质。

技术介绍

[0002]随着网络技术的发展,网络直播已经成为一种流行的娱乐方式。在直播场景中,主播用户可以在直播间内进行直播,观众用户可以通过登录服务器,进入主播用户的直播间,观看主播用户的直播视频。
[0003]有很多主播用户会在直播过程中向观众用户介绍推介物,如推荐商品或者服务等。当观众用户错过主播用户的实时直播时,可以通过观看直播回放视频的方式来了解主播用户的直播内容。
[0004]现有直播回放视频通常是直接对直播视频流进行拼接得到或者基于直播中的画面直接录制得到,均不会标识出主播用户介绍推介物的具体视频片段,导致用户观看回放视频时难以快速定位到感兴趣的视频片段。
[0005]需要说明的是,在上述
技术介绍
部分公开的信息仅用于加强对本公开的背景的理解,因此可以包括不构成对本领域普通技术人员已知的现有技术的信息。

技术实现思路

[0006]本公开实施例的目的在于提供一种直播回放视频生成方法、直播回放视频生成装置、电子设备以及计算机可读存储介质,进而可以帮助用户在观看直播回放视频时快速定位到感兴趣的视频片段。
[0007]根据本公开的一个方面,提供一种直播回放视频生成方法,包括:
[0008]获取直播过程中的直播视频流,并监测所述直播视频流是否与推介物关联;
[0009]在监测到所述直播视频流与推介物关联时,确定该所述直播视频流对应的目标语音数据与所述推介物是否匹配;
[0010]在所述目标语音数据与所述推介物匹配时,向该所述直播视频流添加标记;
[0011]利用多个所述直播视频流生成直播回放视频;其中,所述多个所述直播视频流包括被添加标记的所述直播视频流。
[0012]在本公开的一种示例性实施例中,监测所述直播视频流是否与推介物关联,包括:
[0013]监测所述直播视频流的直播画面所在的第一图层之上,是否存在与所述推介物相关的第二图层。
[0014]在本公开的一种示例性实施例中,所述方法还包括:
[0015]确定该所述直播视频流对应的实时语音数据与参考特征是否匹配;
[0016]在所述实时语音数据与所述参考特征匹配时,开始采集所述实时语音数据形成所述目标语音数据。
[0017]在本公开的一种示例性实施例中,确定该所述直播视频流对应的实时语音数据与参考特征是否匹配,包括:
[0018]获取目标对象的样本语音数据,并对所述样本语音数据进行分帧;
[0019]提取所述样本语音数据各帧的特征向量,并基于所述样本语音数据各帧的特征向量训练得到所述参考特征;
[0020]对该所述直播视频流对应的实时语音数据进行分帧,并提取所述实时语音数据各帧的特征向量;
[0021]根据实时语音数据各帧的特征向量与所述参考特征之间的相似度,确定所述实时语音数据与所述参考特征是否匹配。
[0022]在本公开的一种示例性实施例中,所述方法还包括:
[0023]在所述实时语音数据各帧的特征向量与所述参考特征之间的相似度大于阈值时,确定所述实时语音数据与所述参考特征匹配。
[0024]在本公开的一种示例性实施例中,确定该所述目标语音数据与所述推介物是否匹配,包括:
[0025]对所述目标语音数据进行文本识别,得到第一文本数据;
[0026]获取与所述推介物相关的文本信息,作为第二文本数据;
[0027]根据所述第一文本数据与第二文本数据之间的相似度,确定所述目标语音数据与所述推介物是否匹配。
[0028]在本公开的一种示例性实施例中,所述方法还包括:
[0029]在所述第一文本数据与第二文本数据之间的相似度大于阈值时,确定所述目标语音数据与所述推介物匹配。
[0030]在本公开的一种示例性实施例中,当前所述直播视频流具有指向前一直播视频流的标识信息;所述利用多个所述直播视频流生成直播回放视频,包括:
[0031]根据接收到的各所述直播视频流的所述标识信息,确定各所述直播视频流的先后顺序;
[0032]根据确定的先后顺序,对所述直播视频流进行排序;
[0033]对排序后的所述直播视频流进行拼接,得到所述直播回放视频。
[0034]根据本公开的一个方面,提供一种直播回放视频播放方法,包括:
[0035]获取直播回放视频;所述直播回放视频包括一个或多个标记,且每一个所述标记对应一个与推介物相关的视频片段;
[0036]在检测到任一所述标记被触发时,控制所述直播回放视频跳转至该所述标记对应的视频片段。
[0037]在本公开的一种示例性实施例中,所述方法还包括:
[0038]根据所述直播回放视频时长提供一时间轴;
[0039]根据各所述推介物相关的视频片段在所述直播回放视频中的位置,在所述时间轴上呈现各所述标记。
[0040]在本公开的一种示例性实施例中,所述方法还包括:
[0041]将与所述直播回放视频的当前播放进度时刻最近的所述标记作为目标标记,并提供与所述目标标记对应的推介物的引导信息。
[0042]根据本公开的一个方面,提供一种直播回放视频生成装置,包括:
[0043]视频流获取模块,用于获取直播过程中的直播视频流,并监测所述直播视频流是否与推介物关联;
[0044]语音匹配模块,用于在监测到所述直播视频流与推介物关联时,确定该所述直播视频流对应的目标语音数据与所述推介物是否匹配;
[0045]添加标记模块,用于在所述目标语音数据与所述推介物匹配时,向该所述直播视频流添加标记;
[0046]视频生成模块,用于利用多个所述直播视频流生成直播回放视频;其中,所述多个所述直播视频流包括被添加标记的所述直播视频流。
[0047]在本公开的一种示例性实施例中,所述视频流获取模块通过下述装置监测所述直播视频流是否与推介物关联:监测所述直播视频流的直播画面所在的第一图层之上,是否存在与所述推介物相关的第二图层。
[0048]在本公开的一种示例性实施例中,所述装置还包括:
[0049]目标语音判断模块,用于确定该所述直播视频流对应的实时语音数据与参考特征是否匹配;并在所述实时语音数据与所述参考特征匹配时,开始采集所述实时语音数据形成所述目标语音数据。
[0050]在本公开的一种示例性实施例中,所述目标语音判断模块通过下述方法确定该所述直播视频流对应的实时语音数据与参考特征是否匹配:获取目标对象的样本语音数据,并对所述样本语音数据进行分帧;提取所述样本语音数据各帧的特征向量,并基于所述样本语音数据各帧的特征向量训练得到所述参考特征;对该所述直播视频流对应的实时语音数据进行分帧,并提取所述实时语本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种直播回放视频生成方法,其特征在于,包括:获取直播过程中的直播视频流,并监测所述直播视频流是否与推介物关联;在监测到所述直播视频流与推介物关联时,确定该所述直播视频流对应的目标语音数据是否与所述推介物匹配;在所述目标语音数据与所述推介物匹配时,向该所述直播视频流添加标记;利用多个所述直播视频流生成直播回放视频;其中,所述多个所述直播视频流包括被添加标记的所述直播视频流。2.根据权利要求1所述的直播回放视频生成方法,其特征在于,监测直播视频流是否与推介物关联,包括:监测所述直播视频流的直播画面所在的第一图层之上,是否存在与推介物相关的第二图层。3.根据权利要求1所述的直播回放视频生成方法,其特征在于,所述方法还包括:确定该所述直播视频流对应的实时语音数据与参考特征是否匹配;在所述实时语音数据与所述参考特征匹配时,采集所述实时语音数据形成所述目标语音数据。4.根据权利要求3所述的直播回放视频生成方法,其特征在于,确定该所述直播视频流对应的实时语音数据与参考特征是否匹配,包括:获取目标对象的样本语音数据,并对所述样本语音数据进行分帧;提取所述样本语音数据各帧的特征向量,并基于所述样本语音数据各帧的特征向量训练得到所述参考特征;对该所述直播视频流对应的实时语音数据进行分帧,并提取所述实时语音数据各帧的特征向量;根据实时语音数据各帧的特征向量与所述参考特征之间的相似度,确定所述实时语音数据与所述参考特征是否匹配。5.根据权利要求4所述的直播回放视频生成方法,其特征在于,所述方法还包括:在所述实时语音数据各帧的特征向量与所述参考特征之间的相似度大于阈值时,确定所述实时语音数据与所述参考特征匹配。6.根据权利要求1所述的直播回放视频生成方法,其特征在于,确定该所述目标语音数据与所述推介物是否匹配,包括:对所述目标语音数据进行文本识别,得到第一文本数据;获取与所述推介物相关的文本信息,作为第二文本数据;根据所述第一文本数据与第二文本数据之间的相似度,确定所述目标语音数据与所述推介物是否匹配。7.根据权利要求6所述的直播回放视频生成方法,其特征在于,所述方法还包括:在所述第一文本数据与第二文本数据之间的相似度大于阈值时,确定所述目标语音数据与所述推介物匹配。8.根据权利要求1所述的直播回放视频生成方法,其特征在于,当前所述直播视频流...

【专利技术属性】
技术研发人员:陈春勇
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1