【技术实现步骤摘要】
一种直播流的剪辑方法、装置以及设备
本申请涉及直播
,尤其涉及一种直播流的剪辑方法、装置、设备及计算机可读存储介质。
技术介绍
随着直播技术的迅速发展,越来越多的用户选择通过直播来获知相关资讯。直播业务方为了给用户提供更多的选择和更好的观听体验,通常都在直播过程中,根据已直播的内容为用户提供一些精彩的直播流片段,以供用户查看和分享。例如在一场篮球比赛直播中,直播业务方会根据已直播的内容为用户提供一些精彩瞬间小视频,如投篮进球精彩瞬间、过人瞬间等视频小片段,方便用户直接选择感兴趣的部分观看。目前直播业务方通常是基于人工剪辑生成直播流片段,由剪辑人员通过观听直播流以及个人经验来判断哪些是精彩片段,进而通过视频剪辑软件完成剪辑生成直播流片段。但这种方法对剪辑人员的技能要求较高,整个剪辑过程也比较耗费时间,因此,这种方法的人工成本比较高,剪辑效率比较低,剪辑质量不稳定难以满足大数据环境下的直播流应用的业务需求。
技术实现思路
本申请实施例提供了一种直播流的剪辑方法、装置以及相关设备,能够提高剪辑效率。有鉴于此,本申请第一方面提供了一种直播流的剪辑方法,所述方法包括:获取 ...
【技术保护点】
1.一种直播流的剪辑方法,其特征在于,包括:获取直播流以及与所述直播流对应的解说音频流;将所述解说音频流输入高光片段识别模型,获取所述高光片段识别模型输出的高光片段的起止时刻;所述高光片段识别模型是端到端的神经网络模型;根据所述高光片段的起止时刻,从所述直播流中剪辑得到所述直播流的高光片段。
【技术特征摘要】
1.一种直播流的剪辑方法,其特征在于,包括:获取直播流以及与所述直播流对应的解说音频流;将所述解说音频流输入高光片段识别模型,获取所述高光片段识别模型输出的高光片段的起止时刻;所述高光片段识别模型是端到端的神经网络模型;根据所述高光片段的起止时刻,从所述直播流中剪辑得到所述直播流的高光片段。2.根据权利要求1所述的方法,其特征在于,所述高光片段识别模型包括:语音识别网络以及定位网络;所述语音识别网络是以直播流对应的解说音频流作为输入,以解说文本作为输出的神经网络;所述定位网络是以所述语音识别网络的输出以及所述解说音频流作为输入,以直播流对应的高光片段的起止时刻作为输出的神经网络。3.根据权利要求2所述的方法,其特征在于,所述语音识别网络包括:声学模型、发音字典、语言模型以及解码器。4.根据权利要求2所述的方法,其特征在于,所述定位网络包括:特征提取模型和定位模型;所述特征提取模型是以所述语音识别网络的输出以及所述解说音频流作为输入,以语义特征、语速特征以及语调特征作为输出的神经网络;所述定位模型是以所述特征提取模块的输出作为输入,以直播流对应的高光片段的起止时刻作为输出的神经网络。5.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取训练样本,所述训练样本包括:样本解说音频流、以及与样本解说音频流对应的直播流中高光片段的标注数据,所述高光片段的标注数据包括高光片段在与样本解说音频流对应的样本直播流中的起止时刻;利用所述训练样本对高光片段识别初始模型进行迭代训练,获取满足预设训练结束条件的所述高光片段识别模型。6.根据权利要求1至5中任一项所述的方法,其特征在于,所述高光片段识别模型以解说音频流作为输入,以高光片段对应的起止时刻以及所属标题类目为输出;则所述方法还包括:获取所述高光片段识别模型输出的高光片段对应的标题类目。7.根据权利要求1至5中任一项所述的方...
【专利技术属性】
技术研发人员:王释涵,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。