【技术实现步骤摘要】
视频感兴趣片段截取方法、电子设备和存储介质
本公开的实施例主要涉及基于神经网络的视频感兴趣片段截取方法,并且更具体地,涉及用于基于神经网络的视频感兴趣片段截取方法、电子设备和计算机可读存储介质。
技术介绍
在体育行业,教练员和运动员通常需要通过视频来回看自己的运动动作,一般情况下需要在训练场地安装一个摄像头来对体育运动进行采集,这种采集一般是在不中断的情况下自动进行的。但是教练员一般只对进行特定训练的视频片段感兴趣,一般需要教练员手动截取其所感兴趣的片段,或者拖动播放条来选择感兴趣的片段。这种手动操作无疑很麻烦,且不具备可复制性。此外,在体育场馆中,通常摄像头并非对于一个运动员的训练而安装的,由于训练器材的摆放问题,该摄像头可能对多个运动员的运动进行采集。在所采集的视频中,存在多个运动员,这些运动员的训练服装和动作可能不同,也可能是类似的。在摄像机的视角下,多个运动员的运动视频中可能造成严重遮挡、动作变形大和光照发生变化等一些列问题。在这种情况下,存在对多个类似运动员中的一个特定运动员进行识别和跟踪的需求,这 ...
【技术保护点】
1.一种基于神经网络的视频感兴趣片段截取方法,包括:/n确定待处理视频的图片序列中的第一特定区域和第二特定区域,所述第一特定区域和第二特定区域在所述待处理视频所包含的所有图片中分别具有固定不变的位置,且第一特定区域不同于第二特定区域;/n利用用于检测的第一神经网络,获取待处理视频中的多个目标的多个第一边界框,所述多个目标随着时间具有变化的数量;/n响应于在某一帧识别到多个第一边界框中的一个第一边界框首次出现在第一特定区域内,将所述一个第一边界框对应的目标设定为待跟踪的单目标,且将待处理视频的该帧作为第一帧;/n利用所识别的一个第一边界框,对用于单目标跟踪的第二神经网络的第二 ...
【技术特征摘要】
1.一种基于神经网络的视频感兴趣片段截取方法,包括:
确定待处理视频的图片序列中的第一特定区域和第二特定区域,所述第一特定区域和第二特定区域在所述待处理视频所包含的所有图片中分别具有固定不变的位置,且第一特定区域不同于第二特定区域;
利用用于检测的第一神经网络,获取待处理视频中的多个目标的多个第一边界框,所述多个目标随着时间具有变化的数量;
响应于在某一帧识别到多个第一边界框中的一个第一边界框首次出现在第一特定区域内,将所述一个第一边界框对应的目标设定为待跟踪的单目标,且将待处理视频的该帧作为第一帧;
利用所识别的一个第一边界框,对用于单目标跟踪的第二神经网络的第二边界框进行初始化且利用初始化的第二边界框在第一帧中跟踪所述单目标;
利用第二神经网络或者利用第一神经网络和第二神经网络两者,在待处理视频的第一帧之后的剩余帧中对所出现的单目标进行跟踪;以及
在所述剩余帧中,响应于第二神经网络所预测的第二边界框出现在第二特定区域中,结束跟踪且基于跟踪结果,对待处理视频的单目标被跟踪片段进行截取。
2.根据权利要求1所述的视频感兴趣片段截取方法,其特征在于,利用第二神经网络,在待处理视频的第一帧之后的剩余帧中对所出现的单目标进行跟踪包括:在待处理视频的第一帧之后的剩余帧的每一帧中,通过利用第二神经网络预测单目标的第二边界框,而对所出现的单目标进行跟踪。
3.根据权利要求1所述的视频感兴趣片段截取方法,其特征在于,利用第一神经网络和第二神经网络两者,在待处理视频的第一帧之后的剩余帧中对所出现的单目标进行跟踪包括:
针对当前帧:
利用第一神经网络,获取所述单目标的第一边界框;
利用第二神经网络,获取所述单目标的第二边界框;
将所述单目标的第一边界框与基准框进行比较,以得到第一差值;
将所述单目标的第二边界框与基准框进行比较,以得到第二差值;以及
基于第一差值、第二差值和基准框,获取所述单目标的针对当前帧的跟踪框;以及
基于针对当前帧的跟踪框,对当前帧的所述单目标进行跟踪,
其中,第一帧的跟踪框为被初始化的第二边界框,且
所述基准框是当前帧的前一帧的跟踪框。
4.根据权利要求1所述的视频感兴趣片段截取方法,其特征在于,利用第一神经网络和第二神经网络两者,在待处理视频的第一帧之后的剩余帧中对所出现的单目标进行跟踪包括:
针对当前帧:
利用第一神经网络,获取所述单目标的第一边界框;
利用第二神经网络,获取所述单目标的第二边界框;
将所述单目标的第一边界框与基准框进行比较,以得到第一差值;
将所述单目标的第二边界框与基准框进行比较,以得到第二差值;
基于第一差值、第二差值和基准框,获取所述单目标的针对当前帧的跟踪框;以及
基于针对当前帧的跟踪框,对当前帧的所述单目标进行跟踪,
其中,所述基准框为针对当前帧的跟踪框预测框,其中基于前一帧的跟踪框,获取针对当前帧的跟踪框预测框,以及
第一帧的跟踪框为被初始化的第二边界框,且第二帧的跟踪框预测框也设定为被初始化的第二边界框。
5.根据权利要求4所述的视频感兴趣片段截取方法,其特征在于,基于前一帧的跟踪框,...
【专利技术属性】
技术研发人员:许大政,刘长赛,
申请(专利权)人:清德智体北京科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。