视频镜头边界定位方法、装置及电子设备制造方法及图纸

技术编号:30701410 阅读:24 留言:0更新日期:2021-11-06 09:38
本发明专利技术提供了一种视频镜头边界定位方法、装置及电子设备,涉及图像检测技术领域,本发明专利技术使用神经网络模型预测初始边界帧,并附加一个基于分块平均梯度的后处理来解决整体运动变化小,但局部运动变化剧烈的相邻镜头边界定位不准确的问题,与现有的基于直方图差分的方法和基于深度学习的方法相比,在不明显损失定位速度的情况下,提高了定位准确度。提高了定位准确度。提高了定位准确度。

【技术实现步骤摘要】
视频镜头边界定位方法、装置及电子设备


[0001]本专利技术涉及图像检测
,尤其是涉及一种视频镜头边界定位方法、装置及电子设备。

技术介绍

[0002]视频镜头边界定位是视频内容理解重要的步骤之一。视频镜头在语义上是一个相对独立的视频单位。在时序上,镜头表现为帧内对象在时域上连续的一组动作。镜头边界定位是指检测并定位出镜头的边界帧,将视频分割为独立镜头的过程。
[0003]镜头边界定位算法的基本思想是根据相邻镜头间的物理特征差异来确定镜头的边界帧。为了让视频镜头切换更加平滑,两个相邻镜头之间往往插有若干缓冲帧,整体上视觉变化不显著,使得边界检测成为一个难题。另外,在视频拍摄过程中,摄像设备存在抖动、噪声、光照强度变化等情况,也很大地影响了镜头边界点位的效果。
[0004]目前的镜头边界定位方法包括基于直方图差分的方法和基于深度学习的方法。其中,直方图是描述图像颜色特征分布的一种方法,通过直方图的相似度可以判断图像之间的相似情况,并且以此来判断是否有图像场景的临界变化,实现镜头边界定位。然而,由于视频镜头变换十分复杂,特别是本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种视频镜头边界定位方法,其特征在于,包括:根据训练好的神经网络模型,确定待检测的目标视频的至少一个初始边界帧;对于每个所述初始边界帧,计算得到该初始边界帧对应的视频帧序列中的每个目标视频帧的分块平均梯度;其中,该初始边界帧对应的视频帧序列中的各个目标视频帧为所述目标视频中,以该初始边界帧为中心,预设范围内的各个视频帧;所述目标视频帧的分块平均梯度包括将所述目标视频帧划分为多个子区域时每个所述子区域的平均像素灰度值的梯度;根据该初始边界帧对应的视频帧序列中的各个所述目标视频帧的分块平均梯度,从各个所述目标视频帧中确定该初始边界帧对应的目标边界帧;将各个所述初始边界帧对应的目标边界帧确定为所述目标视频的镜头边界定位结果。2.根据权利要求1所述的视频镜头边界定位方法,其特征在于,所述计算得到该初始边界帧对应的视频帧序列中的每个目标视频帧的分块平均梯度,包括:对于该初始边界帧对应的视频帧序列中的每个目标视频帧,按照预设划分方式将该目标视频帧划分为多个子区域;计算得到每个所述子区域的平均像素灰度值;根据各个所述子区域的平均像素灰度值,计算得到每个所述子区域对应的梯度幅值;由各个所述子区域对应的梯度幅值,构造得到该目标视频帧的分块平均梯度矩阵。3.根据权利要求1所述的视频镜头边界定位方法,其特征在于,所述目标视频帧的分块平均梯度为由所述目标视频帧的各个所述子区域的平均像素灰度值的梯度幅值构造得到的分块平均梯度矩阵;所述根据该初始边界帧对应的视频帧序列中的各个所述目标视频帧的分块平均梯度,从各个所述目标视频帧中确定该初始边界帧对应的目标边界帧,包括:计算得到该初始边界帧对应的视频帧序列中的每个所述目标视频帧的边界特征矩阵,所述目标视频帧的边界特征矩阵为所述目标视频帧的分块平均梯度矩阵与所述目标视频帧的前一个视频帧的分块平均梯度矩阵的差;统计得到每个所述边界特征矩阵对应的目标元素个数,所述边界特征矩阵对应的目标元素个数为所述边界特征矩阵中元素值大于预设梯度阈值的元素个数;根据各个所述边界特征矩阵对应的目标元素个数,确定该初始边界帧对应的目标边界帧。4.根据权利要求3所述的视频镜头边界定位方法,其特征在于,所述根据各个所述边界特征矩阵对应的目标元素个数,确定该初始边界帧对应的目标边界帧,包括:将目标元素个数大于预设数量的边界特征矩阵所对应的目标视频帧,确定为候选边界帧;当存在一个所述候选边界帧时,将所述候选边界帧确定为该初始边界帧对应的目标边界帧;当存在多个所述候选边界帧时...

【专利技术属性】
技术研发人员:范清唐大闰
申请(专利权)人:上海明略人工智能集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1