一种目标检测方法、系统、加速装置、介质和电子设备制造方法及图纸

技术编号:26691284 阅读:46 留言:0更新日期:2020-12-12 02:43
本发明专利技术实施例提供了一种目标检测方法、系统、加速装置、介质和电子设备,所述方法用于压缩视频中的目标检测,本发明专利技术对参考帧进行完全解压得到RGB格式的参考帧,对预测帧进行非完全解压得到运动向量,基于RGB格式的参考帧进行目标检测以确定该参考帧中目标的位置,然后根据该预测帧的运动向量、该预测帧对应的参考帧中目标的位置确定该预测帧中目标的位置;从而避免了对所有帧进行完全解压便可完成目标检测,提高了目标检测过程的效率。

【技术实现步骤摘要】
一种目标检测方法、系统、加速装置、介质和电子设备
本专利技术涉及视频处理分析
,具体来说涉及对压缩视频进行物体检测的领域,更具体地说,涉及一种目标检测方法、系统、加速装置、介质和电子设备。
技术介绍
YannLeCun和他的合作者于1989年发表了卷积神经网络(ConvolutionNeuralNetworks,简称CNN)的相关工作。卷积神经网络是一种带有卷积结构的深度神经网络,通常由多个卷积层(ConvolutionLayer)和下采样层(Sub-samplingLayer)或者叫池化层(PoolingLayer)堆叠而成。在很长时间里,CNN在小规模问题上(如手写数字),取得了当时世界最好的结果,并将这一技术应用于美国银行的自动识别支票系统中。直到2012年10月,GeoffreyHinton和他的学生在著名的ImageNet挑战赛上采用更深的深度神经网络AlexNet取得世界最好结果,推动图像识别技术实现了大幅前进。2015年,微软宣布神经网络在1000类图像识别的ImageNet数据集中的识别能力已经超越了人类。此后,深度卷积神本文档来自技高网...

【技术保护点】
1.一种目标检测方法,用于压缩视频中的目标检测,其特征在于,包括:/n获取所述压缩视频中的参考帧及预测帧;/n获取对参考帧完全解码得到的RGB格式的参考帧,以及基于RGB格式的参考帧进行目标检测以确定该参考帧中目标的位置;/n获取预测帧的运动向量,以及根据所述预测帧的运动向量、该预测帧对应的参考帧中目标的位置确定该预测帧中目标的位置。/n

【技术特征摘要】
1.一种目标检测方法,用于压缩视频中的目标检测,其特征在于,包括:
获取所述压缩视频中的参考帧及预测帧;
获取对参考帧完全解码得到的RGB格式的参考帧,以及基于RGB格式的参考帧进行目标检测以确定该参考帧中目标的位置;
获取预测帧的运动向量,以及根据所述预测帧的运动向量、该预测帧对应的参考帧中目标的位置确定该预测帧中目标的位置。


2.根据权利要求1所述的目标检测方法,其特征在于,基于RGB格式的参考帧用图像识别的神经网络进行目标检测以确定该参考帧中目标的位置。


3.根据权利要求1或2所述的目标检测方法,其特征在于,所述获取预测帧的运动向量,根据所述预测帧的运动向量、预测帧对应的参考帧中目标的位置确定该预测帧中目标的位置包括:
获取根据预测帧对应的参考帧中目标的位置确定的该位置内所有参考宏块和预测帧中包含非零运动向量的备选宏块,将备选宏块和参考宏块进行匹配,将匹配成功的备选宏块作为目标宏块;
对目标宏块进行聚合以得到预测帧中目标的位置。


4.根据权利要求3所述的目标检测方法,其特征在于,所述将备选宏块与参考宏块进行匹配是分析备选宏块的参考坐标是否等于任意参考宏块的原始坐标,若是,则匹配成功。


5.根据权利要求3所述的目标检测方法,其特征在于,所述对目标宏块进行聚合以得到预测帧中目标的位置包括:
分析所有目标宏块的本帧坐标大小,将所有目标宏块中的最小横坐标、最小纵坐标、最大横坐标、最大纵坐标所限定的目标检测框的位置作为预测帧中目标的位置。


6.一种目标检测系统,其特征在于,包括:
通信模块,用于获取压缩视频中的参考帧及预测帧;
第一检测模块,用于获取对参考帧完全解码得到的RGB格式的参考帧,以及基于RGB格式的参考帧进行目标检测以确定该参考帧中目标的位置;
第二检测模块,用于获取预测帧的运动向量,根据所述预测帧的运动向量、预测帧对应的参考帧中目标的位置确定该预测帧中目...

【专利技术属性】
技术研发人员:汪雍琛王颖李华伟韩银和李晓维
申请(专利权)人:中国科学院计算技术研究所
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1