目标检测方法、图像处理设备及具有存储功能的设备技术

技术编号:22295877 阅读:34 留言:0更新日期:2019-10-15 04:58
本申请公开了一种目标检测方法、图像处理设备及具有存储功能的设备,该方法包括:获取视频帧,并将该视频帧输入基于深度学习的目标检测模型中,检测得到视频帧中的目标;获取目标与对应背景区域的相似度;将相似度小于预设阈值的目标作为检测到的目标进行输出。通过上述方式,本申请能够目标检测的准确率。

Target Detection Method, Image Processing Equipment and Equipment with Storage Function

【技术实现步骤摘要】
目标检测方法、图像处理设备及具有存储功能的设备
本申请涉及图像处理
,特别是涉及一种目标检测方法、图像处理设备及具有存储功能的设备。
技术介绍
在视频图像处理领域,目标检测技术主要分为深度学习目标检测方法和非深度学习目标检测方法两种。然而,基于深度学习目标检测算法,存在虚检的目标,即在视频帧中检出了不需检出的物体,例如检测目标为机动车时,在雨伞,树木,垃圾桶等上也检出目标框。而基于非深度学习中背景建模的目标检测算法,仅可以检测出运动的目标,而且需要进一步进行目标区域分割才能获取到目标框。
技术实现思路
本申请主要解决的技术问题是提供一种目标检测方法、图像处理设备及具有存储功能的设备,能够提高目标检测的准确率。为解决上述技术问题,本申请采用的一个技术方案是:提供一种目标检测方法,包括:获取视频帧,并将该视频帧输入基于深度学习的目标检测模型中,检测得到视频帧中的目标;获取目标与对应背景区域的相似度;将相似度小于预设阈值的目标作为检测到的目标进行输出。为解决上述技术问题,本申请采用的另一个技术方案是:提供一种图像处理设备,包括:相互连接的处理器和存储器;存储器用于存储处理器执行所需的指令和数据;处理器用于执行指令以实现如上所述的方法。为解决上述技术问题,本申请采用的又一个技术方案是:提供一种具有存储功能的设备,内部存储有程序指令,该程序指令用于被执行以实现如上所述的方法。本申请的有益效果是:区别于现有技术的情况,本申请的实施例中,获取视频帧后,将该视频帧输入基于深度学习的目标检测模型中,检测得到视频帧中的目标,并获取目标与对应背景区域的相似度,将相似度小于预设阈值的目标作为检测到的目标进行输出。通过上述方式,本申请通过将与对应背景区域的相似度低的目标去除,从而实现去除基于深度学习的目标检测模型的虚检目标,有效抑制虚检,提高了目标检测的准确率。附图说明图1是本申请一种目标检测方法第一实施例的流程示意图;图2是图1中步骤S12的具体流程示意图;图3是本申请一种目标检测方法第二实施例的流程示意图;图4是图3中步骤S1221的具体流程示意图;图5是检测到多个目标框的一个视频帧的示意图;图6是本申请一种目标检测方法第三实施例的流程示意图;图7是本申请一种图像处理设备一实施例的结构示意图;图8是本申请一种具有存储功能的设备一实施例的结构示意图。具体实施方式下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。如图1所示,本申请一种目标检测方法第一实施例包括:S11:获取视频帧,并将视频帧输入基于深度学习的目标检测模型中,检测得到视频帧中的目标。其中,目标检测模型是目标检测神经网络模型,其可以采用如RPN(RegionProposalNetwork,区域建议网络)和FasterCNN(FasterConvolutionalNeuralNetwork,更快的卷积神经网络)结合的Faster-RCNN,或者SSD(SingleShotMultiBoxDetector,单镜头多盒检测器),又或者Yolo(YouOnlyLookOnce)等基于深度学习的神经网络算法实现。具体地,在一个应用例中,预先采用视频数据对目标检测神经网络进行训练,可以得到一个训练好的目标检测模型。然后,将获取的视频帧输入训练好的目标检测模型中后,该目标检测模型会自动检测并输出视频帧中的目标,得到目标编号和目标框。其中,同一目标的目标编号相同,同一目标的目标框在不同帧中的位置可能不同。S12:获取目标与对应背景区域的相似度。其中,对应背景区域是与视频帧中检测到的目标位置相同的背景区域。具体地,该对应背景区域可以利用基于非深度学习的背景建模方法建立该视频帧的背景模型,并生成对应的背景图像,然后在背景图像中获取与目标框的位置一致的背景区域。然后,将目标区域图像与该对应背景区域图像进行比较,例如比较像素值等,从而得到二者的相似度,例如平均像素值差距等。可选地,如图2所示,步骤S12包括:S121:对视频帧进行背景识别,获取背景图像。具体地,在对视频帧进行背景识别时,可以采用Vibe或混合高斯背景模型算法建立视频帧中的场景的背景模型,并得到该视频帧对应的背景图像。S122:在背景图像中截取与目标的目标框位置相同的背景区域图像。具体地,通过上述步骤S121已经获取视频帧对应的背景图像,通过步骤S11已经检测得到视频帧中目标的目标框,为了确定检测出的目标是否为虚检目标,可以在背景图像获取与目标框位置相同的背景区域图像,以便后续去除背景相似度较低的目标。其中,获取该背景区域图像时,首先获取目标框在视频帧图像中的位置,然后在背景图像中定位相同位置的区域,并截取该区域的图像,即可得到该背景区域图像。S123:计算该目标框与该背景区域图像的相似度。具体地,计算目标的背景相似度时,可以将该目标框框选到的视频帧中的区域图像与该背景区域图像进行比较,计算两个区域图像的差异。例如比较两个区域图像相同位置的像素点的像素值,计算平均像素值差异,或者计算像素值方差,又或者像素值差异小于某个阈值(如小于1)的像素个数比例等。由此,只需要计算目标框与对应背景区域图像的相似度,不需要与整个背景图像进行比较,可以减少计算量,提高检测速度。S13:将相似度小于预设阈值的目标作为检测到的目标进行输出。其中,该预设阈值是预先设定的判定目标为虚检目标的临界值,其具体取值根据该相似度的指标类型和检测精度而定。例如,当该相似度为两个区域图像相同位置的像素点的像素值差异小于某个阈值(如小于1)的像素个数比例时,该预设阈值可以设置为5%。当计算得到的目标框与该背景区域图像的相似度大于或等于5%,则表明该目标框与背景图像过于类似,判定该目标框为虚检目标框,可以将其从输出数据中删除,而当计算得到的目标框与该背景区域图像的相似度小于5%时,则表明该目标框与背景图像差异较大,判定该目标框不是虚检目标框,可以将其作为检测到的目标进行输出。本实施例中,通过将与对应背景区域的相似度低的目标去除,从而实现去除基于深度学习的目标检测模型的虚检目标,有效抑制虚检,提高了目标检测的准确率。而相对于仅使用背景建模的方法,本申请通过深度学习的目标检测模型获取目标,不需要再对判定为运动的区域进行目标的分割得到目标框,检测速度快。在其他实施例中,对视频帧进行目标检测时,可能检测得到多个目标框,目标框可能存在被其他目标框遮挡的情况,此时为了更准确地计算目标与背景区域的相似度,需要去除被遮挡的部分的影响。具体如图3所示,本申请一种目标检测方法第二实施例是在本申请一种目标检测方法第一实施例的基础上,进一步限定步骤S122和步骤S123包括:S1221:判断当前目标的目标框是否被其他目标框遮挡。具体地,当从视频帧中检测出多个目标框时,首先可以选取其中一个目标框作为当前目标的目标框,然后判断该目标框是否被其他目标框遮挡,即判断该目标框与其他目标框的前后顺序。根据视觉常识,更接近摄像头拍摄点的物体更不容易被遮挡,即根据目标框距离摄像头拍本文档来自技高网...

【技术保护点】
1.一种目标检测方法,其特征在于,包括:获取视频帧,并将所述视频帧输入基于深度学习的目标检测模型中,检测得到所述视频帧中的目标;获取所述目标与对应背景区域的相似度;将所述相似度小于预设阈值的目标作为检测到的目标进行输出。

【技术特征摘要】
1.一种目标检测方法,其特征在于,包括:获取视频帧,并将所述视频帧输入基于深度学习的目标检测模型中,检测得到所述视频帧中的目标;获取所述目标与对应背景区域的相似度;将所述相似度小于预设阈值的目标作为检测到的目标进行输出。2.根据权利要求1所述的方法,其特征在于,所述将所述视频帧输入基于深度学习的目标检测模型中,检测得到所述视频帧中的目标包括:将所述视频帧输入基于深度学习的目标检测模型中,检测得到目标的目标编号和目标框;其中,所述目标检测模型是目标检测神经网络模型。3.根据权利要求2所述的方法,其特征在于,所述获取所述目标与对应背景区域的相似度包括:对所述视频帧进行背景识别,获取背景图像;在所述背景图像中截取与所述目标的目标框位置相同的背景区域图像;计算所述目标框与所述背景区域图像的相似度。4.根据权利要求3所述的方法,其特征在于,所述在所述背景图像中截取所述目标的目标框位置相同的背景区域图像包括:判断当前目标的所述目标框是否被其他目标框遮挡;若所述目标框被其他目标框遮挡,则以所述未被遮挡区域作为相似度计算区域;在所述背景图像中截取与所述相似度计算区域位置相同的背景区域图像;所述计算所述目标框与所述背景区域图像的相似度包括:计算所述相似度计算区域与所述背景区域图像的相似度。5.根据权利要求4所述的方法,其特征在于,所述判断所述目标框是否被其他目标框遮挡包括:判断当前目标的所述目标框是否与其他目标的目标框重叠;若重叠,则判断相对于与所述目标框重叠的所述其他目标的目标框,所述当前目标的目标框是否更接近所述视频帧的坐标原点;若更接近,则判...

【专利技术属性】
技术研发人员:张佳骕潘华东
申请(专利权)人:浙江大华技术股份有限公司
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1