目标检测方法、装置、电子设备及存储介质制造方法及图纸

技术编号:23363598 阅读:27 留言:0更新日期:2020-02-18 17:31
本申请实施例公开了一种目标检测方法、装置、电子设备及存储介质,该方法包括:获取视频图像的当前帧为待检测图像;对所述待检测图像进行特征提取,得到相应的特征图;基于所述特征图将所述待检测图像划分为至少两个栅格;若某个栅格内有第一目标对象的中心落入其中,则根据该栅格预设的锚点对所述第一目标对象进行预测,得到所述第一目标对象的第一检测框和所述第一目标对象的目标区域的第二检测框。本申请实施例能够保证目标检测的性能,且有利于提高目标检测的实时性。

Target detection method, device, electronic equipment and storage medium

【技术实现步骤摘要】
目标检测方法、装置、电子设备及存储介质
本申请涉及视频图像处理
,尤其涉及一种目标检测方法、装置、电子设备及存储介质。
技术介绍
计算机视觉是一门研究如何使机器“看”的科学,其用图像采集设备和电脑代替人眼对目标进行识别、跟踪和测量,涵盖了图像语义理解、图像识别以及视频图像处理等多种技术,而在视频图像处理领域,目标检测起着尤为重要的作用。一般的,目标检测方法分为基于人工设计特征的方法和基于深度学习的方法,其中,基于人工设计特征的方法首先对候选区域提取特征,之后利用分类器对候选区域进行分类,确定是否包含检测目标,但是基于人工设计特征的方法检测性能较差。相比较而言,基于深度学习的方法检测性能优越,其学到的特征具有更强的层次表达能力和鲁棒性,可直接应用到目标检测上,但是基于深度学习的方法算法复杂,且计算量大,检测的实时性仍不能满足实际需要。
技术实现思路
为解决上述问题,本申请提供了一种目标检测方法、装置、电子设备及存储介质,能够保证目标检测的性能,且有利于提高目标检测的实时性。本申请实施例第一方面提供了一种目标检测方本文档来自技高网...

【技术保护点】
1.一种目标检测方法,其特征在于,所述方法包括:/n获取视频图像的当前帧为待检测图像;/n对所述待检测图像进行特征提取,得到相应的特征图;/n基于所述特征图将所述待检测图像划分为至少两个栅格;/n若某个栅格内有第一目标对象的中心落入其中,则根据该栅格预设的锚点对所述第一目标对象进行预测,得到所述第一目标对象的第一检测框和所述第一目标对象的目标区域的第二检测框,所述第二检测框位于所述第一检测框内。/n

【技术特征摘要】
1.一种目标检测方法,其特征在于,所述方法包括:
获取视频图像的当前帧为待检测图像;
对所述待检测图像进行特征提取,得到相应的特征图;
基于所述特征图将所述待检测图像划分为至少两个栅格;
若某个栅格内有第一目标对象的中心落入其中,则根据该栅格预设的锚点对所述第一目标对象进行预测,得到所述第一目标对象的第一检测框和所述第一目标对象的目标区域的第二检测框,所述第二检测框位于所述第一检测框内。


2.根据权利要求1所述的方法,其特征在于,所述多个栅格中每个栅格均预设有N个所述锚点,所述根据该栅格预设的锚点对所述第一目标对象进行预测,得到所述第一目标对象的第一检测框和所述第一目标对象的目标区域的第二检测框,包括:
通过该栅格的N个所述锚点预测出N组预测结果,所述N组预测结果中的每组预测结果均包括所述第一目标对象的第一候选检测框、所述目标区域的第二候选检测框、类别概率以及所述第一候选检测框的置信度,所述第二候选检测框位于所述第一候选检测框内;
根据所述置信度得到所述第一目标对象的第一检测框和所述目标区域的第二检测框。


3.根据权利要求2所述的方法,其特征在于,所述根据所述置信度得到所述第一目标对象的第一检测框和所述目标区域的第二检测框,包括:
根据所述置信度对所述N组预测结果进行过滤,得到置信度最高的一组预测结果;
将所述置信度最高的一组预测结果中的第一候选检测框和第二候选检测框确定为所述第一目标对象的第一检测框和所述目标区域的第二检测框。


4.根据权利要求2所述的方法,其特征在于,N个所述锚点中每个锚点对所述第一候选检测框的预测值包括所述第一候选检测框的中心点坐标的偏移量、所述第一候选检测框的宽度和高度的偏移量;所述方法还包括:
根据所述第一候选检测框的中心点坐标的偏移量和该每个锚点的坐标计算得到所述第一候选检测框的左上角坐标;
根据该每个锚点的宽度和高度计算得到所述第一候选检测框的宽度和高度;
基于所述第一候选检测框的左上角坐标、所述第一候选检测框的宽度和高度确定所述第一候选检测框。


5.根据权利要求2所述的方法,其特征在于,N个所述锚点中每个锚点对所述第二候选检测框的预测值包括所述第二候选检测框的左上角坐标的偏移量和右下角坐标的偏移量;所述方法还包括:
根据所述第二候选检测框的左上角坐标的偏移量、该每个锚点的坐标、该每个锚点的宽度和高度计算得到所述第二候选检测框的左上角坐标;
根据所述第二候选检测框的右下角坐标的偏移量、该每个锚点的坐标、该每个锚点的宽度和高度计算得到所述第二候选检测框的右下角坐标;
基于所述第二候选检测框的左上角坐标、右下角坐标确定所述第二候选检测框。


6.根据权利要求1至5任一项所述的方法,其特征在于,在所述获取视频图像的当前帧为待检测图像之前,所述方法还包括:
获取预设数据集中的各第二目标对象的尺寸大小;
采用K均值聚类算法对所述各第二目标对象的尺寸大小进行聚类得到N个尺寸大小,根据该N个尺寸大小为所述至少两个栅格中每个栅格设定N个锚点;
所述对所述待检测图像进行特征提取,得到相应的特征图,包括:
将所述待检测图像输入预训练的目标检测模型进行特征提取,得到相应的特征图。


7.根据权利要求6所述的方法,其特征在于,所述目标检测模型包括特征提取网络和检测层,所述目标检测模型的训练过程包括:
将所述数据集分为训练集和测试集,并对所述训练集中的数据进行标注;
将所述训练集中的标注数据输入所述特征提取网络进行特征提取...

【专利技术属性】
技术研发人员:罗泽坤王亚彪彭瑾龙甘振业汪铖杰李季檩
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1