一种实时目标检测的方法、系统及装置制造方法及图纸

技术编号：21200920 阅读：39 留言：0更新日期：2019-05-25 01:32

本发明专利技术公开一种实时目标检测的方法、系统及装置，其中方法步骤为：获取待检测的图片，对图片进行第一卷积处理获得第一特征图；结合第一特征图、第一空间信息和第一通道信息获得第二特征图；对第二特征图进行第二卷积处理获得第三特征图；结合第三特征图、第二空间信息和第二通道信息获得第四特征图；对第四特征图进行第三卷积处理获得第五特征图；依次对第五特征图进行多次反卷积处理后，获得第六特征图、第七特征图和第八特征图，以及通过结合特征图获取第九特征图和第十特征图，对第六特征图、第九特征图和第十特征图进行分类和边界框的预测，本发明专利技术通过结合不同特征图以及空间信息和通道信息来提高检测准确率，可广泛应用于目标检测领域。

A Real-time Target Detection Method, System and Device

The invention discloses a method, system and device for real-time target detection, in which the method steps are: acquiring pictures to be detected, first convolution processing of pictures to obtain the first feature map; combining the first feature map, the first spatial information and the first channel information to obtain the second feature map; second convolution processing of the second feature map to obtain the third feature map; and combining the third feature map; Fifth feature map is obtained by the third convolution of the fourth feature map, the sixth feature map, the seventh feature map and the eighth feature map are obtained by deconvolution of the fifth feature map, and the ninth feature map and the tenth feature map are obtained by combining the eigenvalue map with the eigenvalue map. The method improves the detection accuracy by combining different feature maps, spatial information and channel information, and can be widely used in the field of target detection.

全部详细技术资料下载

【技术实现步骤摘要】
一种实时目标检测的方法、系统及装置
本专利技术涉及目标检测领域，尤其涉及一种实时目标检测的方法、系统及装置。
技术介绍
随着深度学习的不断发展，在自然语言处理以及目标检测和分类方面也取得了不错的进步。其中目标检测主要分为两分支，一分支是具有两阶段的目标检测，如：RCNN系列(RCNN、FastRCNN以及RFCN等)这些目标检测方法分为两个阶段，在第一阶段，通过算法或区域提议网络生成高质量的候选框。然后在第二阶段设计子网络对这些候选框进行分类和边框回归，因此由于这类检测方法分为两阶段所以在检测速度方面存在缺陷，达不到实时的效果。另一分支则是单阶段的目标检测方法(如YOLO、SSD以及DSOD等)，因为没有产生候选框阶段所以相对于前一种方法来说准确率相对较差，但其检测速度十分优秀可以达到实时的检测。目前基于单阶段的目标检测方法的改进主要是通过结合不同特征图的信息或者采用更复杂的网络结构来获取具有高语义的特征信息，例如：在YOLO方法中直接在最后的卷积层上进行边界框回归的目标检测，SSD方法则是在YOLO方法的基础上提出来的，该方法是结合最后几个卷积层进行预测，因而有更高的准确率。DSSD方法则是在SSD的改进，通过采用更复杂的网络结构(ResNet)进行特征提取，并结合反卷积层获取更多的语义信息。在Single-ShotBidirectionalPyramidNetworks的方法中则采用了双向的特征金字塔网络结构，结合了底层和高层之间的特征信息，并采用了一个级联的锚优化模块来提高候选框的定位能力。上述大多数的改进方法都是在牺牲检测速度的基础上提高其检测精度...

【技术保护点】
1.一种实时目标检测的方法，其特征在于，包括以下步骤：获取待检测的图片，并对图片进行第一卷积处理后，获得第一特征图；提取第一特征图的第一空间信息和第一通道信息后，结合第一特征图、第一空间信息和第一通道信息获得第二特征图；对第二特征图进行第二卷积处理后，获得第三特征图；提取第三特征图的第二空间信息和第二通道信息后，结合第三特征图、第二空间信息和第二通道信息获得第四特征图；对第四特征图进行第三卷积处理后，获得第五特征图；对第五特征图进行第一反卷积处理后，获得第六特征图；对第六特征图进行第二反卷积处理后，获得第七特征图；对第七特征图进行第三反卷积处理后，获得第八特征图；将第一特征图与第八特征图进行合并后获得第九特征图，以及将第三特征图与第七特征图进行合并后获得第十特征图；根据预设的损失函数分别对第六特征图、第九特征图和第十特征图进行分类和边界框的预测。

【技术特征摘要】
1.一种实时目标检测的方法，其特征在于，包括以下步骤：获取待检测的图片，并对图片进行第一卷积处理后，获得第一特征图；提取第一特征图的第一空间信息和第一通道信息后，结合第一特征图、第一空间信息和第一通道信息获得第二特征图；对第二特征图进行第二卷积处理后，获得第三特征图；提取第三特征图的第二空间信息和第二通道信息后，结合第三特征图、第二空间信息和第二通道信息获得第四特征图；对第四特征图进行第三卷积处理后，获得第五特征图；对第五特征图进行第一反卷积处理后，获得第六特征图；对第六特征图进行第二反卷积处理后，获得第七特征图；对第七特征图进行第三反卷积处理后，获得第八特征图；将第一特征图与第八特征图进行合并后获得第九特征图，以及将第三特征图与第七特征图进行合并后获得第十特征图；根据预设的损失函数分别对第六特征图、第九特征图和第十特征图进行分类和边界框的预测。2.根据权利要求1所述的一种实时目标检测的方法，其特征在于，所述预设的损失函数包括分类损失函数、边界框回归损失函数和聚焦损失函数。3.根据权利要求2所述的一种实时目标检测的方法，其特征在于，所述根据预设的损失函数分别对第六特征图、第九特征图和第十特征图进行分类和边界框的预测这一步骤，具体为：结合分类损失函数、边界框回归损失函数、聚焦损失函数和预设的IOU阈值分别对第六特征图、第九特征图和第十特征图进行分类和边界框的预测。4.根据权利要求1所述的一种实时目标检测的方法，其特征在于，所述提取第一特征图的第一空间信息和第一通道信息这一步骤，具体为：采用预设的卷积块注意模块提取第一特征图的第一空间信息和第一通道信息。5.根据权利要求4所述的一种实时目标检测的方法，其特征在于，所述卷积块注意模块包括通道注意模块和空间注意模块。6.根据权利要求5所述的一种实时目标检测的方法，其特征在于，所述对图片进行第一卷积处理这一步骤，具体为：采用预设的卷积层...

【专利技术属性】
技术研发人员：葛海玉，杨琳，郝禄国，龙鑫，曾文彬，李伟儒，
申请(专利权)人：广州海昇计算机科技有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人