一种基于多尺度匹配策略深度特征学习的目标检测方法技术

技术编号：25803892 阅读：42 留言：0更新日期：2020-09-29 18:38

一种基于多尺度匹配策略深度特征学习的目标检测方法，基于残差神经网络，我们首先对不同类目标的宽高比进行聚类，并进一步使用多尺度匹配策略来选择默认框，缓解目标遮挡问题。然后，融合不同深度的特征图以检测不同尺度的物体。实验结果表明，与当前九种具有代表性的目标检测方法相比，我们提出的方法更具竞争力，速度更快，精度更高。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于多尺度匹配策略深度特征学习的目标检测方法
本专利技术涉及计算机视觉和模式识别
，，具体说的是一种基于多尺度匹配策略深度特征学习的目标检测方法。
技术介绍
目标检测是从图像或视频中找到感兴趣的目标。人们的视觉系统可以从图像或视频中快速准确地捕捉到目标类型、位置以及各目标之间的相对关系。它可以帮助我们完成一些复杂的任务，例如运动和驾驶汽车。在过去的几十年中，多种目标检测算法已经被提出，它们可以分为两类：传统的目标检测算法和基于深度学习的目标检测算法。早期的目标检测算法主要基于手动构建的特征。由于当时缺乏有效的可视化技术，人们只能设计复杂的特征表示并不断对其进行优化。基于深度学习的方法，通过不断加深网络的深度让计算机自动提取特征，不需要复杂的特征表示，从而在近些年不断刷新计算机视觉领域的各项记录。但是，这两种方法都不能很好的检测小目标以及被遮挡的目标。
技术实现思路
为解决上述技术问题，本专利技术提供一种基于多尺度匹配策略深度特征学习的目标检测方法，速度更快，精度更高。为实现上述技术目的，所采用的技术方案是：一种基于多尺度匹配策略深度特征学习的目标检测方法，包括以下步骤：步骤一：聚类目标宽高比，划分单元格首先对数据集中所有具有真实框的被检测目标按照类别对宽高比进行聚类，得到所有类别默认框的宽高比信息，随后将数据集中每一张整幅图像按S*S个单元格进行划分，13≤S≤26；步骤二：多尺度匹配默认框，学习偏移量，得到预测框计算被检测目标的中...

【技术保护点】
1.一种基于多尺度匹配策略深度特征学习的目标检测方法，其特征在于：包括以下步骤，/n步骤一：聚类目标宽高比，划分单元格/n首先对数据集中所有具有真实框的被检测目标按照类别对宽高比进行聚类，得到所有类别默认框的宽高比信息，随后将数据集中每一张整幅图像按S*S个单元格进行划分，13≤S≤26；/n步骤二：多尺度匹配默认框，学习偏移量，得到预测框/n计算被检测目标的中心坐标，提取其所在单元格的直实框信息，将所有默认框依次与被检测目标的真实框进行比对，选择具有最大IoU值的默认框，并按照以下公式计算偏移量，得到预测框；/nb

【技术特征摘要】
1.一种基于多尺度匹配策略深度特征学习的目标检测方法，其特征在于：包括以下步骤，
步骤一：聚类目标宽高比，划分单元格
首先对数据集中所有具有真实框的被检测目标按照类别对宽高比进行聚类，得到所有类别默认框的宽高比信息，随后将数据集中每一张整幅图像按S*S个单元格进行划分，13≤S≤26；
步骤二：多尺度匹配默认框，学习偏移量，得到预测框
计算被检测目标的中心坐标，提取其所在单元格的直实框信息，将所有默认框依次与被检测目标的真实框进行比对，选择具有最大IoU值的默认框，并按照以下公式计算偏移量，得到预测框；
bx＝cx+px
by＝cy+py

bf＝p(b,obj)*pf
其中，bx，by，bw，bh，bf分别表示预测框的横坐标、纵坐标、宽、高以及包含目标的自信度，px，py，pw，ph，pf分别表示残差神经网络输出的横坐标、纵坐标、宽、高的偏移量和自信度，cx，cy，cw，ch分别表示默认框的横坐标、纵坐标、宽和高，p(b,obj)为示性函数，当输出的pf高于阈值t时，0.5≤t≤0.7，p(b,obj)为1，否则为0；
步骤三：多深度特征融合，检测多尺度目标
对整个残差神经网络的多个深度提取特征并进行融合后，并对整个残差神经网络的进行优化，对步骤二得到的预测框与真实框使用均方误差进...

【专利技术属性】
技术研发人员：董永生，张智勇，吴庆涛，裴远桦，郑博士，蒋志强，刘晴，谭伟，郑林涛，王琳，
申请(专利权)人：河南科技大学，
类型：发明
国别省市：河南;41

全部详细技术资料下载我是这个专利的主人