目标检测方法、设备及存储介质技术

技术编号：26419897 阅读：48 留言：0更新日期：2020-11-20 14:15

本发明专利技术实施例提供一种目标检测方法、设备及存储介质，该方法包括：获取目标图像，目标图像中包括多个不同尺寸和/或不同形状的目标对象；采用主干网络层提取目标图像的特征，以获得多个不同尺寸的主干特征图；按照筛选策略从主干特征图中获取多个第一主干特征图；采用多尺寸可变形的感受野模块提取各第一主干特征图中不同尺寸和/或不同形状的目标特征信息，以获得对应的感受野特征图；采用目标检测层根据各感受野特征图检测目标图像中的目标对象。可提取不同尺寸和不同形状的目标对象的特征信息，所以可准确检测出多种目标对象，大大提高多目标检测场景下的目标检测准确率。

全部详细技术资料下载

【技术实现步骤摘要】
目标检测方法、设备及存储介质
本专利技术实施例涉及图像处理
，尤其涉及一种目标检测方法、设备及存储介质。
技术介绍
随着人工智能技术的发展，深度学习技术也得到了飞速发展。并在语音识别、计算机视觉等领域得到了广泛应用。其中，目标检测作为计算机视觉的一个重要研究方向，也已经取得了突破进展。现有技术中，目标检测主要针对的是单一目标的场景，如车辆的检测，车牌的检测，人物的检测等。主要应用到Faster-RCNN、SSD等深度学习模型进行目标检测。采用这些深度学习模型进行单一目标的检测时，具有较高的准确率。但目前目标检测的场景不再只有单一目标检测的场景，对于不同尺寸或形状差异较大的多种目标检测场景，在采用现有的深度学习模型进行目标检测时，并不能准确检测出多种目标，导致多目标检测场景下的目标检测准确率较低。
技术实现思路
本专利技术实施例提供一种目标检测方法、设备及存储介质，解决了现有技术中对于不同尺寸或形状差异较大的多种目标检测场景，在采用现有的深度学习模型进行目标检测时，并不能准确检...

【技术保护点】
1.一种目标检测方法，其特征在于，采用训练至收敛的目标检测模型对目标进行检测，所述训练至收敛的目标检测模型包括：主干网络层、多尺寸可变形的感受野模块及目标检测层，所述方法包括：/n获取目标图像，所述目标图像中包括多个不同尺寸和/或不同形状的目标对象；/n采用所述主干网络层提取所述目标图像的特征，以获得多个不同尺寸的主干特征图；/n按照筛选策略从所述主干特征图中获取多个第一主干特征图；/n采用所述多尺寸可变形的感受野模块提取各所述第一主干特征图中不同尺寸和/或不同形状的目标特征信息，以获得对应的感受野特征图；/n采用所述目标检测层根据各所述感受野特征图检测所述目标图像中的目标对象。/n

【技术特征摘要】
1.一种目标检测方法，其特征在于，采用训练至收敛的目标检测模型对目标进行检测，所述训练至收敛的目标检测模型包括：主干网络层、多尺寸可变形的感受野模块及目标检测层，所述方法包括：
获取目标图像，所述目标图像中包括多个不同尺寸和/或不同形状的目标对象；
采用所述主干网络层提取所述目标图像的特征，以获得多个不同尺寸的主干特征图；
按照筛选策略从所述主干特征图中获取多个第一主干特征图；
采用所述多尺寸可变形的感受野模块提取各所述第一主干特征图中不同尺寸和/或不同形状的目标特征信息，以获得对应的感受野特征图；
采用所述目标检测层根据各所述感受野特征图检测所述目标图像中的目标对象。

2.根据权利要求1所述的方法，其特征在于，所述训练至收敛的目标检测模型还包括：卷积网络层；
所述采用所述主干网络层提取所述目标图像的特征，以获得多个不同尺寸的主干特征图之后，还包括：
按照所述筛选策略从所述主干特征图中获取第二主干特征图；
采用所述卷积网络层提取所述第二主干特征图中的目标特征信息，以获得卷积网络特征图。

3.根据权利要求2所述的方法，其特征在于，所述采用所述目标检测层根据各所述感受野特征图检测所述目标图像中的目标对象，包括：
采用所述目标检测层根据各所述感受野特征图和所述卷积网络特征图检测所述目标图像中的目标对象。

4.根据权利要求3所述的方法，其特征在于，所述采用所述目标检测层根据各所述感受野特征图和所述卷积网络特征图检测所述目标图像中的目标对象，包括：
将各所述感受野特征图和所述卷积网络特征图输入到目标检测层中；
采用所述目标检测层在各所述感受野特征图和所述卷积网络特征图中分别按照坐标点设置检测框，并确定各所述检测框的类别分类结果及在目标图像中的位置信息；
采用所述目标检测层根据所述类别分类结果及在目标图像中的位置信息确定所述目标图像中的目标对象。

5.根据权利要求1所述的方法，其特征在于，所述多尺寸可变形的感受野模块中包括：多个卷积支路，每个卷积支路包括对应的降维卷积层，空洞卷积层及可变形卷积层，各卷积支路中的空洞卷积层中的空洞卷积核的扩张率不同，可变形卷积层的可变卷积核的尺寸和形状不同；
所述采用所述多尺寸可变形的感受野模块提取各所述第一主干特征图中不同尺寸和/或不同形状的目标特征信息，以获得对应的感受野特征图，包括：
针对每个第一主干特征图，执行以下操作：
将所述第一主干特征图输入到所述多尺寸可变形的感...

【专利技术属性】
技术研发人员：陈光，
申请(专利权)人：上海眼控科技股份有限公司，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人