一种基于深度可分离卷积的目标检测方法和系统技术方案

技术编号:20589732 阅读:27 留言:0更新日期:2019-03-16 07:25
本发明专利技术提供了一种基于深度可分离卷积的目标检测方法和系统,其方法包括:获取图像数据;所述图像数据包括目标对象;将所述图像数据输入至深度可分离神经网络中,提取所述图像数据中的图像特征;根据不同层次的图像特征进行融合检测,输出所述目标对象的预测结果。本发明专利技术解决使用标准卷积神经网络进行目标对象识别时速度较慢的问题,使用不同层次的图像特征进行检测后,进行特征融合,保证了目标对象检测的高效性和准确率,实现计算开销小、有效精准检测目标对象的目的。

【技术实现步骤摘要】
一种基于深度可分离卷积的目标检测方法和系统
本专利技术涉及神经网络领域,尤指一种基于深度可分离卷积的目标检测方法和系统。
技术介绍
机器人在运行时,需要考虑其安全性、效率、智能化程度等,因此对其所处的环境有一定的理解是发展趋势,也是机器人真正应用不可避免的技术需求。视觉信息对于机器人来说具有非常重要的意义与作用。从信息量的角度来说,视觉信息量非常丰富,正如人类对世界的理解很大程度都依赖视觉信息,视觉信息对于理解周围的环境是至关重要的。从成本角度来说,当下的图像采集设备做到了高速高清并且低成本,相对于价格高昂的激光雷达,图像设备采集设备具有明显的成本优势。从技术发展角度来说,近来深度学习的快速进步带动了人工智能的热潮,其中要数计算机视觉的发展比较迅猛,各种先进的视觉技术不断应用在不同的产品形态中,为提升智能化水平和用户体验做出了巨大的贡献。机器人理解世界中重要的一个步骤是,看懂周围的物体,知道它们是什么、在哪里,那么这就对应着计算机视觉里一种重要的目标检测任务,其主要内容是找出图像中的目标并给出其在图像中的位置。由于机器人属于移动平台并且是由电池供能,其硬件的计算能力有限并且能耗需要有效控制,因此设计一种能够在机器人平台上有效运行的目标检测算法是非常有意义也是具有挑战性的任务。当前的目标检测算法,一般难以在机器人平台上进行部署,因为其计算复杂度较高,机器人平台的算力不够。因此,如何提供一种计算开销小、有效精准检测目标对象是亟需解决的问题。
技术实现思路
本专利技术的目的是提供一种基于深度可分离卷积的目标检测方法和系统,实现提供一种计算开销小、有效精准检测目标对象的目的。本专利技术提供的技术方案如下:本专利技术提供一种基于深度可分离卷积的目标检测方法,包括步骤:获取图像数据;所述图像数据包括目标对象;将所述图像数据输入至深度可分离神经网络中,提取所述图像数据中的图像特征;根据不同层次的图像特征进行融合检测,输出所述目标对象的预测结果。进一步的,所述将所述图像数据输入至深度可分离神经网络中,提取所述图像数据中的图像特征具体包括步骤:将所述图像数据,按照第一预设顺序依次顺序输入至对应的分离卷积层后得到第一图像特征;将所述第一图像特征,按照第二预设顺序输入至对应的分离卷积层后得到第二图像特征;将所述第二图像特征,按照第三预设顺序输入至对应的分离卷积层后得到第三图像特征;其中,所述第一预设顺序为第一中级分离卷积层,第一初级分类网络结构,第二初级分类网络结构,第二中级分类网络结构,第三初级分类网络结构,第四初级分类网络结构,第一次级分类网络结构,第三中级分类网络结构,第五初级分类网络结构,第六初级分类网络结构,第一末级分类网络结构,第二次级分类网络结构和标准卷积网络结构;所述第二预设顺序为第四中级分类网络结构,第七初级分类网络结构,第八初级分类网络结构,第二末级分类网络结构,第三次级分类网络结构;所述第三预设顺序为深度卷积网络结构,第九初级分类网络结构和第四次级分类网络结构;每一个分类网络结构的输出为与之连接的分类网络结构的输入;所述第一图像特征,所述第二图像特征和所述第三图像特征的层次按照编号顺序递增,层次与语义性成正比,层次与分辨率成反比。进一步的,所述根据不同层次的图像特征进行融合检测,输出所述目标对象的预测结果具体包括步骤:将所述第三图像特征输入至第一检测层,输出第一检测结果;将所述第三图像特征与所述第二图像特征融合得到的第一融合结果输入至第二检测层,输出第二检测结果;将所述第三图像特征与所述第一融合结果融合得到的第二融合结果输入至第三检测层,输出第三检测结果;将所述第一检测结果,第二检测结果,第三检测结果进行融合处理,得到融合特征;根据所述融合特征对每个目标对象候选区域进行分类识别,输出所述目标对象的预测结果;其中,所述第一检测结果、第二检测结果,第三检测结果均包括位置损失,置信度损失和类别损失。进一步的,所述根据所述融合特征对每个目标对象候选区域进行分类识别,输出所述目标对象的预测结果之前包括步骤:将不同层次的图像特征输入至分类器,输出分类结果;所述分类结果包括遮挡损失;所述根据所述融合特征对每个目标对象候选区域进行分类识别,输出所述目标对象的预测结果具体包括步骤:根据所述目标对象的预测结果,当所述分类结果达到预设阈值时,输出所述目标对象在所述预测结果的空间位置处被遮挡。进一步的,所述获取图像数据具体包括步骤:获取所述图像数据,将所述图像数据进行灰度化处理;将灰度处理后的图像数据进行归一化处理,得到符合所述深度可分离神经网络规格的图像数据。本专利技术还提供一种基于深度可分离卷积的目标检测系统,包括:第一获取模块,用于获取图像数据;所述图像数据包括目标对象;处理模块,用于将所述图像数据输入至深度可分离神经网络中,提取所述图像数据中的图像特征;控制模块,用于根据不同层次的图像特征进行融合检测,输出所述目标对象的预测结果。进一步的,所述处理模块包括:第一分离计算单元,用于将所述图像数据,按照第一预设顺序依次顺序输入至对应的分离卷积层后得到第一图像特征;第二分离计算单元,用于将所述第一图像特征,按照第二预设顺序输入至对应的分离卷积层后得到第二图像特征;第三分离计算单元,用于将所述第二图像特征,按照第三预设顺序输入至对应的分离卷积层后得到第三图像特征;其中,所述第一预设顺序为第一中级分离卷积层,第一初级分类网络结构,第二初级分类网络结构,第二中级分类网络结构,第三初级分类网络结构,第四初级分类网络结构,第一次级分类网络结构,第三中级分类网络结构,第五初级分类网络结构,第六初级分类网络结构,第一末级分类网络结构,第二次级分类网络结构和标准卷积网络结构;所述第二预设顺序为第四中级分类网络结构,第七初级分类网络结构,第八初级分类网络结构,第二末级分类网络结构,第三次级分类网络结构;所述第三预设顺序为深度卷积网络结构,第九初级分类网络结构和第四次级分类网络结构;每一个分类网络结构的输出为与之连接的分类网络结构的输入;所述第一图像特征,所述第二图像特征和所述第三图像特征的层次按照编号顺序递增,层次与语义性成正比,层次与分辨率成反比。进一步的,所述控制模块包括:第一检测单元,用于将所述第三图像特征输入至第一检测层,输出第一检测结果;第二检测单元,用于将所述第三图像特征与所述第二图像特征融合得到的第一融合结果输入至第二检测层,输出第二检测结果;第三检测单元,用于将所述第三图像特征与所述第一融合结果融合得到的第二融合结果输入至第三检测层,输出第三检测结果;融合处理单元,用于将所述第一检测结果,第二检测结果,第三检测结果进行融合处理,得到融合特征;识别单元,用于根据所述融合特征对每个目标对象候选区域进行分类识别,输出所述目标对象的预测结果;其中,所述第一检测结果、第二检测结果,第三检测结果均包括位置损失,置信度损失和类别损失。进一步的,所述控制模块还包括:第四检测单元,用于将不同层次的图像特征输入至分类器,输出分类结果;所述分类结果包括遮挡损失;所述识别单元,还用于根据所述目标对象的预测结果,当所述分类结果达到预设阈值时,输出所述目标对象在所述预测结果的空间位置处被遮挡。进一步的,所述第一获取模块还包括:获取单元,用于获取所述图像数据,将所本文档来自技高网...

【技术保护点】
1.一种基于深度可分离卷积的目标检测方法,其特征在于,包括步骤:获取图像数据;所述图像数据包括目标对象;将所述图像数据输入至深度可分离神经网络中,提取所述图像数据中的图像特征;根据不同层次的图像特征进行融合检测,输出所述目标对象的预测结果。

【技术特征摘要】
1.一种基于深度可分离卷积的目标检测方法,其特征在于,包括步骤:获取图像数据;所述图像数据包括目标对象;将所述图像数据输入至深度可分离神经网络中,提取所述图像数据中的图像特征;根据不同层次的图像特征进行融合检测,输出所述目标对象的预测结果。2.根据权利要求1所述的基于深度可分离卷积的目标检测方法,其特征在于,所述将所述图像数据输入至深度可分离神经网络中,提取所述图像数据中的图像特征具体包括步骤:将所述图像数据,按照第一预设顺序依次顺序输入至对应的分离卷积层后得到第一图像特征;将所述第一图像特征,按照第二预设顺序输入至对应的分离卷积层后得到第二图像特征;将所述第二图像特征,按照第三预设顺序输入至对应的分离卷积层后得到第三图像特征;其中,所述第一预设顺序为第一中级分离卷积层,第一初级分类网络结构,第二初级分类网络结构,第二中级分类网络结构,第三初级分类网络结构,第四初级分类网络结构,第一次级分类网络结构,第三中级分类网络结构,第五初级分类网络结构,第六初级分类网络结构,第一末级分类网络结构,第二次级分类网络结构和标准卷积网络结构;所述第二预设顺序为第四中级分类网络结构,第七初级分类网络结构,第八初级分类网络结构,第二末级分类网络结构,第三次级分类网络结构;所述第三预设顺序为深度卷积网络结构,第九初级分类网络结构和第四次级分类网络结构;每一个分类网络结构的输出为与之连接的分类网络结构的输入;所述第一图像特征,所述第二图像特征和所述第三图像特征的层次按照编号顺序递增,层次与语义性成正比,层次与分辨率成反比。3.根据权利要求2所述的基于深度可分离卷积的目标检测方法,其特征在于,所述根据不同层次的图像特征进行融合检测,输出所述目标对象的预测结果具体包括步骤:将所述第三图像特征输入至第一检测层,输出第一检测结果;将所述第三图像特征与所述第二图像特征融合得到的第一融合结果输入至第二检测层,输出第二检测结果;将所述第三图像特征与所述第一融合结果融合得到的第二融合结果输入至第三检测层,输出第三检测结果;将所述第一检测结果,第二检测结果,第三检测结果进行融合处理,得到融合特征;根据所述融合特征对每个目标对象候选区域进行分类识别,输出所述目标对象的预测结果;其中,所述第一检测结果、第二检测结果,第三检测结果均包括位置损失,置信度损失和类别损失。4.根据权利要求3所述的基于深度可分离卷积的目标检测方法,其特征在于,所述根据所述融合特征对每个目标对象候选区域进行分类识别,输出所述目标对象的预测结果之前包括步骤:将不同层次的图像特征输入至分类器,输出分类结果;所述分类结果包括遮挡损失;所述根据所述融合特征对每个目标对象候选区域进行分类识别,输出所述目标对象的预测结果具体包括步骤:根据所述目标对象的预测结果,当所述分类结果达到预设阈值时,输出所述目标对象在所述预测结果的空间位置处被遮挡。5.根据权利要求1-4任一项所述的基于深度可分离卷积的目标检测方法,其特征在于,所述获取图像数据具体包括步骤:获取所述图像数据,将所述图像数据进行灰度化处理;将灰度处理后的图像数据进行归一化处理,得到符合所述深度可分离神...

【专利技术属性】
技术研发人员:张雷
申请(专利权)人:江苏木盟智能科技有限公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1