The invention belongs to the field of image detection technology, and specifically provides a method and device for detecting deep learning objects based on dense connection, aiming at solving the problem that the existing technology is difficult to accurately detect small objects in images. To this end, in the deep learning object detection method based on dense connection, object detection is carried out on the input image based on the pre-constructed object detection network model, and the classification results and coordinate positions of objects in the input image are obtained. The method of the present invention can extract multi-scale features of the input image, thereby better describing small objects in the image. At the same time, the device of the invention can perform the above method.
【技术实现步骤摘要】
基于稠密连接的深度学习物体检测方法及装置
本专利技术属于图像检测
,具体涉及一种基于稠密连接的深度学习物体检测方法及装置。
技术介绍
随着神经网络、计算机视觉、人工智能以及机器感知等技术的发展,物体检测作为上述技术重要的组成部分,也得到了长足的发展,物体检测是指利用计算机对图像进行分析,得到图像中物体的位置信息和类别信息。传统的物体检测方法是依靠人工设计的特征识别图像中物体的位置信息和类别信息,但是人工设计的特征很容易受到光线变化、物体颜色变化以及背景嘈杂的干扰,导致在实际应用中鲁棒性差,难以满足用户的精度要求。随着神经网络的发展,基于深度卷积神经网络的物体检测方法在一定程度上克服了传统物体检测方法的缺陷,提高了鲁棒性,但是其对图像中尺寸较小物体(像素小于32*32的物体)的检测效果仍不够理想,由于尺寸较小的物体在图像中所占尺寸太小,基于深度卷积神经网络的物体检测方法难以生成合适的特征表达,而图像的特征表达是对图像的抽象描述,能够代表图像的特点,特征的好坏直接影响着物体检测结果,现有的物体检测方法难以得到正确的检测结果,因此,如何提出一种解决上述问题的方案是 ...
【技术保护点】
1.一种基于稠密连接的深度学习物体检测方法,其特征在于,所述方法包括:基于预先构建的物体检测网络模型对输入图像进行物体检测,得到所述输入图像中物体的分类结果和坐标位置;其中,所述物体检测网络模型基于卷积神经网络模型构建,包括特征提取模块、融合模块、聚合模块以及预测模块;所述特征提取模块基于探索函数和保持函数构建,用于提取所述输入图像的多尺度特征;所述融合模块基于特征融合函数和反卷积函数构建,用于调整所述多尺度特征的通道数并对所述多尺度特征进行融合;所述聚合模块基于卷积函数构建,用于调整进行融合后的多尺度特征的空间关系;所述预测模块基于卷积函数和损失函数构建,用于检测物体的尺 ...
【技术特征摘要】
1.一种基于稠密连接的深度学习物体检测方法,其特征在于,所述方法包括:基于预先构建的物体检测网络模型对输入图像进行物体检测,得到所述输入图像中物体的分类结果和坐标位置;其中,所述物体检测网络模型基于卷积神经网络模型构建,包括特征提取模块、融合模块、聚合模块以及预测模块;所述特征提取模块基于探索函数和保持函数构建,用于提取所述输入图像的多尺度特征;所述融合模块基于特征融合函数和反卷积函数构建,用于调整所述多尺度特征的通道数并对所述多尺度特征进行融合;所述聚合模块基于卷积函数构建,用于调整进行融合后的多尺度特征的空间关系;所述预测模块基于卷积函数和损失函数构建,用于检测物体的尺寸,输出物体的类别置信度和坐标位置。2.根据权利要求1所述的方法,其特征在于,所述特征提取模块提取所述输入图像的多尺度特征的方法为:所述特征提取模块的探索函数对所述输入图像的中间特征进行第一下采样操作,得到第一尺度特征;所述特征提取模块的保持函数对所述输入图像的中间特征进行第二下采样操作,得到第二尺度特征;将所述第一尺度特征和所述第二尺度特征进行拼接操作,得到所述输入图像的多尺度特征。3.根据权利要求2所述的方法,其特征在于,所述融合模块对所述多尺度特征进行融合的方法为:对所述多尺度特征进行反卷积上采样操作,得到第三尺度特征;利用特征融合函数对所述第三尺度特征和所述多尺度特征进行融合操作,得到融合特征。4.根据权利要求3所述的方法,其特征在于,“对所述第三尺度特征和所述多尺度特征进行融合操作”,其方法如下公式所示:rk=Sk(Uk(rk+1),yk)其中,rk表示融合特征,Sk表示特征融合函数,Uk表示反卷积上采样函数,yk表示多尺度特征,k表示中间变量。5.根据权利要求4所述的方法,其特征在于,聚合模块调整进行融合后的多尺度特征的空间关系的方法为:对所述融合特征进行卷积操作,具体方法如下公式所示:其中,rk表示融合特征,表示以1×1的卷积核对rk进行填充为0的卷积操作;表示以3×3的卷积核对rk进行填充为1的卷积操作;表示对rk进行3×3的池化操作,再以1×1的卷积核对rk进行填充为0的卷积操作;表示以2个连续的3×3的卷积核对rk进行填充为1的卷积操作。6.根据权利要求1-5任一项所述的方法,其特征在于,获取物体的类别置信度和坐标位置,其方法如下公式所示:其中,N表示正样本的个数,Lcls表示分类任务的损失函数,Lloc表示坐标回归任务的损失函数,和分别表示深度学习网络模型输出的类别置信度和坐标位置,c和l分别表示标准的类别置信度和坐标位置。7.根据权利要求6所述的方法,其特征在于,获取物体的类别置信度之后,该方法还包括:将所述物体的类别置信度输入softmax函数,得到物体的分类结果。8.根据权利要求7所述的方法,其特征在于,构建所述物体检测网络模型的方法如下公式所示:xn=Fn(xn-1)=Fn(Fn-1(…F1(I))){y1,y2,…,ym}={H1(xn),H2(y1),…,Hm(ym-1)}Detection={P1(y1),P2(y2),…,Pm(ym)}其中,I表示输入图像,Fn表示非线性变换函数,xn表示第n层的图像特征表达,y1,y2,…,ym表示多尺度特征,Hm表示特征变换函数,Pm表示预测函数,m、n均表示输入图像的层数。9.一种基于稠密连接的深度学习物体检测装置,其特征在于,所述装置包括:输入模块,所述输入模块配置为获取用于物体检测的输入图像;物体检测模块,所述物体检测模块配置为对所述输入图像进行物体检测;输出模...
【专利技术属性】
技术研发人员:赵鑫,黄凯奇,徐沛,
申请(专利权)人:中国科学院自动化研究所,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。