The invention proposes a novel convolution neural network model, i. e. grouped expanded convolution neural network model, which uses feature fusion to improve detection accuracy, and further proposes a detection method and device based on the grouped expanded convolution neural network model. The detection method includes the following steps: firstly, preprocessing the measured image to obtain the preprocessed image; secondly, building the grouped extended convolution neural network model; thirdly, training the model; secondly, inputting the preprocessed image to get the position and category of the target object in the preprocessed image. Among them, the grouped expanded convolution neural network model has more than one. The residual structure and at least one first feature fusion layer are connected by a part of a plurality of residual structures through up and down sampling respectively and normalized into the same feature space.
【技术实现步骤摘要】
基于分组扩张卷积神经网络模型的目标检测方法及装置
本专利技术属于计算机视觉、人工智能
,涉及一种复杂场景下的目标检测方法及装置,具体涉及一种基于分组扩张卷积神经网络模型的目标检测方法及装置。
技术介绍
在当前机器学习技术及计算机硬件性能高速提升的情况下,近年来计算机视觉、自然语言处理和语音检测等应用领域取得了突破性进展。目标检测作为计算机视觉领域一项基础的任务,其精度也得到了大幅提升。目标检测任务可分为两个关键的子任务:目标分类和目标定位。其中,目标分类任务负责判断输入图像中是否有感兴趣类别的物体出现,其输出一系列带分数的标签,用来表明感兴趣类别的物体出现在输入图像中的可能性;目标定位任务负责确定输入图像中感兴趣类别的物体的位置和范围,输出物体的包围盒,或物体中心,或物体的闭合边界等,通常方形包围盒是最常用的选择。目标检测对计算机视觉领域和实际应用具有重要意义,在过去几十年里激励大批研究人员密切关注并投入研究。随着强劲的机器学习理论和特征分析技术的发展,近十几年目标检测课题相关的研究活动有增无减,每年都有最新的研究成果和实际应用发表和公布。不仅如此,目标检测也被应用到很多实际任务,例如智能视频监控、基于内容的图像检索、机器人导航和增强现实等。然而,现有技术的多种目标检测方法的检测准确率仍然较低而不能应用于实际通用的检测任务。因此,目标检测还远未被完美解决,仍旧是重要的挑战性的研究课题。为了提高目标检测的准确率,目前常用的方法是增加检测模型训练时的训练数据。然而,一方面,收集大量的训练数据是一件极其困难的工作,另一方面,训练数据量增多也导致模型训练时间 ...
【技术保护点】
1.一种基于分组扩张卷积神经网络模型的目标检测方法,其特征在于,采用基于分组扩张卷积神经网络模型从待测图像中检测出目标物体的位置及类别,包括如下步骤:步骤S1,对所述待测图像进行预处理获得预处理图像;步骤S2,搭建分组扩张卷积神经网络模型;步骤S3,把包含多张训练图像的训练集输入搭建好的所述分组扩张卷积神经网络模型从而进行模型训练;步骤S4,将所述预处理图像输入训练完成的所述分组扩张卷积神经网络模型,从而得出各个预处理图像中的目标物体的类别结果以及位置结果并进行输出,其中,所述分组扩张卷积神经网络模型具有多个残差结构以及至少一个第一特征融合层,所述第一特征融合层由所述多个残差结构中的一部分分别经上下采样后连接得到,并被归一化到相同的特征空间。
【技术特征摘要】
1.一种基于分组扩张卷积神经网络模型的目标检测方法,其特征在于,采用基于分组扩张卷积神经网络模型从待测图像中检测出目标物体的位置及类别,包括如下步骤:步骤S1,对所述待测图像进行预处理获得预处理图像;步骤S2,搭建分组扩张卷积神经网络模型;步骤S3,把包含多张训练图像的训练集输入搭建好的所述分组扩张卷积神经网络模型从而进行模型训练;步骤S4,将所述预处理图像输入训练完成的所述分组扩张卷积神经网络模型,从而得出各个预处理图像中的目标物体的类别结果以及位置结果并进行输出,其中,所述分组扩张卷积神经网络模型具有多个残差结构以及至少一个第一特征融合层,所述第一特征融合层由所述多个残差结构中的一部分分别经上下采样后连接得到,并被归一化到相同的特征空间。2.根据权利要求1所述的基于分组扩张卷积神经网络模型的目标检测方法,其特征在于:其中,所述分组扩张卷积神经网络模型还包括至少一个第二特征融合层,该第二特征融合层由所述多个残差结构中的另一部分以及所述第一特征融合层分别经上下采样后连接得到,并被归一化到相同的特征空间。3.根据权利要求1所述的基于分组扩张卷积神经网络模型的目标检测方法,其特征在于:其中,所述待测图像为待测视频,步骤S1的所述预处理包括从所述待测视频中抽取多个图像帧。4.根据权利要求3所述的基于分组扩张卷积神经网络模型的目标检测方法,其特征在于:其中,所述图像帧的...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。