基于轻量级卷积神经网络的目标检测方法技术

技术编号：23315858 阅读：125 留言：0更新日期：2020-02-11 18:04

本发明专利技术公开了一种基于轻量级卷积神经网络的目标检测方法，主要解决现有目标检测方法网络复杂、速度不快和对小目标检测效果差的问题。本发明专利技术的具体步骤如下：(1)构建轻量级卷积神经网络；(2)生成目标训练集；(3)训练轻量级卷积神经网络；(4)对待检测目标进行检测。本发明专利技术构建了一个由特征提取模块、特征增强模块、识别和定位模块组成的轻量级卷积神经网络，克服了现有目标检测方法中大目标检测效果好、小目标检测效果差并且速度慢的问题，使得本发明专利技术不仅能够实时识别大目标，也能实时识别小目标。

Target detection method based on lightweight convolutional neural network

全部详细技术资料下载

【技术实现步骤摘要】
基于轻量级卷积神经网络的目标检测方法
本专利技术属于图像处理
，更进一步涉及图像识别
中的一种基于轻量级卷积神经网络的目标检测方法。本专利技术可用于检测自然图像中的静止目标。
技术介绍
现有的大量目标检测方法在公共数据集中获得了非常高的分数，但在现实任务中目标检测仍然存在很多挑战，像对小目标的检测效果较差等。例如，在智能体育教学中，检测球将有助于教练掌握打球的学生的准确性。然而，当将相机放置在运动室中时，球仅占据几个像素，并且由于运动中的小球会因为运动员的一些特定动作产生形变或者遮挡，而且还有不同的光照、运动模糊等影响因素，所以现有的目标检测网络并不适用于类似于此小球识别的目标识别场景。厦门大学在其申请的专利文献“基于卷积神经网络的快速目标检测方法”(专利申请号CN201510061852.6，公开号CN104573731A)中公开了一种基于卷积神经网络的快速目标检测方法。该方法首先利用训练集训练出卷积神经网络参数，然后利用扩展图的方式解决最大池化丢失特征的问题并生成判别完备特征图；把卷积神经网络的全连接权重看成线性分类器，采用可能近似学习框架来估计线性分类器在判别完备特征上的泛华误差；根据泛华误差和所期望泛化误差阈值来估算所需线性分类器个数，最后在判别完备特征图上用线性分类器基于平滑窗的方式完成目标检测。此方法虽然可以显著提高检测效率和目标检测精度，但是，该方法仍然存在的不足之处是：没有针对小目标的特征增强模块，对于图像中所含像素较少或含有遮挡的小目标检测，由于其提取特征的不明显，此方法效果并不...

【技术保护点】
1.一种基于轻量级卷积神经网络的目标检测方法，其特征在于，利用构建一个轻量级卷积神经网络提取并增强目标特征，并将网络输出的向量与类别和位置相对应，对图像数据集中的目标进行识别与定位，该方法的步骤包括如下：/n步骤1，构建轻量级卷积神经网络：/n第一步，搭建一个9层的特征提取模块，其结构依次为：第一卷积层→第二卷积层→第一池化层→第三卷积层→第四卷积层→第二池化层→第五卷积层→第六卷积层→第七卷积层；并设置每层参数为：将第一至第七卷积层中卷积核的个数分别设置为64，64，128，128，256，256，256，卷积核的大小均设置为3×3，步长均设置为1，第一和第二池化层均采用最大池化的方式，池化区域核的大小均设置为2×2，步长均设置为2；/n第二步，搭建一个3层的特征增强模块，其结构依次为：全局平均池化层→归一化层→点积层，其中点积层与全局平均池化层和归一化层并联；并将池化区域核的大小设置为2×2，步长设置为2；分别定义全局平均池化、归一化层和点积层的函数；/n第三步，搭建一个3层的识别和定位模块，其结构依次为：第八卷积层→第九卷积层→第十卷积层；其中第九卷积层和第十卷积层并联；并将第八...

【技术特征摘要】
1.一种基于轻量级卷积神经网络的目标检测方法，其特征在于，利用构建一个轻量级卷积神经网络提取并增强目标特征，并将网络输出的向量与类别和位置相对应，对图像数据集中的目标进行识别与定位，该方法的步骤包括如下：
步骤1，构建轻量级卷积神经网络：
第一步，搭建一个9层的特征提取模块，其结构依次为：第一卷积层→第二卷积层→第一池化层→第三卷积层→第四卷积层→第二池化层→第五卷积层→第六卷积层→第七卷积层；并设置每层参数为：将第一至第七卷积层中卷积核的个数分别设置为64，64，128，128，256，256，256，卷积核的大小均设置为3×3，步长均设置为1，第一和第二池化层均采用最大池化的方式，池化区域核的大小均设置为2×2，步长均设置为2；
第二步，搭建一个3层的特征增强模块，其结构依次为：全局平均池化层→归一化层→点积层，其中点积层与全局平均池化层和归一化层并联；并将池化区域核的大小设置为2×2，步长设置为2；分别定义全局平均池化、归一化层和点积层的函数；
第三步，搭建一个3层的识别和定位模块，其结构依次为：第八卷积层→第九卷积层→第十卷积层；其中第九卷积层和第十卷积层并联；并将第八、九、十卷积层中卷积核的个数分别设置为256，2，8，卷积核的大小均设置为3×3，步长均设置为1；
第四步，将特征提取模块、特征增强模块、识别和定位模块依次连接组成轻量级卷积神经网络；
步骤2，生成目标训练集：
第一步，将至少1500张含有目标的待检测图片组成图片数据集，所述的每张待检测图片是从连续拍摄的含有待检测目标的视频中每隔5帧组成大小为1920×1080×3的一张图片；
第二步，对图片数据集中的每张图片中的目标进行标注，标注出目标所在的每个外接矩形框的各顶点坐标和其代表的类别，标注后会对应生成一个含有各目标各顶点坐标和其类别信息的xml格式标注文件；将所有的图片放到名为JPEGImages的文件夹中，将所有的xml格式的标注文件放到Annotations文件夹中，组成训练集；
步骤3，训练轻量级卷积神经网络：
将训练集输入到轻量级卷积神经网络中，用梯度下降法更新轻量级卷积神经网络的权值，直至Loss值降至3.0以下为止，得到训练好的轻量级卷积神经网络；
步骤4，对待检测目标进行检测...

【专利技术属性】
技术研发人员：谢雪梅，金星，石光明，
申请(专利权)人：西安电子科技大学，
类型：发明
国别省市：陕西;61

全部详细技术资料下载我是这个专利的主人