基于改进卷积神经网络的对象检测装置及方法制造方法及图纸

技术编号：17780361 阅读：26 留言：0更新日期：2018-04-22 09:12

本发明专利技术提供了的基于改进卷积神经网络的对象检测方法，该方法包括：采集已标记对象的标记图像；采用随机采样法，对改进卷积神经网络进行初步训练，获取初步分类的正样本和负样本，以及对应的分类概率值，再根据分类概率值，选择一定比例的正样本和负样本，对改进卷积神经网络进行训练，获取训练好的对象检测模型；输入待检测图像；采用对象检测模型对待检测图像进行对象检测，输出检测结果。与现有技术相比，本发明专利技术能快速准确地实现图像中的对象检测。

全部详细技术资料下载

【技术实现步骤摘要】
基于改进卷积神经网络的对象检测装置及方法
本专利技术涉及图像处理、视频监控以及安防，特别涉及对象检测装置及方法。
技术介绍
对象检测是一种利用计算机对图像进行处理、分析和理解，以检测各种不同模式的对象的技术。目前对象检测技术在智能交通、图像搜索、商品推荐、用户行为分析以及人脸检测等互联网应用产品中具有巨大的商业市场和良好的应用前景，同时在智能机器人、无人自动驾驶和无人机等高新科技产业以及生物学、医学和地质学等众多学科领域具有广阔的应用前景。早期的对象检测技术主要采用尺度不变特征变换(Scale-invariantfeaturetransform,SIFT)和方向梯度直方图(Histogramoforientedgradients,HOG)等特征提取方法，将提取到的特征输入至分类器中进行分类检测。这些特征是人工选取的，针对不同的识别问题，提取到的特征好坏直接影响系统性能。因此，这类识别技术只能针对某一特定的识别任务，范化能力较差，难以实际推广应用。深度学习是机器学习的一个分支，自2006年由GeoffreyHinton和他的学生提出以来，受到了极大的关注。2011年以来，研究人员首先在语音识别问题上应用深度学习技术，将准确率提高了20％～30％，取得了十多年来最大的突破性进展。2012年后，基于卷积神经网络的深度学习模型再大规模图像分类任务上取得了非常大的性能提高，掀起了深度学习研究的热潮。“RichFeatureHierarchiesforAccurateObjectDetectionandSemanticSegmentation.RGirshick，JD...
基于改进卷积神经网络的对象检测装置及方法

【技术保护点】
基于改进卷积神经网络的对象检测装置，其特征在于，该装置包括：标记图像采集模块，用于采集已标记对象的标记图像；对象检测模型训练模块，用于采用随机采样法，对改进卷积神经网络进行初步训练，获取初步分类的正样本和负样本，以及对应的分类概率值，再根据分类概率值，选择一定比例的正样本和负样本，对改进卷积神经网络进行训练，获取训练好的对象检测模型；待检测图像输入模块，用于输入待检测图像；以及对象检测模块，用于采用对象检测模型对待检测图像进行对象检测，输出检测结果。

【技术特征摘要】
1.基于改进卷积神经网络的对象检测装置，其特征在于，该装置包括：标记图像采集模块，用于采集已标记对象的标记图像；对象检测模型训练模块，用于采用随机采样法，对改进卷积神经网络进行初步训练，获取初步分类的正样本和负样本，以及对应的分类概率值，再根据分类概率值，选择一定比例的正样本和负样本，对改进卷积神经网络进行训练，获取训练好的对象检测模型；待检测图像输入模块，用于输入待检测图像；以及对象检测模块，用于采用对象检测模型对待检测图像进行对象检测，输出检测结果。2.如权利要求1所述的装置，其特征在于，所述对象检测模型训练模块进一步包括：随机采样处理模块，用于分别将标记图像内的每个标记对象缩放到设定的尺度范围内，并根据该缩放比例对标定图像进行采样处理，以获取该标记对象的尺度图像；样本获取模块，用于根据不同的尺度图像，对改进卷积神经网络进行训练，获取一系列标记对象的正样本和负样本，以及对应窗口的分类概率值；样本选取模块，用于将所有正样本和负样本对应窗口的分类概率值进行排序，选取分类概率值高的前Num1个正样本和分类概率值高的前Num2个负样本；二次训练模块，用于将选取的Num1个正样本和Num2个负样本输入改进卷积神经网络中，以进行二次训练，获得对象检测模型。3.如权利要求2所述的装置，其特征在于，所述随机采样处理模块进一步包括：用于计算标记对象的宽度WTO，若T1≤WTO*RS≤T2，RS为缩放比例，获取标记对象的尺度图像，该尺度图像的宽度是标记图像宽度的该尺度图像的高度是标记图像高度的4.如权利要求3所述的装置，所述T1的取值范围为15～25，T2的取值范围为35～45。5.如权利要求1或2所述的装置，其特征在于，所述改进卷积神经网络包括：图像输入模块，用于输入图像；特征子网络模块，用于对不同尺度的分辨率图像分别进行卷积、非线性单元和池化处理，以获得不同尺度的分辨率特征图像；建议子网络模块，用于对不同尺度的分辨率特征图像进行锚子网络处理和分析，获取图像内对象的建议窗口的位置坐标和分类概率值。6.如权利要求5所述的装置，其特征在于，所述特征子网络模块包括10个卷积层和9个池化层。7.如权利要求6所述的装置，其特征在于，所述特征子网络模块进一步包括：输入层、第一卷积层第一输出层conv1_1、第一卷积层第二输出层conv1_2、第一池化层pool1、第二卷积层第一输出层conv2_1、第二卷积层第二输出层conv2_2、第二池化层pool2、第三卷积层第一输出层conv3_1、第三卷积层第二输出层conv3_2、第三卷积层第三输出层conv3_3、第三池化层pool3、第四卷积层第一输出层conv4_1、第四卷积层第二输出层conv4_2、第四卷积层第三输出层conv4_3、第四池化层pool4、第五卷积层第一输出层conv5_1、第五卷积层第二输出层conv5_2、第五卷积层第三输出层conv5_3、第五池化层pool5、第六卷积层第一输出层conv6_1、第六卷积层第二输出层conv6_2、第六池化层pool6、第七卷积层第一输出层conv7_1、第七卷积层第二输出层conv7_2、第七池化层pool7、第八卷积层第一输出层conv8_1、第八卷积层第二输出层conv8_2、第八池化层pool8、第九卷积层第一输出层conv9_1、第九卷积层第二输出层conv9_2、第九池化层pool1、第十卷积层第一输出层conv10_1、第十卷积层第二输出层conv10_2。8.如权利要求5所述的装置，其特征在于，所述建议子网络模块进一步包括：特征图像输入模块，用于输入第三卷积层第三输出层conv3_3、第四卷积层第三输出层conv4_3、第五卷积层第三输出层conv5_3、第六卷积层第二输出层conv6_2、第七卷积层第二输出层conv7_2、第八卷积层第二输出层conv8_2、第九卷积层第二输出层conv9_2、第十卷积层第二输出层conv10_2的特征图像；锚子网络处理模块，用于采用8个锚子网络对输入的8个特征图像分别进行处理，输出8个对应特征图像的锚窗口的先验位置坐标、分类概率值和修正位置坐标；锚子网络分析模块，用于根据锚窗口的先验位置坐标计算锚窗口的先验长度和先验宽度，根据锚窗口的修正位置坐标计算锚窗口的修正长度和修正宽度，按照修正公式对锚窗口进行修正，获取锚窗口的预测窗口，并对锚窗口的预测窗口做非极大值抑制，获取建议窗口的...

【专利技术属性】
技术研发人员：曾建平，王军，王正，余旭，李党，
申请(专利权)人：北京智芯原动科技有限公司，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人