一种基于Faster-RCNN的加强学习的目标检测方法技术

技术编号：19481131 阅读：18 留言：0更新日期：2018-11-17 10:39

本发明专利技术公开了一种基于Faster‑RCNN的加强学习的目标检测方法，涉及图像处理领域，该方法包括：采集待测图像，将待测图像导入Faster‑RCNN，Faster‑RCNN中的卷积神经网络的网络结构进行了修改，将最后一个尺度的网络结构中的卷积模块替换为沙漏模块，通过卷积神经网络对待测图像进行特征提取生成特征映射图，将最后一层特征映射图导入RPN，RPN网络筛选出来的候选区域对应的特征映射图向量化后再用分类器对其进行具体的分类，得到检测结果；该方法修改了卷积神经网络的网络结构，使用沙漏模块代替深层网络中的普通的卷积模块，对深度卷积神经网络提取的深层特征携带的语义信息进行了加强学习，分层突出物体的语义信息，在一定程度上减少了漏报和误报。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于Faster-RCNN的加强学习的目标检测方法
本专利技术涉及图像处理领域，尤其是一种基于Faster-RCNN的加强学习的目标检测方法。
技术介绍
目标检测被广泛地应用于行人检测、智能辅助驾驶、智能监控、火焰烟雾检测以及智能机器人等领域，目标检测技术虽然发展迅速，但是也存在很多问题，光照、遮挡、背景混淆、尺度问题一直是目标检测的难点。深度卷积神经网络在目标检测任务上表现非常出色，这主要归功于大样本和其复杂的形式，深度使得模型拥有了很强的非线性表达能力。通常情况下，深度卷积神经网络搭建好后之后，进行端对端的训练，虽然可以通过卷积神经网络可视化技术来观察网络训练的优劣，但是目前这只是用来判断网络是否收敛的一个依据，卷积神经网络提取的可视化的深层特征中包含丰富的语义信息，但目前并不会对这些可视化的特征做后续处理，若能对语义信息进行再学习和提炼，对于之后的图像处理任务都会有所帮助。
技术实现思路
本专利技术人针对上述问题及技术需求，提出了一种基于Faster-RCNN的加强学习的目标检测方法，该方法修改了卷积神经网络的网络结构，使用沙漏模块代替深层网络中的普通的卷积模块，对深度卷积神经网络提取的深层特征携带的语义信息进行了加强学习，分层突出物体的语义信息，在一定程度上减少了漏报和误报。本专利技术的技术方案如下：一种基于Faster-RCNN的加强学习的目标检测方法，该Faster-RCNN包括卷积神经网络、候选区域网络RPN和分类器，方法包括：采集待测图像，将待测图像导入卷积神经网络，卷积神经网络包括M个网络层，卷积神经网络的最后一个尺度的网络结构中包括沙漏...

【技术保护点】
1.一种基于Faster‑RCNN的加强学习的目标检测方法，其特征在于，所述Faster‑RCNN包括卷积神经网络、候选区域网络RPN和分类器，所述方法包括：采集待测图像，将所述待测图像导入所述卷积神经网络，所述卷积神经网络包括M个网络层，所述卷积神经网络的最后一个尺度的网络结构中包括沙漏模块、其余尺度的网络结构中分别包括卷积层和采样层，M为正整数且M≥2；按照从所述M个网络层的最顶层至最底层的顺序通过所述M个网络层依次对所述待测图像进行特征提取，生成所述待测图像的M层特征映射图；将第M层特征映射图导入RPN，通过所述RPN对所述第M层特征映射图中的前景区域和后景区域进行前后景初步分类，并确定所述前景区域的坐标；确定所述第M层特征映射图中与所述前景区域的坐标对应的特征映射块，将所述特征映射块使用金字塔池化的方法向量化，得到用于表征所述特征映射块的特征向量；将所述特征向量输入所述分类器中进行具体分类，确定所述特征向量对应的类别并输出检测结果。

【技术特征摘要】
1.一种基于Faster-RCNN的加强学习的目标检测方法，其特征在于，所述Faster-RCNN包括卷积神经网络、候选区域网络RPN和分类器，所述方法包括：采集待测图像，将所述待测图像导入所述卷积神经网络，所述卷积神经网络包括M个网络层，所述卷积神经网络的最后一个尺度的网络结构中包括沙漏模块、其余尺度的网络结构中分别包括卷积层和采样层，M为正整数且M≥2；按照从所述M个网络层的最顶层至最底层的顺序通过所述M个网络层依次对所述待测图像进行特征提取，生成所述待测图像的M层特征映射图；将第M层特征映射图导入RPN，通过所述RPN对所述第M层特征映射图中的前景区域和后景区域进行前后景初步分类，并确定所述前景区域的坐标；确定所述第M层特征映射图中与所述前景区域的坐标对应的特征映射块，将所述特征映射块使用金字塔池化的方法向量化，得到用于表征所述特征映射块的特征向量；将所述特征向量输入所述分类器中进行具体分类，确定所述特征向量对应的类别并输出检测结果。2.根据权利要求1所述的方法，其特征在于，所述沙漏模块依次包括下采样层、转置卷积层以及像素叠加层，所述下采样层用于对输入所述沙漏模块的张量进行N种不同尺度的下采样并分别生成N个尺度不同的特征映射图，所述转置卷积层用于采用不同尺度的转置卷积对所述N个尺度不同的特征映射图进行转置卷积，并生成与输入的张量尺度相同的N个特征映射图，所述像素叠加层用于对输入的张量以及与所述张量尺度相同的N个特征映射图进行逐像素的叠加并输出，N为正整数且N≥2。3.根据权利要求1或2所述的方法，其特征在于，所述方法还包括：读入Faster-RCNN在ImageNet数据集上的参数，确定所述卷积神经网络除最后一个尺度之外的其余各个尺度的网络结构的基础网络参数为读取到的参数，确定所述卷积神经网络最后一个尺度的网络结构的基础网络参数为所述沙漏模块对应的参数；选取训练样本集，所...

【专利技术属性】
技术研发人员：黄敏，蒋胜，朱启兵，郭亚，
申请(专利权)人：江南大学，
类型：发明
国别省市：江苏,32

全部详细技术资料下载我是这个专利的主人