【技术实现步骤摘要】
一种基于二值化FasterRCNN网络的行人检测方法
本专利技术涉及图像识别
,尤其是一种基于二值化FasterRCNN网络的行人检测方法。
技术介绍
随着人工智能的高速发展,现如今深度学习技术深入计算机视觉的各个方面,各种不同思路的新方法广泛应用于各个场景中,解决传统方法存在的弊端,性能各个方面超越了传统方法。行人检测是计算机视觉的重要应用之一,目前已广泛应用于各个场景,如摄像头监控技术、汽车高级辅助驾驶技术等。传统行人检测着重于特征提取、分类与定位两个问题。行人特征一般分为低层特征、基于学习的特征和混合特征,分类与定位方法分为滑动窗口法、超越滑动窗口法。这些方法均存在实用性低、效果差、准确率不高的问题。FasterRCNN目标检测算法主要流程分为基于深度卷积网络的特征提取部分、候选区域生成网络部分、候选窗口分类和微调部分、非极大值抑制部分。FasterRCNN网络虽然在行人检测上取得了不错的效果,但是因为该网络具有较多的学习参数,因此目前来说仅限于服务器上运行,利用GPU进行结果测试,在嵌入式设备上 ...
【技术保护点】
1.一种基于二值化Faster RCNN网络的行人检测方法,先构建并训练网络模型,然后通过训练好的网络模型对公路车道进行检测,其特征在于,网络模型构建和训练主要包括以下步骤:/n步骤1,收集大量汽车行驶过程中行车记录仪拍摄到的包含行人的图片,方框标记出图片中行人部分,构成包含行人的数据集,将数据集从数量上分为训练集、验证集和测试集三部分;/n步骤2,构建Faster RCNN网络,并对其进行二值化,形成二值化Faster RCNN网络,Faster RCNN网络主要由VGG16网络层、RPN网络层和ROI池化层组成;二值化操作具体为,将VGG网络层的权重利用符号函数二值化, ...
【技术特征摘要】
1.一种基于二值化FasterRCNN网络的行人检测方法,先构建并训练网络模型,然后通过训练好的网络模型对公路车道进行检测,其特征在于,网络模型构建和训练主要包括以下步骤:
步骤1,收集大量汽车行驶过程中行车记录仪拍摄到的包含行人的图片,方框标记出图片中行人部分,构成包含行人的数据集,将数据集从数量上分为训练集、验证集和测试集三部分;
步骤2,构建FasterRCNN网络,并对其进行二值化,形成二值化FasterRCNN网络,FasterRCNN网络主要由VGG16网络层、RPN网络层和ROI池化层组成;二值化操作具体为,将VGG网络层的权重利用符号函数二值化,激活函数采用HardSigmoid函数,卷积操作为其中I表示输入矩阵,W表示未二值化的权重,K和α为调整参数;层叠模式改为批标准化→二值化激活→二值化卷积→池化;
步骤3,利用训练集对二值化FasterRCNN网络进行训练,具体为,权重初始化为浮点,前向传播过程中利用通过符号函数将权重量化为+1/-1,由二值权重与二值输入进行卷积运算,获得卷积层输出;在反向传播过程中,放松符号函数,计算相应梯度值,并根据梯度值对权重进行参数更新,参数更新完成后再权重量化为+1/-1,以便后期推断使用;
步骤4,将测试集输入训练好的二值化FasterRCNN网络,获得行人预测框,采用非极大值抑制法,对行人预测框进行进一步筛...
【专利技术属性】
技术研发人员:张中,张莉蓉,
申请(专利权)人:合肥湛达智能科技有限公司,
类型:发明
国别省市:安徽;34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。