基于光场相机和深度学习的行人识别方法技术

技术编号：23470991 阅读：37 留言：0更新日期：2020-03-06 12:56

一种基于光场相机和深度学习技术的行人识别方法，包括如下步骤：①利用光场相机获取多幅行人图像；②利用Lytro desktop软件将步骤①获得的原始行人图像进行处理，得到彩色行人图像和深度行人图像；③将步骤②得到的彩色图像和深度图像进行预处理并归于化为统一尺寸，并将图像分为正负样本，得到光场图像数据集；④基于深度学习进行模型的初始化；⑤构建彩色图像和深度图像的联合卷积特征；⑥利用④中的方法，利用已有的在ImageNet数据集上训练好的ResNet50图像分类模型，利用该模型参数提取训练样本的卷积特征；⑦根据⑥中得到的特征进行神经网络的反复训练，得到一个新的分类模型。使用该方法可有效地提高行人检测方法的准确率和鲁棒性。

Pedestrian recognition method based on light field camera and depth learning

全部详细技术资料下载

【技术实现步骤摘要】
基于光场相机和深度学习的行人识别方法
本专利技术属于计算机视觉领域，特别涉及一种基于光场相机和深度学习的行人识别方法。
技术介绍
行人识别是计算机视觉研究领域的一个重要部分，在智能交通、视频监控、人工智能以及自动驾驶等领域都起到了十分重要的应用。近年来，基于计算机硬件设备和新的拍照技术的快速发展，工业界对行人识别的性能和准确度提出了更加苛刻的要求。由于自动驾驶技术近年来的蓬勃发展，使得对于行人的识别的准确率尤为重要。由于行人具有刚性物体和非刚性物体的特性，如行人拍摄角度的多变性，光照以及遮挡等因素的存在以及在交通标志牌、街景广告标识牌中有大量人体的出现，行人的误检一直是影响行人检测性能的关键问题。因此，近年来，科研人员在行人特征的获取和检测方法优化方面开展了大量工作，综合运用多传感器的方法提取行人特征，从而降低误检率，提高行人检测率。吴义仁在美国斯坦福大学汉拉恩教授的实验室，与其他研究员创制“光场相机”。据了解，“光场相机”机身和一般数码相机差不多，但内部结构大有不同。一般相机以主镜头捕捉光线，再聚焦在镜头后的胶片或感光器上，所有光线的总和形成相片上的小点，显示影像。这部特制相机置于主镜头及感光器之间，有一个布满9万个微型镜片的显微镜阵列，每个小镜阵列接收由主镜颈而来的光线后，传送到感光器前，析出聚焦光线及将光线资料转换，以数码方式记下。相机内置软件操作“已扩大光场”，追踪每条光线在不同距离的影像上的落点，经数码重新对焦后，便能拍出完美照片。而且，“光场相机”一反传统，减低镜头孔径大小及景深，

【技术保护点】
1.一种基于光场相机和深度学习技术的行人识别方法，其特征在于：包括如下步骤：/n①利用光场相机获取多幅行人图像；/n②利用Lytro desktop软件将步骤①获得的原始行人图像进行处理，得到彩色行人图像和深度行人图像；/n③将步骤②得到的彩色图像和深度图像进行预处理并归于化为统一尺寸，并将图像分为正负样本，得到光场图像数据集；/n④基于深度学习进行模型的初始化：基于深度学习采用冻结所有卷积层模型参数，并在此基础上将原始图像经过所有卷积层进行卷积操作得到卷积特征，在此基础上继续训练；/n⑤构建彩色图像和深度图像的联合卷积特征：将①中彩色行人图像和深度行人图像分别经过④中的神经网络处理之后得到融合的卷积特征；/n⑥利用④中的方法，利用已有的在ImageNet数据集上训练好的ResNet50图像分类模型，利用该模型参数提取训练样本的卷积特征；/n⑦根据⑥中得到的特征进行神经网络的反复训练，得到一个新的分类模型。/n

【技术特征摘要】
1.一种基于光场相机和深度学习技术的行人识别方法，其特征在于：包括如下步骤：
①利用光场相机获取多幅行人图像；
②利用Lytrodesktop软件将步骤①获得的原始行人图像进行处理，得到彩色行人图像和深度行人图像；
③将步骤②得到的彩色图像和深度图像进行预处理并归于化为统一尺寸，并将图像分为正负样本，得到光场图像数据集；
④基于深度学习进行模型的初始化：基于深度学习采用冻结所有卷积层模型参数，并在此基础上将原始图像经过所有卷积层进行卷积操作得到卷积特征，在此基础...

【专利技术属性】
技术研发人员：石凡，赵宇峰，赵萌，贾晨，栾昊，陈胜勇，冯洋博，
申请(专利权)人：天津理工大学，
类型：发明
国别省市：天津;12

全部详细技术资料下载我是这个专利的主人