【技术实现步骤摘要】
基于迁移学习和宽度学习的RGB
‑
D图像特征协同融合方法
[0001]本专利技术涉及计算机视觉及图像处理技术,尤其涉及一种基于迁移学习和宽度学习的RGB
‑
D图像特征协同融合方法。
技术介绍
[0002]计算机视觉是指用摄影机和电脑代替人眼对目标进行识别、跟踪和测量等的机器视觉,并进一步做图形处理,进行目标的分类识别、位姿判断和尺寸测量等。随着技术的不断发展,计算机视觉的研究也取得了突破性的进展。其中图像的分类识别是计算机视觉中最基础也是最重要的分支,对多媒体检索技术的发展有重要的推动作用。近年来越来越多的研究工作设计了大量的深度卷积神经网络用于RGB图像识别取得了很大的进展,已经广泛应用于交通监控、智能安防、智能机器人以及零部件自动化装配回等各行各业中。
[0003]但是在实际应用中,由于RGB图像自身的局限性,在实际应用的过程中容易受到光照背景,目标之间相互遮挡、重叠等因素的影响,存在目标识别率较低、无法正确分类的情况,无法满足实际应用中的需求。随着传感器技术的发展,出现了能够 ...
【技术保护点】
【技术特征摘要】
1.基于迁移学习和宽度学习的RGB
‑
D图像特征协同融合方法,其特征在于,包括以下步骤:S1:从公开数据集中获取RGB
‑
D数据集;S2:搭建ResNet神经网络,在数据集ImageNet上进行初步训练,得到初次训练的ResNet神经网络,并进行保存;S3:将初步训练得到的ResNet神经网络,在RGB
‑
D数据集上进行微调,移除神经网络ResNet最后一层,输入数据后,RGB图像和深度图像分别在网络中输出一个特征向量,得到两种图像的特征;S4:基于步骤中S3中的RGB图像和深度图像两种特征向量,分别作为典型相关性分析CCA层输入的两组没有显性相关关系的变量,最大化两组变量之间的相关系数,将两组变量统一映射到CCA生成的特征空间上进行学习,根据CCA特征融合策略,将并联矩阵作为融合特征,实现特征的融合降维;S5:基于步骤中S4中的融合特征,利用宽度学习生成特征节点和增强节点,利用岭回归的广义逆得到最终分类识别结果。2.根据权利要求1所述的基于迁移学习和宽度学习的RGB
‑
D图像特征协同融合方法,其特征在于,步骤S1中,所述获取RGB
‑
D数据,具体过程为:将每个物体放置在一个转盘上,并使用3D相机对转盘的一个完整旋转周期进行录制,每个物体均包含3个视频序列,分别记录在不同高度的摄像机上,由此可以得到不同视角、不同光照条件下的RGB图像和深度图像,组成数据集。3.根据权利要求2所述的基于迁移学习和宽度学习的RGB
‑
D图像特征协同融合方法,其特征在于,步骤S2中,所述神经网络ResNet是由残差块组成的模块,每个模块使用若干个同样输出通道数的残差块组成,构建过程为:采用PyTorch框架构建神经网络ResNet。4.根据权利要求3所述的基于迁移学习和宽度学习的RGB
‑
D图像特征协同融合方法,其特征在于,步骤S2中,所述初步训练,具体过程为:加载在数据集ImageN...
【专利技术属性】
技术研发人员:李鹏越,胡东玫,邢吉伟,续欣莹,
申请(专利权)人:太原理工大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。