The invention discloses a parallel multi-channel convolution neural network, a construction method and an image feature extraction method, which relate to the machine learning technology field. Because of the wide use of Kinect and other depth sensors, multi-modal image acquisition will be more convenient. Therefore, the research of feature extraction based on multi-modal image information is of great significance. Firstly, the sub modal convolution neural network model is established for each channel of the multi-modal image, and each modal depth feature vector is extracted. In order to obtain multi-modal image features with uniform properties, each mode sub network establishes weight connections at specific fully connected layers. In the full connection part of the multi-layer subnetwork, the multi-modal depth feature vectors are fused into the fusion feature vectors containing each modal information according to the weight ratio, and then the multi-layer network is trained to get the lower dimension and better expressive features. The characteristic expression obtained according to the invention can be used for identification, classification and other related fields.
【技术实现步骤摘要】
平行多通道卷积神经网络、构建方法及图像特征提取方法
本专利技术属于机器学习领域,更具体地,涉及一种平行多通道卷积神经网络及其构建方法以及基于平行多通道卷积神经网络的多模态图像特征提取方法。
技术介绍
计算机视觉和图像处理领域中,我们通过测量可以得到识别或分类对象的原始表征信息。这种原始表征信息可以通过直接测量得到,所以被称为原始特征,如数字图像中每点的灰度值。原始特征易于被人的直觉所感知,但不常用于模式识别中。其原因主要包括三点:一是原始特征不能反映对象的本质特征;二是原始特征有时难以定量描述,不利于机器判别;三是高维的原始特征有大量的冗余信息,且对于有限的训练样本而言,高维特征在原始特征空间中分布十分稀疏。这三个原因导致基于原始特征设计的分类器计算量庞大且精度过低。针对原始特征的特性与不足,我们通常需要对测量得到的原始特征进行分析、选择和变换处理,组成更有效的特征表示。针对原始数据集进行特征提取的方案设计成为计算机视觉领域中十分重要的问题。在早期的识别、分类等领域的计算机视觉方案中,特征提取主要基于彩色图像进行。彩色图像通过单摄像机采集得到,通过一系列的图像处理技术得到最终的特征表示。但是基于RGB彩色图像提取的特征表示在真实应用中,普遍受到环境光照、背景复杂度等因素的制约,使得设计相关分类器的难度提高,精度也无法得到保证。近年来,随着Kinect等深度摄像机的出现,为上述问题提供了新的解决思路。Kinect传感器能够在获取纹理信息的同时捕捉得到场景的深度信息,即可获取三维空间信息。获取得到的场景深度信息以深度图像的形式给出。结合深度信息的特征提取方案可 ...
【技术保护点】
1.一种平行多通道卷积神经网络的构建方法,其特征在于,包括:对于预设多模态数据库中的各模态图像,构建与各模态图像对应的子模态卷积神经网络模型,并通过各子模态卷积神经网络模型提取各模态图像对应的深度特征向量;在每个子模态卷积神经网络模型的目标全连接层,将各子模态卷积神经网络模型所提取的深度特征向量进行连接并分配连接权重系数得到包含各模态图像信息的融合特征向量,以构建初始平行多通道卷积神经网络模型;将训练数据集送入所述初始平行多通道卷积神经网络模型中,对所述初始平行多通道卷积神经网络模型中的训练参数进行初次优化训练;将验证数据集送入初次优化训练后的平行多通道卷积神经网络模型中进行效果评估,并进行最终优化得到目标平行多通道卷积神经网络模型,其中,所述预设多模态数据库中包括所述训练数据集与所述验证数据集。
【技术特征摘要】
1.一种平行多通道卷积神经网络的构建方法,其特征在于,包括:对于预设多模态数据库中的各模态图像,构建与各模态图像对应的子模态卷积神经网络模型,并通过各子模态卷积神经网络模型提取各模态图像对应的深度特征向量;在每个子模态卷积神经网络模型的目标全连接层,将各子模态卷积神经网络模型所提取的深度特征向量进行连接并分配连接权重系数得到包含各模态图像信息的融合特征向量,以构建初始平行多通道卷积神经网络模型;将训练数据集送入所述初始平行多通道卷积神经网络模型中,对所述初始平行多通道卷积神经网络模型中的训练参数进行初次优化训练;将验证数据集送入初次优化训练后的平行多通道卷积神经网络模型中进行效果评估,并进行最终优化得到目标平行多通道卷积神经网络模型,其中,所述预设多模态数据库中包括所述训练数据集与所述验证数据集。2.根据权利要求1所述的方法,其特征在于,在所述将训练数据集送入所述初始平行多通道卷积神经网络模型中,对所述初始平行多通道卷积神经网络模型中的训练参数进行初次优化训练之前,所述方法还包括:将所述预设多模态数据库中的若干个训练数据送入到栈式自编码网络中,预训练得到所述初始平行多通道卷积神经网络模型的全连接层的每一层网络参数的初始值。3.根据权利要求2所述的方法,其特征在于,所述预训练得到所述初始平行多通道卷积神经网络模型的全连接层的每一层网络参数的初始值,包括:第i个稀疏自编码器的输入层参数为第i-1个稀疏自编码器的隐含层特征向量,训练得到所述第i个稀疏自编码器的隐含层特征向量,并确定所述第i个稀疏自编码器的隐含层参数,其中,稀疏自编码器的个数与所述初始平行多通道卷积神经网...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。