一种基于卷积神经网络和协方差张量矩阵的降维方法技术

技术编号：18658708 阅读：34 留言：0更新日期：2018-08-11 14:43

本发明专利技术公开了一种基于卷积神经网络和协方差张量矩阵的降维方法，包括以下步骤：首先对原始图像进行基于结构树的边缘检测，从而得到每幅图像的边缘图，然后将边缘图像输入到卷积神经网络对边缘图像提取形状特征；为了丰富图像细节特征，使用卷积神经网络对原始图像进行特征提取；将传统特征提取方法与卷积神经网络特征提取相结合，以得到多种视觉特征。本发明专利技术关注图像目标的形状特征，并使用卷积神经网络来提取图像特征，相比传统的特征提取方法更能丰富直观的表示图像，同时在降低维度的过程中，更加注重多种视觉特征之间的相关性，更能使其作为一个整体来表示图像，更加具有鲁棒性和实用性。

A dimensionality reduction method based on convolution neural network and covariance tensor matrix

The invention discloses a dimension reduction method based on convolution neural network and covariance tensor matrix, which comprises the following steps: firstly, edge detection based on structure tree is carried out on the original image to obtain the edge image of each image, and then the edge image is input to convolution neural network to extract shape features of the edge image; In order to enrich the image details, convolution neural network is used to extract the original image features, and traditional feature extraction methods are combined with convolution neural network feature extraction to obtain a variety of visual features. The invention pays attention to the shape features of image objects and extracts image features by convolution neural network. Compared with the traditional feature extraction method, the method can enrich and intuitively represent the image. At the same time, in the process of reducing the dimension, it pays more attention to the correlation between various visual features, and can make it represent the image as a whole. It is more robust and practical.

全部详细技术资料下载

【技术实现步骤摘要】
一种基于卷积神经网络和协方差张量矩阵的降维方法
本专利技术涉及模式识别与机器学习领域，更具体地涉及一种基于卷积神经网络和协方差张量矩阵的降维方法，属于数据降维

技术介绍
在大数据时代,人们收集和获得数据的能力越来越强。大数据正在以各种形式渗透到当今世界的各个领域，例如生物基因功能组信息,文本分类以及图片多媒体等领域，而这些数据已呈现出数据量大、维数高，异构、分散以及结构复杂等特性，数据的海量性将造成存储开销大、检索速度慢等问题；而数据的高维性将造成维度灾难问题，膨胀的维数导致计算量迅速上升；复杂几何结构造成难于观测的状况。如何处理呈指数爆炸式增长的大数据使其可以以最小的硬件和软件代价存储和管理成为最具有挑战性的课题之一。数据降维，是把数据从高维的空间映射到低维的空间，最好的保持数据的结构和紧致性，提取出数据中的真正有用信息，同时去除数据的冗余信息，从而获取高维数据低维表示。一方面可以解决“维数灾难”，缓解“噪声丰富”现状，降低复杂度；另一方面可以更好地处理存储数据。因此，各种降维算法受到研究者的广泛关注，研究者们迫切找到合适的降维方法解决存储量大和运算复杂度高等问题，然而现存的降维方法仍然存在一些问题：(1)在处理图像时，形状是一个确认图像目标的重要线索，而大多数降维方法在处理图像数据时往往忽略图像中目标的形状特征；(2)只着眼于图像的某一类型的特征，而忽略了其它方面的特征，造成无法丰富全面的表述图像，无法将多种视觉特征作为一个整体去表示图像数据。
技术实现思路
本专利技术的目的提出了一种基于卷积神经网络和协方差张量矩阵的降维方法，以解决上述提出的问...

【技术保护点】
1.一种基于卷积神经网络和协方差张量矩阵的降维方法，其特征在于，该方法包括如下步骤：(1)首先，将图像I＝{I1,...Ii...,IN},i＝1,...,N中每一幅图像Ii分成大小为32×32的M个重叠小块，对于每一幅图像，定义它的标签为

【技术特征摘要】
1.一种基于卷积神经网络和协方差张量矩阵的降维方法，其特征在于，该方法包括如下步骤：(1)首先，将图像I＝{I1,...Ii...,IN},i＝1,...,N中每一幅图像Ii分成大小为32×32的M个重叠小块，对于每一幅图像，定义它的标签为将标签Y映射到另一个空间Z，即得到每个像素点的值，并求得每对像素点之间的距离值，是一个dz维的向量；利用分离函数h(x)，其中x为像素点的值或者是距离值，该分离函数输出的值是否大于阈值α将像素点归到左枝叶或右枝叶来判断此像素点是否为边缘或是否相似；然后将每个重叠小块的结果映射到原图像从而得到原图像I＝{I1,...Ii...,IN},i＝1,...,N的边缘图像E＝{E1,...,Ei,...EN},i＝1,...,N；(2)将边缘图像Ei通过降采样得到卷积神经网络规定的大小的图像Ei′，将Ei′输入到网络中，通过卷积、池化得到第七层全连接层的输出，作为该边缘图像的边缘特征(3)然后将原始图像Ii经过降采样得到卷积神经网络规定的大小的图像Ii′，将Ii′输入到网络中，通过卷积、池化得到第七层全连接层的输出，作为该原图像细节特征(4)在原始图像Ii上提取全局特征，通过a×a的网格把图像划分成大小相等的子区域，每个子区域用υ个尺度α个方向的Gabor滤波器进行滤波处理，所有子区域的特征串接得到整幅图像目标描述子(5)对于得到的多种视觉特征首先求得各类视觉特征的协方差矩阵对同一样本的各类视觉特征进行张量计算，从而得到所有样本的最后的协方差张量矩阵通过多种视觉特征F的协方差张量矩阵T和协方差矩阵V我们得到多种视觉特征的张量矩阵(6)通过分解张量矩阵得到转换矩阵将原始的多种视觉特征与转换矩阵相乘，即得到降维后的结果r是降维的维数。2.如权利要求1所述的降维方法，其特征在于，所述步骤(2)中边缘检测方法具体包括以下：对数据集中的每一幅图像I＝{I1,...Ii,...IN}，i＝1,...,N进行基于结构树的快速边缘检测，从而得到每一幅图像Ii的边缘图像E＝{E1,...,Ei,...,EN}，i＝1,...,N，首先将彩色图像重叠分割成M个32×32大小的图像块pi，0<i≤M，对每个图像块pi计算在CIE-LUV颜色空间中的3个颜色通道和两个尺度归一化的梯度幅值，将每个梯度幅值通道分成基于方向的4个通道，这样每个图像块p就得到3个颜色通道，2个幅值通道，8个方向通道，总共13个通道；使用半径为2的三角型滤波器对每个图像块pi进行模糊，并且使用因数2对每个图像块pi进行降采样，最后形成32×32×13/4＝3328个像素值；另外对每个通道使用半径为8的三角形滤波器进行模糊，并且降采样到5×5大小，则每个通道产生的像素对数为300个，计算每个像素对的欧氏距离，则产生3900个距离值，将像素值和距离值定义为候选特征xi，0<i≤dz＝7228；下面将决策树应用于结构输出空间0<j≤32，其中表示相应的第i图像块的图像注释，即像素值，i′,j表示像素的位置；定义一个映射函数，∏:Y→Z将结构输出空间Y映射到一个中间空间Z，在这个空间中距离是容易测量的，其中即上一步所求得的候选特征值xi，我们使用PCA量化对候选特征值xi进行聚类，聚成k＝2类，...

【专利技术属性】
技术研发人员：年睿，耿月，
申请(专利权)人：中国海洋大学，
类型：发明
国别省市：山东,37

全部详细技术资料下载我是这个专利的主人