System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及多视角数据分类领域,特别涉及一种基于典型相关分析快速算法的多视角数据分类方法和系统。本专利技术可应用于文本、图像等多视角数据分类领域。
技术介绍
1、随着信息技术以及传感器技术的发展,通过不同传感器可以获取到一个样本的不同特征,多视角数据分类成为机器学习领域的一大热点问题。大量研究表明,单一视角特征在一些应用上不如多特征组合提取的信息完整,深入挖掘多个视角特征间的潜在信息,通过视角特征间的互相促进,可以更全面的获取样本的信息。多视角数据分类的主要任务是根据提取的同一目标样本的不同视角特征,将其和数据库中的目标进行对比,确定待识别的目标。目前,对目标进行多视角数据分类的方法为基于特征提取的方法。
2、基于特征提取的多视角数据分类方法需要对目标进行特征提取和选择,特征降维是特征选择的一种表现形式。多视角特征情况下,需要将特征两两组合,经典的两两组合特征的分析方法为典型相关分析(canonical correlation analysis,cca)。该方法首先由hotelling提出,到目前为止,学者们已经提出了许多与cca的变体,以适应不同的实际应用。
3、现有多视角数据分类技术存在的问题及缺陷为:
4、1.大多方法基于矩阵典型相关分析,得不到整体数据的相关性,因此无法获得数据内在结构信息,导致信息提取不充分,图像、文本分类正确率并不高。
5、2.现有的张量典型相关分析虽然能够得到整体数据的相关性,但其计算速度较慢。现有的张量典型相关分析主要通过张量分解变换,如cp分解或
6、3.真实数据集不仅仅存在线性相关关系,可能存在非线性相关性,因此需要在现有的方法中加入深度网络,对数据进行预处理将数据扩展到非线性空间中。
技术实现思路
1、针对现有技术中的部分或全部问题,本专利技术提供一种基于典型相关分析快速算法的多视角数据分类方法,该方法包括以下步骤:
2、在数据输入模块中输入多视角数据,进行预处理,存储于数据库中;
3、提取数据库中的数据,在数据计算模块中计算相似度矩阵和协方差张量;以及
4、将所述相似度矩阵和协方差张量输入结果产出模块,在结果产出模块中计算特征提取后的矩阵,并对矩阵进行分类。
5、进一步地,所述预处理为利用自编码器对多视角数据进行预处理,将其扩展到非线性空间。
6、进一步地,构建协方差张量,得到多视角数据整体相关性。
7、构造多视角数据集xp的k近邻图gp=(v,e;w),
8、其中权重矩阵wp∈rn×n,rn×n是实数空间中n×n矩阵,顶点集合矩阵vp是第p视角xi的节点vi,e是边节点集合,eij是节点vi与节点vj的连接边。
9、所述协方差张量利用以下公式计算:
10、
11、其中,n表示多视角数据集样本数量,表示第m视角的第n列数据,表示外积计算。
12、进一步地,对多视角数据计算拉普拉斯正则项,得到相似度矩阵。
13、定义hp为典型相关变量,zp表示经cca处理后的变量,t表示转置操作,拉普拉斯矩阵为l=sp-wp,spii=∑jwij,为相关系数张量,
14、
15、其中,m表示训练样本的类别总数,c12...m表示协方差张量,corr表示相关系数的计算,ε表示全1的张量,×m表示张量mode-m积,是张量的一种积的计算符号,表示维度r×r×…r的实数空间。
16、所述拉普拉斯正则项为,
17、
18、其中,表示经cca处理后的第k步第p视角数据,t表示转置操作,lp表示第p视角的拉普拉斯矩阵。
19、所述相似度矩阵s利用以下公式计算:
20、
21、其中,c表示类数。
22、进一步地,通过交替半光滑牛顿算法快速计算,得到特征提取后的矩阵。
23、进一步地,由下列方法求解得到特征提取后的矩阵。
24、首先写出问题的临近算子迭代步并计算问题最优解:
25、
26、其中,表示求最小值,表示相关系数张量f范数的表示拉普拉斯正则项,表示hp的第k步的l2,1范数,表示两项的内积,表示两个矩阵相减的f范数的平方。
27、其中,定义函数
28、令下降方向求得模型的具体解:
29、
30、其中λp表示拉格朗日算子,表示b(λp)的l_(2,1)范数的proximal算子,yp表示第p视角的增广变量,表示hp的第k步。
31、
32、由模型中的约束可得,
33、
34、令其为q算子,根据半光滑牛顿算法,只需计算出q算子的jacobian矩阵即可,具体为:
35、
36、其中矩阵ξp为:
37、
38、最后写出具体迭代公式:
39、
40、其中表示的向量,表示的向量,dk表示步长。
41、相比较于admm等一阶算法,牛顿方法能够对步长进行修正,使得目标函数得到充分下降,进而在迭代次数尽可能少的情况下找到目标函数的最小值。
42、对流形上的做retraction操作,最后得到解为
43、
44、其中,retraction操作为常用的qr分解。
45、特征提取后的矩阵变量zp为,
46、xp表示多视角数据集,t表示转置操作,hp为所述最后得到的解,*表示相乘操作。
47、进一步地,所述对矩阵进行分类为经前面所述的分类方法处理后,将得到的特征提取后的矩阵输入knn分类器,得到分类结果。
48、本专利技术还提供一种基于典型相关分析快速算法的多视角数据分类系统,该系统包括以下模块:
49、数据输入模块,用于输入多视角数据,利用自编码器对多视角数据进行预处理;
50、数据计算模块,用于计算预处理后的数据的相似度矩阵和协方差张量;以及
51、结果产出模块,用于计算得出特征提取后的矩阵,并对矩阵进行分类。
52、本专利技术还提供一种计算机系统,包括:
53、处理器,其被配置为执行机器可读指令;以及
54、存储器,其被存储有机器可读指令,所述机器可读指令在被处理器执行时执行所述的分类方法的步骤。
55、本专利技术还提供一种计算机可读存储介质,其上存储有机器可读指令,所述机器可读指令在被处理器执行时执行所述的分类方法的步骤。
56、与现有技术相比,本专利技术具有以下优点:
57、1.运用自编码器,将多视角数据扩展到非线性空间,挖掘出数据中的非线性关系,更好的提取多视角数据非线性特征,有利于后续多视角数据分类准确率的提高。
58、2.运用张量本文档来自技高网...
【技术保护点】
1.一种基于典型相关分析快速算法的多视角数据分类方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的基于典型相关分析快速算法的多视角数据分类方法,其特征在于,所述预处理为利用自编码器对多视角数据集进行预处理,将其扩展到非线性空间。
3.根据权利要求1所述的基于典型相关分析快速算法的多视角数据分类方法,其特征在于,构建协方差张量,得到多视角数据整体相关性;
4.根据权利要求1所述的基于典型相关分析快速算法的多视角数据分类方法,其特征在于,对多视角数据计算拉普拉斯正则项,得到相似度矩阵;
5.根据权利要求1所述的基于典型相关分析快速算法的多视角数据分类方法,其特征在于,通过交替半光滑牛顿算法快速计算,得到特征提取后的矩阵。
6.根据权利要求5所述的分类方法,其特征在于,由下列方法求解得到特征提取后的矩阵:
7.根据权利要求1-6所述的基于典型相关分析快速算法的多视角数据分类方法,其特征在于,所述对矩阵进行分类为经所述权利要求2-6的方法处理后,将得到的特征提取后的矩阵输入KNN分类器,得到分类结果。
...【技术特征摘要】
1.一种基于典型相关分析快速算法的多视角数据分类方法,其特征在于,包括如下步骤:
2.根据权利要求1所述的基于典型相关分析快速算法的多视角数据分类方法,其特征在于,所述预处理为利用自编码器对多视角数据集进行预处理,将其扩展到非线性空间。
3.根据权利要求1所述的基于典型相关分析快速算法的多视角数据分类方法,其特征在于,构建协方差张量,得到多视角数据整体相关性;
4.根据权利要求1所述的基于典型相关分析快速算法的多视角数据分类方法,其特征在于,对多视角数据计算拉普拉斯正则项,得到相似度矩阵;
5.根据权利要求1所述的基于典型相关分析快速算法的多视角数据分类方法,其特征在于,通过交替半光滑牛顿...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。