基于低秩核心矩阵的改进稳健张量主成分分析方法技术

技术编号:18895626 阅读:66 留言:0更新日期:2018-09-08 11:29
本发明专利技术公开了一种基于低秩核心矩阵的改进稳健张量主成分分析方法,属于数据处理技术领域。本发利用低秩核心矩阵近似来改进现有的稳健主成分分析技术,首先对待处理的张量进行张量奇异值分解,然后利用分解得到的f‑对角张量的低秩结构,本发明专利技术定义了一个改进的张量核范数,与已有的张量核范数相比,其增加了一项由f‑对角张量构造的核心矩阵的核范数。即本发明专利技术中的张量核范数项可以在第一和第二模式中提取低秩张量成分,而另一项则使用核心矩阵的核范数来处理第三模式下的低秩张量成分。本发明专利技术可用于图像处理,为图像处理提供了一种高效的稳健张量主成分分析方法。

Improved robust tensor principal component analysis based on low rank kernel matrix

The invention discloses an improved robust tensor principal component analysis method based on low rank core matrix, belonging to the technical field of data processing. In this paper, the low-rank kernel matrix approximation is used to improve the existing robust principal component analysis techniques. First, tensor singular value decomposition is performed on the tensor to be processed, and then the low-rank structure of the decomposed f_diagonal tensor is used. An improved tensor kernel norm is defined, which is increased compared with the existing tensor kernel norm. A kernel norm of the core matrix constructed by the f diagonal tensor. The tensor kernel norm term in the present invention can extract low rank tensor components in the first and second modes, while the other one uses the kernel norm of the core matrix to process low rank tensor components in the third mode. The invention can be used for image processing and provides an efficient robust tensor principal component analysis method for image processing.

【技术实现步骤摘要】
基于低秩核心矩阵的改进稳健张量主成分分析方法
本专利技术涉及数据处理领域,尤其涉及一种改进的张量低秩分解方法。
技术介绍
张量是多维数据,它是向量和矩阵数据的高阶泛化。基于张量数据的信号处理在广泛的应用中发挥了重要作用,如推荐系统,数据挖掘,图像/视频去噪和修复等。然而,许多数据处理方法仅仅针对二维数据开发。将这些有效的方法扩展到张量领域已变得越来越重要。稳健主成分分析(RPCA)是经典主成分分析(PCA)的衍生,其已经被广泛应用于许多数据处理问题。在RPCA方法中,通过将一个矩阵X分解成一个低秩成分L和一个稀疏成分E,L和E可以很高概率地通过解决以下凸问题恢复出来:minL,E‖L‖*+λ‖E‖1,s.t.X=L+E(1)其中‖L‖*表示矩阵核范数,定义为矩阵L的奇异值之和;‖E‖1表示矩阵E的l1范数,定义为矩阵E的所有元素的绝对值之和。RPCA已被应用于图像处理领域,包括背景建模、批处理图像对齐方式、人脸去阴影等。它仅仅能处理矩阵数据,而一些现实世界的图像数据是以多维形式存在的,如RGB彩色图像、视频、高光谱图像和磁共振图像等。张量数据的矩阵化并不是充分利用多维数据的结构信息。为解决这一问题,稳健张量主成分分析(RTPCA)方法被提出。给定一个张量其中表示实数域,上标为维度信息,即N1,N2,N3分别表示张量的第一,第二和第三维度,张量可以被分解为低秩成分和稀疏成分,可以表示如下:其中表示低秩成分,ε0表示稀疏成分。张量秩是RTPCA的重要特征之一,张量分解的不同框架有不同的张量秩的定义。例如,典范因子分解(CPD)将一个张量分解成若干个秩为1的张量因子的总和,而因子的最小数量被称为CP秩。CPD具有不适定性,并且存在计算问题。在Tucker分解中,一个张量被分解成一个核心张量在每个模式下乘以一个因子矩阵。Tucker秩由因子矩阵的秩组成。一个张量的管秩被定义为在张量奇异值分解(t-SVD)中,其f-对角张量(张量的每个正面切片都是一个对角矩阵)的非零奇异的管纤维的数目。t-SVD框架不同于传统的张量分解的代数框架,它以循环代数和傅里叶变换(FT)为基础。这个分解的结构类似于矩阵数据中的奇异值分解(SVD)。图1展示了t-SVD分解示意图,给定一个张量其t-SVD分解为:首先对待分解的张量沿着第三个维度([],3)做快速傅里叶变换,再分别对得到的张量的各个正面切片进行矩阵的SVD分解,每个正面切片的SVD分解都将得到两个酉矩阵和一个对角矩阵,基于所有正面切片的分解结果,得到傅里叶域的张量奇异值分解结果和其中为傅里叶域的酉矩阵,为傅里叶域的对角矩阵(f-对角张量);最后,分别对和进行反傅里叶变换,得到张量的张量奇异值分解结果即其中和分别为大小N1×N1×N3和N2×N2×N3的正交张量,是一个大小为N1×N2×N3的f-对角张量,称为核心张量。基于t-SVD,RTPCA可以被转化为有不同的稀疏模式的不同的凸优化模型,比如SNN(SumofNuclearNorms)和RTPCA模型等,这些模型主要是根据不同的应用使用不同的稀疏约束。然而,基于t-SVD的低秩张量模型并不能充分利用数据的低秩结构。因此,有必要对传统的基于t-SVD的RTPCA方法进行改进。
技术实现思路
本专利技术的专利技术目的在于:针对上述存在的问题,提供一种基于低秩核心矩阵的改进稳健张量主成分分析方法。本专利技术基于核心张量的正面切片的对角元素构造核心矩阵的低秩近似,通过增加核心矩阵的另一个核范数来进一步提取第三模式的主成分,从而改进了传统的张量核范数,以更加充分的利用多维数据结构信息。本专利技术的基于低秩核心矩阵的改进稳健张量主成分分析方法,包括下列步骤步骤S1:初始化低秩成分稀疏成分ε、对偶变量拉格朗日惩罚算子ρ、收敛阈值∈,参数λ、λ1和更新率α1、α2;其中参数λ、λ1的初始值分别为:步骤S2:对待主成分分析的张量其中表示实数域,上标为维度信息;对张量进行张量奇异值分解,得到正交张量和以及核心张量其中和构造核心矩阵其中算子表示基于核心张量的正面切片的对角元素构造核心矩阵,核心矩阵的列数为N,行数为N3;步骤S3:对低秩成分稀疏成分ε进行迭代更新处理:基于S2中分解得到的正交张量和根据计算中间张量其中算子为算子的逆操作,表示核心矩阵的奇异值阈值算子;更新低秩成分为:其中,表示张量的张量奇异值阈值算子;更新稀疏成分ε为:其中表示张量的软阈值算子;步骤S4:判断是否满足迭代更新收敛条件,若是,则输出迭代更新后的低秩成分和稀疏成分ε;否则,更新对偶变量参数λ1和拉格朗日惩罚算子ρ后,返回步骤S2;其中对偶变量参数λ1和拉格朗日惩罚算子ρ的更新方式为:λ1=α1×λ1,ρ=α2×ρ;所述迭代更新收敛条件为其中表示迭代更新后的低秩成分,表示迭代更新前的低秩成分。综上所述,由于采用了上述技术方案,本专利技术的有益效果是:与现有的主成分分析方法相比,其处理效率和准确性更好。附图说明图1是张量奇异值分解(t-SVD)的分解示意图;图2是核心张量与核核心矩阵的转换示意图;图3是实施例中,采用本专利技术的IRTPCA和现有的PRCA方法对室内视频的背景建模处理结果对比图,其中第(a)列为原始图,第(b)、(c)列为现有的PRCA方法获得的低秩背景成分和稀疏前景成分的分解示意图;第(d)、(e)列为本专利技术的IRTPCA方法获得的低秩背景成分和稀疏前景成分的分解示意图;图4是实施例中,采用本专利技术的IRTPCA和现有的PRCA方法对室外视频的背景建模理结果对比图,其中第(a)列为原始图,第(b)列为现有的PRCA方法获得的背景图;第(c)列为本专利技术的IRTPCA方法获得背景图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚,下面结合实施方式和附图,对本专利技术作进一步地详细描述。为了更好地提取多维数据中的低秩张量成分,本专利技术对现有的张量核范数(TNN)进行了改进,通过增加矩阵核范数来强化核心矩阵中的低秩结构,充分挖掘了三个模式的低秩结构;通过稀疏约束,本专利技术提出了改进的稳健张量主成分分析(IRTPCA)方法,以更加充分利用多维数据结构信息,在精度和计算复杂度方面优于现有的基于t-SVD的张量主成分分析(RTPCA)方法。本专利技术在利用低秩核心矩阵近似来改进现有的RTPCA方法时,首先对待处理的张量进行t-SVD分解,得到其中和分别为大小N1×N1×N3和N2×N2×N3的正交张量,是一个大小为N1×N2×N3的核心张量,为了利用核心张量的低秩结构,本专利技术定义了一个改进的张量核范数(ITNN):其中γ是一个平衡两项的预定义的参数,与传统的张量核范数(TNN)相比,新定义的ITNN除了张量核范数项,还增加了一项由核心张量构造的核心矩阵的核范数。对于ITNN,张量核范数项可以在第一和第二模式中提取低秩张量成分,而另一项则使用核心矩阵的核范数来处理第三模式下的低秩张量成分。ITNN的优化试图充分利用张量数据的结构特征。在此基础上,本专利技术开发了一种高效的IRTPCA方法。定义算子和分别表示核心张量和核心矩阵之间的转化,其中N=min(N1,N2),即基于核心张量的正面切片的对角元素构造核心矩阵如图2所示,用算子和表示为:同时算子也能够被矩阵乘法定义,用矩阵S(1)表示核心张量展本文档来自技高网
...

【技术保护点】
1.基于低秩核心矩阵的改进稳健张量主成分分析方法,其特征在于,包括下列步骤:步骤S1:初始化低秩成分

【技术特征摘要】
1.基于低秩核心矩阵的改进稳健张量主成分分析方法,其特征在于,包括下列步骤:步骤S1:初始化低秩成分稀疏成分对偶变量拉格朗日惩罚算子ρ、收敛阈值∈,参数λ、λ1和更新率α1、α2;其中参数λ、λ1的初始值分别为:步骤S2:对待主成分分析的张量其中表示实数域,上标为维度信息;对张量进行张量奇异值分解,得到正交张量和以及核心张量其中和构造核心矩阵其中算子表示基于核心张量的正面切片的对角元素构造核心矩阵,核心矩阵的列数为N,行数为N3;步骤S3:对低秩成分稀疏成分进行迭代更新处理:基于S2中分解得到的正交张量和根据计算中间张量其中算子为算子的逆操作,表示核心矩阵的奇异值阈值算子;更新低秩成分为:其中,表示张量的张量奇异值阈值算子;更新稀疏成分为:其中表示张量的软阈值算子;步骤S4:判断是否满足迭代更新收敛条件,若是,则输出迭代更新后的低秩成分和...

【专利技术属性】
技术研发人员:刘翼鹏冯兰兰陈龙喜曾思行朱策
申请(专利权)人:电子科技大学
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1