一种复数域流形处理方法技术

技术编号:15619243 阅读:175 留言:0更新日期:2017-06-14 04:12
本发明专利技术公开了一种复数域流形处理方法,属于复数域计算技术领域,包括在待处理的高维复数域数据集X={x

【技术实现步骤摘要】
一种复数域流形处理方法
本专利技术涉及复数域计算
,特别涉及一种复数域流形处理方法。
技术介绍
随着图像采集设备和信息获取能力的提高,所处理得到的数据信息和数据维数十分庞大。而对于如此庞大的数据进行存储和处理势必会有诸多不便,因此在处理过程中,需要首先对数据进行降维处理。目前对数据进行降维的方法一般包括PCA和LDA线性降维算法,这类算法具有的优点是算法原理简单、数据处理速度快,但是却存在着较为严重的缺陷:在随非线性数据进行处理时会造成非线性数据信息量的丢失。针对于上述缺陷,技术人员在PCA和LDA线性降维算法的基础上提出了KPCA和KLDA算法来解决非线性数据降维的问题。而在2000年提出的流形学习算法ISOMAP和LLE将非线性降维算法引入了一个新纪元,该类算法在保持高维非线性数据的同时,可以将其在低维空间中表示,较好的解决的非线性数据降维处理过程中存在的数据信息量丢失问题。但是流形学习算法对高维复数域数据的降维却无能为力。
技术实现思路
本专利技术的目的在于提供一种复数域流形处理方法,以解决现有的流形学习算法无法对高维复数域数据进行降维处理的问题。为实现以上目的,本专利技术采用的技术方案为:提供一种复数域流形处理方法,该方法包括:在待处理的高维复数域数据集X={x1,x2,…,xI,…,xN}中任取一数据点作为基准点p,其中1≤I≤N,N为常数,表示高维复数域数据集X的列向量维数;设置局部领域k的大小,选择基准点p的k个最近邻点组成最近邻B(p);在B(p)的外空间执行复数域的线性降维算法PCA,得到p点处切空间的一组标准正交基;根据B(p)在p点处切空间的一组标准正交基得到p到数据集X中其他各点的测地线距离和方向,将待处理的高维复数域数据集的数据降维为对应的低维空间数据集。与现有技术相比,本专利技术存在以下技术效果:本专利技术通过将实数域的流形学习算法LOGMAP扩展到复数域空间,对高维的复数域数据进行降维处理,在保证原始高维数据特征的基础上将高维空间上的点在低维空间表示,方便了数据的存储和处理。附图说明图1是本专利技术一实施例提供的一种复数域流形处理方法的流程示意图;图2是本专利技术一实施例中步骤S3的细分步骤的流程示意图;图3是本专利技术一实施例中步骤S4的细分步骤的流程示意图;图4是本专利技术一实施例中步骤S42的细分步骤的流程示意图;图5是本专利技术一实施例中流形学习算法LOGMAP处理示意图。具体实施方式下面结合图1至图5所示,对本专利技术做进一步详细叙述。如图1所示,本实施例公开了一种复数域流形处理方法,包括如下步骤S1至S4:S1、在待处理的高维复数域数据集X={x1,x2,…,xI,…,xN}中任取一数据点作为基准点p,其中1≤I≤N,N为常数,表示高维复数域数据集X的列向量维数;S2、设置局部领域k的大小,选择基准点p的k个最近邻点组成最近邻B(p);S3、在B(p)的外空间执行复数域的线性降维算法PCA,得到p点处切空间的一组标准正交基;S4、根据B(p)在p点处切空间的一组标准正交基得到p到数据集X中其他各点的测地线距离和方向,将待处理的高维复数域数据集的数据降维为对应的低维空间数据集。需要说明的是,由于流形体本身没有坐标,如果要描述流形上的点,就需要把流形放到外围空间中,用外围空间的坐标来表示。比如,如果要描述球面上的点就只能用球面外部的三维坐标来表示。具体地,步骤S2包括:计算待处理的高维复数域数据集X={x1,x2,…,xI,…,xN}中任意两复向量xI、xJ之间的距离,其中,1≤J≤N,xI={xI1,xI1,…,xIn},xJ={xJ1,xJ1,…,xJn},n表示表示高维复数域数据集X的列向量维数;根据任意两复向量xI、xJ之间的距离,选择基准点p的k最近邻点组成最近邻域B(p)。需要说明的是,以基准点p为中心点,选取离基准点p距离最近的6至8个点,这6至8个点作为基准点p的k最近邻的个数,且由这6至8个点组成高维复数域样本集X'={x1,x2,…,xi,…,xk},该数据集也称为最近邻域B(p),其中,两复向量之间的距离的计算过程如下:xI-xJ=(xI1-xJ1,xI2-xJ2,…,xIn-xJn)=(e1,e2,…eI,…,en)T,具体地,如图2所示,步骤S3具体包括如下步骤S31至S35:S31、计算高维复数域样本集X'={x1,x2,…,xi,…,xk}中各列向量的均值,其中,高维复数域样本集X'={x1,x2,…,xi,…,xk}由B(p)中的点构成,其中1≤i≤k,k为常数且1≤k≤N;具体地,高维复数域样本集X'为待处理的高维复数域数据集X的局部区域,近似为线性数据。根据高维复数域样本集X',计算所有列向量的均值为S32、根据各列向量的均值,构造总体离散矩阵S;具体地,本实施例中的总体离散矩阵S为一个k×k矩阵,为:其中H表示复数域矩阵的转置。S33、基于奇异值分解法,计算总体离散矩阵S的特征值及对应的归一化特征向量;具体地,利用奇异值分解法计算出总体离散矩阵S的特征值为:λ1,λ2,…,λk,以及特征值λ1,λ2,…,λk对应的归一化特征向量为e1,e2,…,ek。这里的归一化特征向量是两两正交的。S34、按照预设顺序选择前d个特征值及对应的特征向量来构成投影矩阵;具体地,这里按照特征值的贡献率既选取的特征值的和与所有特征值的和的比值,这里按照贡献率为99%的标准选取特征值。具体为选取前d个最大特征值及其对应的特征向量构成投影矩阵W=(e1,e2,…,ed),d为特征维数,这里的(e1,e2,...,ed)也就是所谓的标准正交基。S35、通过投影矩阵对高维复数域样本集X'={x1,x2,…,xi,…,xk}中的向量xi进行投影,得到在低维空间对应的坐标yi。具体地,高维复数域样本集X'中的向量xi经投影矩阵W变换得到一个d维的新向量yi=WT(xi-u),因此,高维复数域样本集X'中的向量在低维空间中的坐标表示为:Y'=[y1,y2,…,yk]T。具体地,如图3所示,步骤S4包括如下步骤S41至S44:S41、构造加权无向图G(V,E),以顶点V作为待处理的高维复数域数据集X={x1,x2,…,xI,…,xN}中的样本点,以任意两复向量xI、xJ之间的欧式距离作为加权无向图两点之间的权值;S42、基于Dijkstra算法,计算B(p)在低维空间的坐标yi到待处理的高维复数域数据集X={x1,x2,…,xI,…,xN}中任两点的测地线距离;具体地,任两点的测地线距离为d(xI,y),其中(xI,y)∈X×B(p)。S43、根据高维复数域数据集X中各点的测地线距离以及p点处切空间的一组标准正交基,计算B(p)中的点到待处理的高维复数域数据集X={x1,x2,…,xI,…,xN}中任意一点的方向具体地,B(p)中的点到高维复数域数据集X中任一点xI的方向为:其中,xI∈X。S44、根据高维复数域数据集X中各点的测地线距离、方向计算待处理的高维复数域数据集X={x1,x2,…,xI,…,xN}在低维空间中的坐标。具体地,高维复数域数据集X在低维空间中的坐标为yI:因此,将待处理的高维复数域数据集X={x1,x2,…,xI,…,xN}转化为低维空间的数据集为:Y={y1,y2,本文档来自技高网...
一种复数域流形处理方法

【技术保护点】
一种复数域流形处理方法,其特征在于,包括:S1、在待处理的高维复数域数据集X={x

【技术特征摘要】
1.一种复数域流形处理方法,其特征在于,包括:S1、在待处理的高维复数域数据集X={x1,x2,…,xI,…,xN}中任取一数据点作为基准点p,其中1≤I≤N,N为常数,表示高维复数域数据集X的列向量维数;S2、设置局部领域k的大小,选择基准点p的k个最近邻点组成最近邻B(p);S3、在B(p)的外空间执行复数域的线性降维算法PCA,得到p点处切空间的一组标准正交基;S4、根据B(p)在p点处切空间的一组标准正交基,得到p到数据集X中其他各点的测地线距离和方向,将待处理的高维复数域数据集的数据降维为对应的低维空间数据集。2.如权利要求1所述的方法,其特征在于,所述的步骤S2包括:计算待处理的高维复数域数据集X={x1,x2,…,xI,…,xN}中任意两复向量xI、xJ之间的距离,其中,1≤J≤N,xI={xI1,xI1,…,xIn},xJ={xJ1,xJ1,…,xJn},n表示高维复数域数据集X的列向量维数;根据任意两复向量xI、xJ之间的距离,选择基准点p的k最近邻点组成邻域B(p)。3.如权利要求1或2所述的方法,其特征在于,所述的步骤S3包括:S31、计算高维复数域样本集X'={x1,x2,…,xi,…,xk}中各列向量的均值,其中,高维复数域样本集X'={x1,x2,…,xi,…,xk}由B(p)中的点构成,其中1≤i≤k,k为常数且1≤k≤N;S32、根据各列向量的均值,构造总体离散矩阵S;S33、基于奇异值分解法,计算总体离散矩阵S的特征值及对应的归一化特征向量;S34、按照预设顺序选择前d个特征值及对应的特征向量来构成投影矩阵;S35、通过投影矩阵对高维复数域样本集X'={x1,x2,…...

【专利技术属性】
技术研发人员:张芝华姚莉莉张传金万海峰
申请(专利权)人:安徽创世科技股份有限公司
类型:发明
国别省市:安徽,34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1