【技术实现步骤摘要】
本专利技术属于特征抽取和数据降维
,主要为典型相关分析算法的改进优化。具体为一种基于广义均值的鲁棒典型相关分析算法,可应用于机器学习、模式识别、数据挖掘及图像处理等领域。
技术介绍
在模式识别和机器学习领域,维数约简(Dimensionality reduction,DR)一直是研究的热门之一。人们提出了大量的方法用于数据的降维,其中主成分分析(Principal component analysis,PCA)是最经典的方法之一。但PCA关注的是单模态数据(Single-view data)的特征抽取与降维。随着科技的发展,人们采集数据的手段更加的多样化,同一事物具有多元的表示形态,例如某人的信息可以由面部、字迹、指纹等属性构成。对于多模态数据(Multi-view data),典型相关分析(Canonical correlation analysis,CCA)更加适合特征的抽取与融合。CCA是一种研究同一对象两组变量之间相关性的多元统计方法,可用于实现数据的特征抽取、降维和可视化。CCA通过最大化不同模态间的相关性,消除数据间的冗余信息,提取重要特征,强 ...
【技术保护点】
一种基于广义均值的鲁棒典型相关分析算法,包括以下步骤:(1)输入一组大小为N的样本集广义均值的参数p,内部迭代总次数T1和T2,外部迭代总次数T,降维后特征的维数d;(2)首先,计算样本集X=(x1,x2,...,xN)与Y=(y1,y2,...,yN)的中心值:x‾=1NΣi=1Nxi,y‾=1NΣi=1Nyi]]>并用和中心化X和Y:X‾=(x1-x‾,x2-x‾,...,xN-x‾),Y‾=(y1-y‾,y2-y&Ov ...
【技术特征摘要】
1.一种基于广义均值的鲁棒典型相关分析算法,包括以下步骤:(1)输入一组大小为N的样本集广义均值的参数p,内部迭代总次数T1和T2,外部迭代总次数T,降维后特征的维数d;(2)首先,计算样本集X=(x1,x2,...,xN)与Y=(y1,y2,...,yN)的中心值: x ‾ = 1 N Σ i = 1 N x i , y ‾ = 1 N Σ i = 1 N y i ]]>并用和中心化X和Y: X ‾ = ( x 1 - x ‾ , x 2 - x ‾ , ... , x N - x ‾ ) , Y ‾ = ( y 1 - y ‾ , y 2 - y ‾ , ... , y N - y ‾ ) ]]>为了统一性,将中心化后的和仍记为X=(x1,x2,...,xN)与Y=(y1,y2,...,yN);(3)获取传统的典型相关分析(Canonical correlation analysis,CCA)的两组投影集和CCA是寻找两组样本集X和Y的投影向量和使得在投影空间中着两组样本集的特征具有最大的相关性,其准则函数如下所示: max w x , w y w x T XY T w y ]]> s . t . w x T XX...
【专利技术属性】
技术研发人员:葛洪伟,顾高升,李莉,朱嘉钢,
申请(专利权)人:江南大学,
类型:发明
国别省市:江苏;32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。