【技术实现步骤摘要】
基于张量分解的异构大数据核心特征提取的方法及系统
本专利技术涉及张量数据处理
,尤其涉及基于张量分解的异构大数据核心特征提取的方法及系统。
技术介绍
近年来,随着互联网、物联网、云计算等高新信息技术的迅猛发展,信息社会已经进入大数据时代。现实世界大量的感知设备、智能产品、网络通信、社交媒体等源源不断的产生海量异构的高维数据汇集在信息-物理-社会空间(CPSS,CyberPhysicalSocialSystem)。相对于大数据典型特征,如数据规模大(Volume)、类型多(Variety)、产生速度快(Velocity)、数据不完整(Veracity)、价值密度低(Value)等,多样化的数据来源以及组织方式导致了CPSS大数据具有多源、异构、高维、混杂等特点。同时随着数据的源源不断产生以及不同应用领域数据之间的深度融合,CPSS系统中的数据结构以及关联关系变得更加复杂。直接对CPSS中采集的低质、高维、海量数据进行处理与分析,一方面会给计算机带来巨大的存储与计算开销,另一方面由于数据的低质、冗余效应,直接影响各种模式识 ...
【技术保护点】
1.基于张量分解的异构大数据核心特征提取的方法,其特征在于,所述方法包括:/n获取社会物理信息系统中的K个N阶张量数据
【技术特征摘要】
1.基于张量分解的异构大数据核心特征提取的方法,其特征在于,所述方法包括:
获取社会物理信息系统中的K个N阶张量数据I1,I2,…INN表示N个特征空间的维度;
基于所述张量数据,获得由元素glm构成的系数矩阵g;其中,σ是正则化参数,是两个所述张量数据的位置距离;
对g进行特征值分解,获得
对G1/2进行张量化操作,获得系数张量G;
将X(k)与G进行多模乘,获得变换后的张量数据
根据N+1阶张量的正交Tucker-N分解模型,将Y(k)沿第N+1阶进行串联,获得N+1阶张量Y;
对Y进行正交Tucker-N模式分解,获得N个正交因子矩阵和核心张量F;
基于所述N个正交因子矩阵和所述核心张量F,获得所述张量数据X(k)的低维核心特征。
2.如权利要求1所述的方法,其特征在于,所述对G1/2进行张量化操作,获得系数张量G,具体包括:
利用如下公式计算获得系数张量G:
其中,reshape表示重组函数。
3.如权利要求2所述的方法,其特征在于,所述将X(k)与G进行多模乘,获得变换后的张量数据具体包括:
利用如下公式变化获得
其中,具体的元素运算如下:
4.如权利要求3所述的方法,其特征在于,所述根据N+1阶张量的正交Tucker-N分解模型,将Y(k)沿第N+1阶进行串联,获得N+1阶张量Y,具体包括:
利用如下公式计算获得N+1阶张量Y:
其中,cat表示数组联结函数。
5.如权利要求4所述的方法,其特征在于,所述对Y进行正交Tucker-N模式分解,获得核心张量F,具体包括:
S1、对Y进行高阶奇异值分解,获得高阶奇异值分解结果;
S2、利用所述高阶奇异值分解结果初始化前N个因子矩阵U(1),U(2),…,U(N),令k=0;
S3、令k=k+1,并计算
S(-n)←y×1U(1)T…×n-1U(n-1)T×n+1U(n+1)T…×NU(N)T;
S4、对S(-n)进行矩阵化展开,计算奇异值矩阵S(n)(-n)=U∑VT,确定有效秩Jn,n=1,2,...,N;
S5、计算F(k)←y×1U(1)T×2U(2)T…×...
【专利技术属性】
技术研发人员:杨天若,高源,赵雅靓,杨静,
申请(专利权)人:华中科技大学鄂州工业技术研究院,华中科技大学,
类型:发明
国别省市:湖北;42
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。