【技术实现步骤摘要】
基于张量补全的多源异构数据特征提取方法、设备及介质
[0001]本专利技术属于数据处理
,尤其涉及一种基于张量补全的多源异构数据特征提取方法、设备及介质。
技术介绍
[0002]目前多源异构数据特征提取分为两类,第一类是基于向量表示来刻画各类异构数据特征,第二类为基于张量表示,并借助于张量分解技术来提取各类异构数据特征。第一类的方式会造成多源异构数据数据样本的空间结构信息丢失,而且会因为维数过高而产生小样本与维数灾难问题。因此现有技术通常采用张量表示和张量分解来提取异构数据特征。
[0003]现有技术中,通常需要将多源异构数据用高阶张量表示,然后Tucker分解,利用核张量的log
‑
sum惩罚函数来刻画多源异构数据的低秩性,接着以交替方向法的方式求解张量补全的优化模型,然后获得核张量、因子矩阵和张量重构数据,核张量即为多源异构数据的特征提取。这种方式虽然能通过降维获得高阶张量在低维空间的有效特征,但却忽略了多源异构数据保持低维子空间的一致性,导致异构数据特征提取的效果较差。
专利技术 ...
【技术保护点】
【技术特征摘要】
1.一种基于张量补全的多源异构数据特征提取方法,其特征在于,包括:根据多源异构数据中的初始特征,构建多源异构数据的张量数据;对所述的张量数据进行正交Tucker分解,得到核张量和因子矩阵;将所述核张量、所述因子矩阵、所述张量数据输入到预先建立的张量补全模型中,对所述张量补全模型进行求解,并用所述张量数据对根据求解得到的张量重构数据进行张量补全,得到目标核张量,作为所述多源异构数据的特征提取结果;其中,所述张量补全模型通过核张量的结构稀疏性来刻画构建的张量数据的低秩性,所述张量补全模型将构建的张量数据各模展开后的相似矩阵导出的拉普拉斯图作为先验信息,所述张量补全模型通过图嵌入正则项和所述先验信息,保持异构数据构建的张量数据在低维子空间的一致性。2.根据权利要求1所述的张量补全的多源异构数据特征提取方法,其特征在于,对所述张量补全模型进行求解,并根据所述张量数据对求解得到的张量重构数据进行张量补全,得到目标核张量和目标因子矩阵,包括:将所述张量补全模型中的l0范数替换成log
‑
sum凸函数松弛策略,得到约束优化模型;根据Tikhonov正则化方法,将所述约束优化模型转化为无约束优化模型;采用交替方向法对所述无约束优化模型进行迭代,得到目标核张量和目标因子矩阵。3.根据权利要求2所述的张量补全的多源异构数据特征提取方法,其特征在于,所述张量补全模型为:其中,为所述核张量,在上具备低秩性,为所述因子矩阵,,表示第模展开,表示核张量的稀疏性,e为一个值都为1的向量,e,θ为正则化参数,,为所述图嵌入正则项,表示矩阵的迹,L
n
为相似矩阵导出的拉普拉斯图,,是Stiefel流形,,为所述张量重构数据,为所述张量数据,表示的非零项。4.根据权利要求3所述的张量补全的多源异构数据特征提取方法,其特征在于,所述约束优化模型为:
其中,表示第模展开的矩阵的第行,ε为预设精度参数。5.根据权利要求4所述的张量补全的多源异构数据特征提取方法,其特征在于,所述无约束优化模型包括:其中,β为第一...
【专利技术属性】
技术研发人员:符蕴芳,褚云霞,陈永肖,方明辉,孟惜,马玉鹏,
申请(专利权)人:石家庄学院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。