一种基于比率最小化和稀疏表征学习模型的数据压缩方法技术

技术编号:43858400 阅读:22 留言:0更新日期:2024-12-31 18:47
本发明专利技术公开了一种基于比率最小化和稀疏表征学习的数据压缩方法,包括:获取训练数据集,对于训练数据集中的数据样本进行归一化处理,再通过主成分分析方法对数据样本进行降维处理;将选取的训练集应用到基于比率最小化的鲁棒稀疏表征学习模型中,通过不断迭代优化学习模型,更新投影矩阵以及类簇中心向量直至目标函数收敛,从而可得到最优的数据投影矩阵;对于待压缩的数据,通过所学习到的数据投影矩阵将待压缩的数据进行线性映射至低维空间中,从而实现了对数据的压缩。本发明专利技术设计了基于l<subgt;1,2</subgt;范数的稀疏正则项来作为度量准则,有效提高了所提模型的表征能力;在对高维数据进行压缩表征时,能够更加快速地收敛且达到较为稳定的处理性能。

【技术实现步骤摘要】

本专利技术属于机器学习,其具体涉及一种对于包含异常值和噪音的高维数据的线性压缩表征方法。


技术介绍

1、作为一种重要的数据表征技术,费舍尔线性判别分析方法(fisher lineardiscriminant analysis,lda)近年来已成功地应用于许多科学领域,包括数据压缩传输以及信息去噪等。费舍尔线性判别分析方法是一种学习高维数据低维结构的子空间分析方法,其主要是通过训练数据来学习一组最大化费舍尔判别准则的向量,进而通过这些向量对原始数据进行降维表征处理。

2、传统的费舍尔线性判别分析方法采用基于迹比值的目标函数,其通过转化为特征值优化问题来得到原始问题模型的闭式解。然而,对于该优化问题的求解是需要对类内散度矩阵进行逆运算操作。因此,当类内散度矩阵奇异时,费舍尔线性判别分析模型是病态且不可求解的。然而,在高维特征空间或具有高度相关特征的特征空间中,是经常出现有不满秩的类内散度矩阵的,如图像/视频分类、基因表达等。在这种情况下,传统的解决方法通常是使用主成分分析(principle component analysis,pca)作为预处理本文档来自技高网...

【技术保护点】

1.一种基于比率最小化和稀疏表征学习的数据压缩方法,其特征在于,包括:

2.根据权利要求1所述的基于比率最小化和稀疏表征学习的数据压缩方法,其特征在于,所述训练数据集的处理过程为:

3.根据权利要求1所述的基于比率最小化和稀疏表征学习的数据压缩方法,其特征在于,所述基于比率最小化的鲁棒稀疏表征学习模型,表示为:

4.根据权利要求1所述的基于比率最小化和稀疏表征学习的数据压缩方法,其特征在于,所述通过不断迭代优化学习模型,更新投影矩阵以及类簇中心向量直至目标函数收敛,从而可得到最优的数据投影矩阵,包括:

5.根据权利要求1所述的基于比率最小化...

【技术特征摘要】

1.一种基于比率最小化和稀疏表征学习的数据压缩方法,其特征在于,包括:

2.根据权利要求1所述的基于比率最小化和稀疏表征学习的数据压缩方法,其特征在于,所述训练数据集的处理过程为:

3.根据权利要求1所述的基于比率最小化和稀疏表征学习的数据压缩方法,其特征在于,所述基于比率最小化的鲁棒稀疏表征学习模型,表示为:

4.根据权利要求1所述的基于比率最小化和稀疏表征学习的数据压缩方法,其特征在于,所述通过不断迭代优化学习模型,更新投影矩阵以及类簇中心向量直至目标函数收敛,从而可得到最优的数据投影矩阵,包括:

<...

【专利技术属性】
技术研发人员:常伟董钊李涛李柯达刘满国朱克炜南心蒙吴永琪李鑫
申请(专利权)人:西安现代控制技术研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1