一种基于偏最小二乘法的半监督降维方法及系统技术方案

技术编号：20843954 阅读：52 留言：0更新日期：2019-04-13 08:53

本发明专利技术提供一种基于偏最小二乘法的半监督降维方法及系统，其中方法包括提取无监督数据和监督数据，还包括以下步骤：建立偏最小二乘法模型；基于所述偏最小二乘法模型求取回归系数；根据所述回归系数进行特征值分解。本发明专利技术提出一种基于偏最小二乘法的半监督降维系统，即使只有很少或没有标记样本也可以获得更好的预测结果，与无监督或监督降维算法相比，半监督PLS不仅可以提高样本的预测精度，而且可以提高模型的泛化能力。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于偏最小二乘法的半监督降维方法及系统
本专利技术涉及模式识别和机器学习的
，特别是一种基于偏最小二乘法的半监督降维方法及系统。
技术介绍
模式识别和机器学习领域经常面临高维问题。高维数据的分析通常很难，所以找到不仅对去除一些冗余和噪声，同时尽可能多的保留原始信息的降维方法至关重要。因为使用简化的特征，数据分析将更快，更稳健。无论是有监督的还是无监督的降维方法都需要足够的数据样本，只有这样才能建立良好的性能，高鲁棒性和强泛化能力模型。然而，在许多现实世界的分析应用中，标记工作既耗时又昂贵，但是未标记的样品更容易获得。因此，在建立模型之前，未标记样本的数量远远大于标记样本的数量。如果我们只使用标记数据，则监督模型将不具有良好的泛化能力，同时，将浪费大量未标记的数据。在仅使用未标记的数据时，将忽略先验信息。半监督降维可以同时使用标签数据和未标记数据，只需要较少的人为参与即可获得良好的效果。申请号为102411610A专利技术专利申请公开一种用于高维数据聚类的半监督降维方法，包括：(1)构建样本特征矩阵；(2)构建约束矩阵；(3)构建迭代方程组，迭代输出过渡矩阵；(4)求得降维后的样本特征矩阵。该方法在获取样本集合以及样本集合中p个样本的类别信息时需要进行部分标记，相对比较繁琐。
技术实现思路
为了解决上述的技术问题，本专利技术提出一种基于偏最小二乘法的半监督降维系统，即使只有很少或没有标记样本也可以获得更好的预测结果，与无监督或监督降维算法相比，半监督PLS不仅可以提高样本的预测精度，而且可以提高模型的泛化能力。本专利技术的第一目的是提供一种基于偏最小二...

【技术保护点】
1.一种基于偏最小二乘法的半监督降维方法，包括提取无监督数据和监督数据，其特征在于，还包括以下步骤：步骤1：建立偏最小二乘法模型；步骤2：基于所述偏最小二乘法模型求取回归系数；步骤3：根据所述回归系数进行特征值分解。

【技术特征摘要】
1.一种基于偏最小二乘法的半监督降维方法，包括提取无监督数据和监督数据，其特征在于，还包括以下步骤：步骤1：建立偏最小二乘法模型；步骤2：基于所述偏最小二乘法模型求取回归系数；步骤3：根据所述回归系数进行特征值分解。2.如权利要求1所述的基于偏最小二乘法的半监督降维方法，其特征在于，所述步骤1包括根据所述无监督数据建立偏最小二乘法模型。3.如权利要求2所述的基于偏最小二乘法的半监督降维方法，其特征在于，所述步骤2包括基于所述建立在无监督数据上的偏最小二乘法模型求取回归系数B2。4.如权利要求3所述的基于偏最小二乘法的半监督降维方法，其特征在于，所述回归系数B2的求取步骤如下：步骤01：从观察矩阵X的每列X(i)中减去平均向量，i＝1；步骤02：如果i≤n，则利用X×B2(i)＝X(i)计算回归系数B2(i),其中n是观察矩阵X的列数；如果i>n，则执行步骤05；步骤03：将回归系数组合为矩阵B2＝[B2；B2(i)]；步骤04：从X中减去B(i)投影空间中的值，X＝X-(X*B(i))*B(i)T，返回步骤02；步骤05：设B2＝B2×B2T，并用特征值分解法分解矩阵B2，其中，B(i)表示矩阵的第i列，T表示转量。5.如权利要求4所述的基于偏最小二乘法的半监督降维方法，其特征在于，所述步骤1还包括根...

【专利技术属性】
技术研发人员：张欣，
申请(专利权)人：北京联合大学，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人