一种多维数据的正交投影降维分类方法及系统技术方案

技术编号：15065769 阅读：56 留言：0更新日期：2017-04-06 13:25

本发明专利技术公开了一种多维数据的正交投影降维分类方法及系统，方法包括：构建待处理的多维数据的训练样本集，并对构建的训练样本集进行正交投影，得到相应的多个二维正交投影矩阵；对每个二维正交投影矩阵依次进行归一化处理；对归一化处理后的二维正交投影矩阵进行模糊处理；计算待处理的多维数据在模糊处理后的二维正交投影矩阵上对应位置的取值之和，然后根据计算的结果对待处理的多维数据进行分类。本发明专利技术通过正交投影将复杂的多维数据分类问题转化为由多个简单的二维数据分类问题所组成的集合，降低了数据分类的维度，算法复杂低，运算量小，极大提高了分类的运算效率。本发明专利技术可广泛用于数据分类领域。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及数据分类领域，尤其是一种多维数据的正交投影降维分类方法及系统。
技术介绍
分类技术是数据挖掘、机器学习和模式识别中的一个重要研究领域，广泛应用于需要归纳与分析大量信息的行业及应用领域中。随着大数据对处理海量数据的实时性高、误警率低的需求，这对分类技术在效率和准度上提出了极高的要求。尤其是在面对大规模、高维度数据时，如何建立高效、可扩展的分类数据挖掘算法成了数据挖掘及其应用领域的重要研究课题。目前针对多维数据的分类研究还处于起步阶段，相关的分类算法较少。现有的多维数据分类方法，大多算法复杂度高，运算量大，效率低，难于满足大数据处理的高要求。
技术实现思路
为解决上述技术问题，本专利技术的目的在于：提供一种算法复杂低和高效的，多维数据的正交投影降维分类方法。本专利技术的另一目的在于：提供一种算法复杂低和高效的，多维数据的正交投影降维分类系统。本专利技术解决其技术问题所采取的技术方案是：一种多维数据的正交投影降维分类方法，包括：S1、构建待处理的多维数据的训练样本集，并对构建的训练样本集进行正交投影，得到相应的多个二维正交投影矩阵；S2、对每个二维正交投影矩阵依次进行归一化处理，得到归一化处理后的二维正交投影矩阵；S3、对归一化处理后的二维正交投影矩阵进行模糊处理，得到模糊处理后的二维正交投影矩阵；S4、计算待处理的多维数据在模糊处理后的二维正交投影矩阵上对应位置的取值之和，然后根据计算的结果对待处理的多维数据进行分类。进一步，所述步骤S1...
一种多维数据的正交投影降维分类方法及系统

【技术保护点】
一种多维数据的正交投影降维分类方法，其特征在于：包括：S1、构建待处理的多维数据的训练样本集，并对构建的训练样本集进行正交投影，得到相应的多个二维正交投影矩阵；S2、对每个二维正交投影矩阵依次进行归一化处理，得到归一化处理后的二维正交投影矩阵；S3、对归一化处理后的二维正交投影矩阵进行模糊处理，得到模糊处理后的二维正交投影矩阵；S4、计算待处理的多维数据在模糊处理后的二维正交投影矩阵上对应位置的取值之和，然后根据计算的结果对待处理的多维数据进行分类。

【技术特征摘要】
1.一种多维数据的正交投影降维分类方法，其特征在于：包括：
S1、构建待处理的多维数据的训练样本集，并对构建的训练样本集进行正交投影，得到
相应的多个二维正交投影矩阵；
S2、对每个二维正交投影矩阵依次进行归一化处理，得到归一化处理后的二维正交投影
矩阵；
S3、对归一化处理后的二维正交投影矩阵进行模糊处理，得到模糊处理后的二维正交投
影矩阵；
S4、计算待处理的多维数据在模糊处理后的二维正交投影矩阵上对应位置的取值之和，
然后根据计算的结果对待处理的多维数据进行分类。
2.根据权利要求1所述的一种多维数据的正交投影降维分类方法，其特征在于：所述步骤
S1，其包括：
S11、构建待处理的多维数据的训练样本集；
S12、将构建的训练样本集中的每列数据标准化到足以描述计算精度的空间；
S13、分别对构建的训练样本集中的每一类数据样本，在维度上两两进行正交投影，得到
个二维正交投影矩阵，其中，k为构建的训练样本集的类别，n为构建的训练样本集的
维数。
3.根据权利要求2所述的一种多维数据的正交投影降维分类方法，其特征在于：所述步骤
S13，其包括：
S131、创建个二维矩阵来描述k类n维数据集中的所有二维坐标平面；
S132、将构建的训练样本集中的所有数据逐类投影至步骤S131所创建的二维坐标平面，
并使相应的二维矩阵上的元素值自加1，最终得到个二维正交投影矩阵。
4.根据权利要求2所述的一种多维数据的正交投影降维分类方法，其特征在于：所述步骤
S2，其具体为：
对每个二维正交投影矩阵依次进行归一化处理，得到处理后的二维正交投影矩阵，所述
归一化处理的计算公式为：
m′ij=θmijmaxp,]]>其中，θ为设定的权值调整参数，mij为归一化处理前二维正交投影矩阵中第i行第j
列元素的值，maxp为第p类的个矩阵中元素的最大值，p＝1,2，…，k；m′ij为处理后的

\t二维正交投影矩阵中第i行第j列元素的值。
5.根据权利要求2所述的一种多维数据的正交投影降维分类方法，其特征在于：所述步骤
S3，其具体为：
采用IIR滤波法、FIR滤波法、FFT法、小波变换法、方框模糊算法和高斯模糊算法中的
任意一种模糊算法对归一化处理后的二维正交投影矩阵进行模糊处理，得到模糊处理后的二
维正交投影矩阵。
6.根据权利要求5所述的一种多维数据的正交投影降维分类方法，其特征在于：所述高斯
模糊算法中标准差参数σ的取值为：...

【专利技术属性】
技术研发人员：张巍，霍颖翔，滕少华，
申请(专利权)人：广东工业大学，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人