一种多维数据的正交投影降维分类方法及系统技术方案

技术编号:15065769 阅读:56 留言:0更新日期:2017-04-06 13:25
本发明专利技术公开了一种多维数据的正交投影降维分类方法及系统,方法包括:构建待处理的多维数据的训练样本集,并对构建的训练样本集进行正交投影,得到相应的多个二维正交投影矩阵;对每个二维正交投影矩阵依次进行归一化处理;对归一化处理后的二维正交投影矩阵进行模糊处理;计算待处理的多维数据在模糊处理后的二维正交投影矩阵上对应位置的取值之和,然后根据计算的结果对待处理的多维数据进行分类。本发明专利技术通过正交投影将复杂的多维数据分类问题转化为由多个简单的二维数据分类问题所组成的集合,降低了数据分类的维度,算法复杂低,运算量小,极大提高了分类的运算效率。本发明专利技术可广泛用于数据分类领域。

【技术实现步骤摘要】

本专利技术涉及数据分类领域,尤其是一种多维数据的正交投影降维分类方法及系统
技术介绍
分类技术是数据挖掘、机器学习和模式识别中的一个重要研究领域,广泛应用于需要归纳与分析大量信息的行业及应用领域中。随着大数据对处理海量数据的实时性高、误警率低的需求,这对分类技术在效率和准度上提出了极高的要求。尤其是在面对大规模、高维度数据时,如何建立高效、可扩展的分类数据挖掘算法成了数据挖掘及其应用领域的重要研究课题。目前针对多维数据的分类研究还处于起步阶段,相关的分类算法较少。现有的多维数据分类方法,大多算法复杂度高,运算量大,效率低,难于满足大数据处理的高要求。
技术实现思路
为解决上述技术问题,本专利技术的目的在于:提供一种算法复杂低和高效的,多维数据的正交投影降维分类方法。本专利技术的另一目的在于:提供一种算法复杂低和高效的,多维数据的正交投影降维分类系统。本专利技术解决其技术问题所采取的技术方案是:一种多维数据的正交投影降维分类方法,包括:S1、构建待处理的多维数据的训练样本集,并对构建的训练样本集进行正交投影,得到相应的多个二维正交投影矩阵;S2、对每个二维正交投影矩阵依次进行归一化处理,得到归一化处理后的二维正交投影矩阵;S3、对归一化处理后的二维正交投影矩阵进行模糊处理,得到模糊处理后的二维正交投影矩阵;S4、计算待处理的多维数据在模糊处理后的二维正交投影矩阵上对应位置的取值之和,然后根据计算的结果对待处理的多维数据进行分类。进一步,所述步骤S1,其包括:S11、构建待处理的多维数据的训练样本集;S12、将构建的训练样本集中的每列数据标准化到足以描述计算精度的空间;S13、分别对构建的训练样本集中的每一类数据样本,在维度上两两进行正交投影,得到个二维正交投影矩阵,其中,k为构建的训练样本集的类别,n为构建的训练样本集的维数。进一步,所述步骤S13,其包括:S131、创建个二维矩阵来描述k类n维数据集中的所有二维坐标平面;S132、将构建的训练样本集中的所有数据逐类投影至步骤S131所创建的二维坐标平面,并使相应的二维矩阵上的元素值自加1,最终得到个二维正交投影矩阵。进一步,所述步骤S2,其具体为:对每个二维正交投影矩阵依次进行归一化处理,得到处理后的二维正交投影矩阵,所述归一化处理的计算公式为:m′ij=θmijmaxp,]]>其中,θ为设定的权值调整参数,mij为归一化处理前二维正交投影矩阵中第i行第j列元素的值,maxp为第p类的个矩阵中元素的最大值,p=1,2,…,k;m′ij为处理后的二维正交投影矩阵中第i行第j列元素的值。进一步,所述步骤S3,其具体为:采用IIR滤波法、FIR滤波法、FFT法、小波变换法、方框模糊算法和高斯模糊算法中的任意一种模糊算法对归一化处理后的二维正交投影矩阵进行模糊处理,得到模糊处理后的二维正交投影矩阵。进一步,所述高斯模糊算法中标准差参数σ的取值为:其中,ρh为归一化处理后的二维正交投影矩阵中的最高矩阵像素密度,ρl为归一化处理后的二维正交投影矩阵中的最低矩阵像素密度,矩阵像素密度为在十分之一矩阵大小的方框内所拥有的像素数。进一步,所述步骤S4,其包括:S41、输入待处理的数据;S42、在模糊处理后的每个类的个二维正交投影矩阵中,分别读取待处理的多维数据在各个二维正交投影矩阵对应位置的取值;S43、分别计算待处理的多维数据在每个类中所读取的所有取值之和;S44、根据计算的取值之和大小对待处理的多维数据进行分类。进一步,所述步骤S44,其具体为:从待处理的多维数据在k个类上的所有取值之和中找出取值之和最大值所对应的类,然后将待处理的多维数据的类判断为取值之和最大值所对应的类,若待处理的多维数据在k个类上有两个类的所有取值之和相同,则标记为无法判断待处理的多维数据的类或待处理的多维数据的类为异于训练样本集所指定的k个类的新类。本专利技术解决其技术问题所采取的另一技术方案是:一种多维数据的正交投影降维分类系统,包括:正交投影模块,用于构建待处理的多维数据的训练样本集,并对构建的训练样本集进行正交投影,得到相应的多个二维正交投影矩阵;归一化处理模块,用于对每个二维正交投影矩阵依次进行归一化处理,得到归一化处理后的二维正交投影矩阵;模糊处理模块,用于对归一化处理后的二维正交投影矩阵进行模糊处理,得到模糊处理后的二维正交投影矩阵;分类模块,用于计算待处理的多维数据在模糊处理后的二维正交投影矩阵上对应位置的取值之和,然后根据计算的结果对待处理的多维数据进行分类;所述正交投影模块的输出端依次通过归一化处理模块和模糊处理模块进而与分类模块的输入端连接。进一步,所述正交投影模块,其包括:构建单元,用于构建待处理的多维数据的训练样本集;标准化单元,用于将构建的训练样本集中的每列数据标准化到足以描述计算精度的空间;正交投影单元,用于分别对构建的训练样本集中的每一类数据样本,在维度上两两进行正交投影,得到个二维正交投影矩阵,其中,k为构建的训练样本集的类别,n为构建的训练样本集的维数;所述构建单元依次通过标准化单元和正交投影单元进而与归一化处理模块的输入端连接。本专利技术的方法的有益效果是:先通过正交投影得到相应的多个正交投影矩阵,然后结合归一化处理和模糊处理对得到的正交投影矩阵进行处理,最后再根据多维数据在二维正交投影矩阵上对应位置的取值之和进行分类,通过正交投影将复杂的多维数据分类问题转化为由多个简单的二维数据分类问题所组成的集合,降低了数据分类的维度,算法复杂低,运算量小,极大提高了分类的运算效率。本专利技术的系统的有益效果是:先通过正交投影模块正交投影得到相应的多个正交投影矩阵,然后结合归一化处理和模糊处理对得到的正交投影矩阵进行处理,最后分类模块再根据多维数据在二维正交投影矩阵上对应位置的取值之和进行分类,通过正交投影将复杂的多维数据分类问题转化为由多个简单的二维数据分类问题所组成的集合,降低了数据分类的维度,算法复杂低,运算量小,极大提高了分类的运算效率。附图说明图1为本专利技术一种多维数据的正交投影降维分类方法的整体流程图;图2为本专利技术的分类算法的样本训练过程的流程图;图3为本专利技术实施的分类算法的样本分类过程的流程图;图4为本专利技术一种多维数据的正交投影降维分类系统的整体结构图。具体实施方式参照图1,一种多维数据的正交投影降维分类方法,包括:S1、构建待处理的多维数据的训练样本集,并对构建的训练样本集进行正交投影,得到相应的多个二维正交投影矩阵;S2、对每个二维正交投影矩阵依次进行归一化处理,得到归一化处理后的二维正交投影矩阵;S3、对归一化处理后的二维正交投影矩阵进行模糊处理,得到模糊处理后的二维正交投影矩阵;S4本文档来自技高网...
一种多维数据的正交投影降维分类方法及系统

【技术保护点】
一种多维数据的正交投影降维分类方法,其特征在于:包括:S1、构建待处理的多维数据的训练样本集,并对构建的训练样本集进行正交投影,得到相应的多个二维正交投影矩阵;S2、对每个二维正交投影矩阵依次进行归一化处理,得到归一化处理后的二维正交投影矩阵;S3、对归一化处理后的二维正交投影矩阵进行模糊处理,得到模糊处理后的二维正交投影矩阵;S4、计算待处理的多维数据在模糊处理后的二维正交投影矩阵上对应位置的取值之和,然后根据计算的结果对待处理的多维数据进行分类。

【技术特征摘要】
1.一种多维数据的正交投影降维分类方法,其特征在于:包括:
S1、构建待处理的多维数据的训练样本集,并对构建的训练样本集进行正交投影,得到
相应的多个二维正交投影矩阵;
S2、对每个二维正交投影矩阵依次进行归一化处理,得到归一化处理后的二维正交投影
矩阵;
S3、对归一化处理后的二维正交投影矩阵进行模糊处理,得到模糊处理后的二维正交投
影矩阵;
S4、计算待处理的多维数据在模糊处理后的二维正交投影矩阵上对应位置的取值之和,
然后根据计算的结果对待处理的多维数据进行分类。
2.根据权利要求1所述的一种多维数据的正交投影降维分类方法,其特征在于:所述步骤
S1,其包括:
S11、构建待处理的多维数据的训练样本集;
S12、将构建的训练样本集中的每列数据标准化到足以描述计算精度的空间;
S13、分别对构建的训练样本集中的每一类数据样本,在维度上两两进行正交投影,得到
个二维正交投影矩阵,其中,k为构建的训练样本集的类别,n为构建的训练样本集的
维数。
3.根据权利要求2所述的一种多维数据的正交投影降维分类方法,其特征在于:所述步骤
S13,其包括:
S131、创建个二维矩阵来描述k类n维数据集中的所有二维坐标平面;
S132、将构建的训练样本集中的所有数据逐类投影至步骤S131所创建的二维坐标平面,
并使相应的二维矩阵上的元素值自加1,最终得到个二维正交投影矩阵。
4.根据权利要求2所述的一种多维数据的正交投影降维分类方法,其特征在于:所述步骤
S2,其具体为:
对每个二维正交投影矩阵依次进行归一化处理,得到处理后的二维正交投影矩阵,所述
归一化处理的计算公式为:
m′ij=θmijmaxp,]]>其中,θ为设定的权值调整参数,mij为归一化处理前二维正交投影矩阵中第i行第j
列元素的值,maxp为第p类的个矩阵中元素的最大值,p=1,2,…,k;m′ij为处理后的

\t二维正交投影矩阵中第i行第j列元素的值。
5.根据权利要求2所述的一种多维数据的正交投影降维分类方法,其特征在于:所述步骤
S3,其具体为:
采用IIR滤波法、FIR滤波法、FFT法、小波变换法、方框模糊算法和高斯模糊算法中的
任意一种模糊算法对归一化处理后的二维正交投影矩阵进行模糊处理,得到模糊处理后的二
维正交投影矩阵。
6.根据权利要求5所述的一种多维数据的正交投影降维分类方法,其特征在于:所述高斯
模糊算法中标准差参数σ的取值为:...

【专利技术属性】
技术研发人员:张巍霍颖翔滕少华
申请(专利权)人:广东工业大学
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1