一种基于EEMD-ICA-SVM的数据分类方法技术

技术编号：22944775 阅读：41 留言：0更新日期：2019-12-27 17:12

本发明专利技术涉及基于EEMD‑ICA‑SVM的数据分类方法，属于数据挖掘与机器学习领域，其特征在于采用如下步骤：(1)选取一个数据信号并给数据信号加入高斯白噪声；(2)确定原始数据的局部均值函数和剩余信号；(3)确定IMF分量；(4)确定残余函数；(5)确定集合经验模态分量；(6)建立ICA数学模型；(7)构建SVM分类模型；(8)选择合适的核函数。本发明专利技术克服了小波分解自适应较差和EMD分解的模态混叠与端点效应问题，特征提取更准确，将SVM模型进行非线性变换，模型精简且具有优秀的泛化能力，降低了对数据规模和数据分布的要求，为数据分类领域提供了一种拥有较高分类准确率的方法。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于EEMD-ICA-SVM的数据分类方法
本专利技术涉及机器学习与数据挖掘领域，主要是一种对数据进行分类的方法。
技术介绍
目前针对数据分类问题，大部分算法已经具有良好的分类效果，但是很少考虑到数据类型、模型复杂度等因素的鲁棒性，这严重影响识别准确率。而有的模型精简了算法模型的复杂度，但是其分类结果的准确率较低，效果不佳。经典的机器学习分类任务在研究学习中可以分为两部分：提取数据特征和分类器设计。首先从数据中提取有效的特征，特征向量确定后，还需对特征进行相关性分析，去除信号中的冗余信息。最后输入到有效的分类器中进行分类，确定不同数据类型。然而，在如今高速发展的信息时代，生活中的数据资源处于不断的产生过程中，呈爆炸性趋势快速增长，如何准确高效的提取庞大数据中的有效信息并进行分类显得尤为重要。当前，特征提取技术在图像处理、模式识别和网络入侵检测等方面的运用越来越广泛，在传统分类方法中，对于特征的手动提取相当耗时耗力，且精度要求高。尤其在大数据环境下特征提取的效率已经成为制约快速处理数据能力的瓶颈。关于特征提取的方法...

【技术保护点】
1.本专利技术提出了一种基于EEMD-ICA-SVM的数据分类方法，其特征在于：(1)选取一个数据信号并加入高斯白噪声，(2)确定原始数据的局部均值函数和剩余信号，(3)确定IMF分量，(4)确定残余函数，(5)确定集合经验模态分量，(6)建立ICA数学模型，(7)构建SVM分类模型，(8)选择合适的核函数，具体包括以下八个步骤：/n步骤一：首先选取一个数据信号X(t)，在给这个数据信号加入高斯白噪声s

【技术特征摘要】
1.本发明提出了一种基于EEMD-ICA-SVM的数据分类方法，其特征在于：(1)选取一个数据信号并加入高斯白噪声，(2)确定原始数据的局部均值函数和剩余信号，(3)确定IMF分量，(4)确定残余函数，(5)确定集合经验模态分量，(6)建立ICA数学模型，(7)构建SVM分类模型，(8)选择合适的核函数，具体包括以下八个步骤：
步骤一：首先选取一个数据信号X(t)，在给这个数据信号加入高斯白噪声si(t)，公式表示为；
x(t)＝X(t)+si(t)；
式中，x(t)为下一步待处理数据信号，X(t)为原始数据信号，si(t)为高斯白噪声信号；
步骤二：确定原始数据的局部均值函数m11(t)和剩余信号h11(t)；
计算数据信号x(t)所有的极值点，使用三次样条函数将其拟合到原始数据序列的包络上，计算上下包络的平均值得到局部均值函数m11(t)，将局部均值函数m11(t)从原始振动信号x(t)中分离出来，得到剩余信号h11(t)，即：
h11(t)＝x(t)-m11(t)；
式中，h11(t)表示剩余信号，x(t)表示待处理数据信号，m11(t)表示局部均值函数；
步骤三：确定IMF分量；
重复进行上述处理过程k次，直到h11(t)满足IMF的定义，且获得的平均值趋于零，得到第一个IMF分量c11(t)，它代表信号x(t)的最高频率的分量；
h1k(t)＝h1(k-1)(t)-m1k(t)；
c1(t)＝h1k(t)；
式中，h1k(t)和h1(k-1)(t)分别表示第k和k-1次处理后的剩余信号，m1k(t)表示第k次局部均值函数，c1(t)表示第一个IMF分量；
步骤四：确定残余函数rn(t)；
将c1(t)从x(t)中分离出来，得到第1个去掉高频分量的差值信号r1(t)，重复此步骤n次；
r1(t)＝x(t)-c1(t)；
…
rn(t)＝rn-1(t)-cn(t)；
当cn(t)或rn(t)满足终...

【专利技术属性】
技术研发人员：胡燕祝，王松，
申请(专利权)人：胡燕祝，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人