一种基于联合迁移极限学习机的数据分类方法技术

技术编号:34459744 阅读:62 留言:0更新日期:2022-08-06 17:17
本发明专利技术涉及一种基于联合迁移极限学习机的数据分类方法,本发明专利技术有效解决了现有ELM不具备知识迁移能力而导致其分类性能不佳的问题;解决的技术方案包括:首先,对数据集样本进行预处理;其次,在ELM中引入跨领域均值逼近(CDMA),得到一个具有迁移能力的极限学习机,有效地最小化两个域的边际和条件分布差异;然后,构造另一个具有输出权重对齐和参数逼近的ELM模型。应用子空间对齐技术来对齐两个领域的输出权重,同时添加近似项来逼近输出权重,促进知识迁移;最后,用两个学习过的ELM对目标样本进行分类预测。样本进行分类预测。样本进行分类预测。

【技术实现步骤摘要】
一种基于联合迁移极限学习机的数据分类方法


[0001]本专利技术涉及机器学习
,尤其涉及一种基于联合迁移极限学习机的数据分类方法。

技术介绍

[0002]极限学习机(ELM)因其具有学习速度快和泛化性能好的优点,广泛应用在模式识别、计算科学和机器学习等方面,由于ELM无需调整输入权重和偏置,只需通过求解最小二乘来优化输出权重,因此,它在工业故障诊断、医学诊断、高光谱图像分类、人脸识别和脑机接口等领域受到广泛关注;
[0003]然而,与传统的机器学习模型一样,ELM通常需要训练样本与测试样本遵循相同分布才能获得良好精度,当在训练样本不足的情况下其性能衰退并且效果不佳,而且收集相同分布训练样本通常情况下是耗时的、昂贵的,这导致ELM模型的分类结果并不令人满意,迁移学习可以解决ELM的上述不足,它通过借助与目标域(测试样本)存在分布差异但相关的其他领域丰富标记数据样本作为训练样本(源域),学习可靠的机器学习模型,对当前目标域(测试样本)进行预测;
[0004]当前,许多学者设计了诸多结合迁移学习的极限学习机模
...

【技术保护点】

【技术特征摘要】
1.一种基于联合迁移极限学习机的数据分类方法,其特征在于,包括以下步骤:S1:对源域和目标域样本数据分别进行预处理,获取源域和目标域数据集和S2:分别采用源域和目标域数据集D
S
与D
T
构建CDMA度量并加入到极限学习机隐含层进行模型训练,构造带CDMA的ELM模型,并用D
S
与D
T
计算迁移极限学习机ELM

CDMA的模型参数β1;S3:构造具有输出权重对齐和参数逼近的ELM模型,通过对齐β1和目标域输出权重β
T
,使得源域和目标域间的输出权重在跨领域知识迁移过程中彼此靠近,同时得到β1向目标域对齐后的中间权重β
temp
;借助β
temp
,并通过源域经验风险误差和领域间输出权重逼近正则项,构建新的迁移极限学习机模型目标函数,并获取其输出权重β2;S4:采用β1与β2对所述目标域数据集D
T
进行标签预测,并得到其标签S5:循环执行步骤S1

S4直到不再改变,输出预测结果2.根据权利要求1所述的一种基于联合迁移极限学习机的数据分类方法,其特征在于,所述S1中对源域和目标域样本数据进行预处理包括以下步骤:S1

1:源域用符号表示,x
Si
表示源域样本,y
Si
表示源域样本对应的标签,n
S
是源域样本数量;S1

2:目标域用符号应的标签,n
T
是目标域样本数量;S1

3:将D
S0
与D
T0
分别进行归一化处理,得到D
S
与D
T
。3.根据权利要求1所述的一种基于联合迁移极限学习机的数据分类方法,其特征在于,所述S2中构造带CDMA的ELM模型构造过程包括以下步骤:S2

1:结合激活函数将D
S
和D
T
映射为H
S
和H
T
;S2

2:假定带有N个样本x
i
和相应标签y
i
的标记数据集构建具有L个隐藏层节点的经典ELM模型,如下:ELM根据输入样本的x
i
输出o
i
,w
j
和b
j
是输入权重和偏差,β是输出权重的向量表示,如果我们想要一个最优的β,则解以下损失函数:其中,||β||2是避免模型过拟合的参数稀疏约束。我们将式(2)转换为矩阵形式:
其中,H=[g(x
...

【专利技术属性】
技术研发人员:臧绍飞马建伟马晓毓李兴海吕进锋马超
申请(专利权)人:河南科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1