一种具有知识迁移判别能力的数据分类方法技术

技术编号:34459743 阅读:34 留言:0更新日期:2022-08-06 17:17
本发明专利技术涉及一种具有知识迁移判别能力的数据分类方法,本发明专利技术有效解决了现有分类模型无法针对源域与目标域数据分布不同的情况下进行分类且分类精度较低的问题;解决的技术方案包括:本方案通过设计加权MMD(Weights Maximum Mean Divergence,称为WMMD),提升了系统跨域知识迁移能力,为了区分不同类型数据,引入LDA(Linear Discriminant Analysis),对源域样本和目标域样本进行降维,使降维后的数据具有类内方差最小,类间方差最大,相对于已有的分类模型,提高了分类精度。提高了分类精度。提高了分类精度。

【技术实现步骤摘要】
一种具有知识迁移判别能力的数据分类方法


[0001]本专利技术涉及图像、文本数据分类
,尤其涉及一种具有知识迁移判别能力的数据分类方法。

技术介绍

[0002]近来,机器学习在自动驾驶、语音识别、计算机视觉、目标检测等领域取得很大成功,但是,对于某些真实场景,它仍然有一些限制,构建精确的机器学习模型需要大量不同类型的训练样本,然而在现实中,获取的数据通常是未分类的;
[0003]现有的分类模型如:Softmax回归适用于多分类,具有应用简单、易于训练、结果直观的优点,因此,受到研究人员的更多关注,传统Softmax采用交叉熵损失函数进行优化,但并不能保证得到优化后的特征分布,Softmax分类器理想的应用场景是训练样本与测试样本具有相同的特征分布,然而,在许多情况下,收集满足要求的训练样本通常是耗时的、昂贵的,这使得Softmax模型的分类结果并不令人满意;
[0004]针对训练样本与测试样本不满足相同分布的情况,训练迁移学习是解决上述问题的一种比较有效的方法,然而,现有的迁移学习方法只关注源域(训练样本)和目标域(测试样本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种具有知识迁移判别能力的数据分类方法,其特征在于,包括源域、目标域、特征空间、Softmax分类器、预测结果,其分类过程包括以下步骤:S1:源域样本和目标域样本经特征映射后,在特征空间中可找到它们近似的相同分布;S2:在特征空间中进行WMMD和Linear Discriminant Analysis(LDA)运算,使得具有相同特征的样本与具有不同特征的样本区分开,不同的样本标签对应不同的样本特征;S3:Softmax分类器分别计算目标域中每个样本所对应的每个标签下的概率,选择概率值最大值对应的标签,即为该样本的标签,完成样本分类;S4:预测结果保存目标域样本分类结果,即每个样本对应的标签。2.根据权利要求1所述的一种具有知识迁移判别能力的数据分类方法,其特征在于,所述S1中源域由两部分组成,样本x和样本标签y
x
,源域用表示,目标域中只有样本,用表示,所述特征空间包括WMMD、LDA。3.根据权利要求2所述的一种具有知识迁移判别能力的数据分类方法,其特征在于,构造系统目标函数:J(θ)=J1(θ)+α
·
J2(θ)+β
·
J3(θ)+λ
·
J4(θ)+μ
·
J5(θ)
ꢀꢀꢀꢀꢀꢀꢀ
(1)其中,其中,其中,其中,其中,4.根据权利要求3所述的一种具有知识迁移判别能力的数据分类方法,其特征在于,所述的θ是系统所有项参数,即系统需要通过训练确定的参数;J1(θ)是Softmax回归的代价函数;J2(θ)是基于WMMD计算结果;J3(θ)用于通过条件分布和边沿分布减少Softmax回归概率输出层中,域间的分布差异;J4(θ)是模型参数的稀疏控制项,防止模型出现过拟合现象;J5(θ)是系统中LDA计算项;α,β...

【专利技术属性】
技术研发人员:李兴海马建伟臧绍飞吕进锋马超马晓毓张淼
申请(专利权)人:河南科技大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1