【技术实现步骤摘要】
一种基于嵌套式集成深度支持向量机的小样本多分类方法本申请得到了国家自然科学基金项目No.61501326、No.61971310的资助。
本专利技术涉及一种小样本情况下数据挖掘的技术,该方法结合嵌套式集成分类技术思想、深度学习理论和支持向量机在消除过拟合方面的优势,实现了小样本条件下的多类别分类。
技术介绍
随着人工智能技术的飞速发展,深度学习算法在诸如计算机视觉、自然语言处理、语音识别、图像分类与检测等众多领域上均取得了令人瞩目的成绩。但是,这些案例的成功往往依赖于收集到的大量的昂贵的标签数据。这在实际应用场景中存在着一定的困难。进而,如何在小样本条件下进行有效地学习,成为一个重要的研究方向并且已经取得了一些成果。(1)基于数据层面,即数据的扩充。例如:QiH等人提出了一种合成样本的新技术,用于实现多标签小样本分类任务。AlfassyA等人试图在特征空间中组合成对存在的实例,其目的是使合成的特征向量与标签集相对应。(2)基于度量学习方案,它试图学习具有更好泛化能力的特征表示,以便它仍可以很好地应用到新任务中。LiW ...
【技术保护点】
1.一种基于嵌套式集成深度支持向量机的小样本多分类方法,其特征在于它是将三个不同单核函数的深度支持向量机,Deep Support Vector Machine,DSVM算法作为子分类器来构建基分类器;将使用“一对其余”策略将多类别分类问题转换为多个二分类问题;通过AdaBoost框架来完成多分类任务,主要包括:/n(1)子分类器权重的计算/n设
【技术特征摘要】
1.一种基于嵌套式集成深度支持向量机的小样本多分类方法,其特征在于它是将三个不同单核函数的深度支持向量机,DeepSupportVectorMachine,DSVM算法作为子分类器来构建基分类器;将使用“一对其余”策略将多类别分类问题转换为多个二分类问题;通过AdaBoost框架来完成多分类任务,主要包括:
(1)子分类器权重的计算
设是数据集,是数据集中元素的个数;首先,求取单核函数的权重值,使用相同的训练、测试数据对每个支持向量机SupportVectorMachine,SVM模型进行训练和测试,得到每个SVM模型的相关系数和超平面方程表达式;根据参数值来求取每个测试数据到超平面的几何距离
(1)
其中,为SVM算法中每个样本点引进的一个松弛变量,且为超平面的法向量;
计算测试数据到超平面的距离和:
(2)
计算从所有测试数据到超平面的平均距离
(3)
计算超平面的所有分类正确测试数据的均方误差(MSE):
(4)
其中,表示从测试正确的数据到超平面的距离,为测试正确的数据个数
获得内核函数的权重:<...
【专利技术属性】
技术研发人员:王为,张丽,王志雄,张梦君,
申请(专利权)人:天津师范大学,
类型:发明
国别省市:天津;12
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。