当前位置: 首页 > 专利查询>重庆大学专利>正文

一种基于包络旋转森林的数据集成分类方法技术

技术编号:41185587 阅读:13 留言:0更新日期:2024-05-07 22:18
本申请提供一种基于包络旋转森林的数据集成分类方法,用于解决现有技术中现有的集成分类方法基于原始样本空间重采样构建的样本子集信息重叠度高,多样性有限,难以进一步提高准确率的问题。具体步骤为:S1:将原始数据集D<subgt;o</subgt;=[X<subgt;o</subgt;,Y<subgt;o</subgt;]输入包络样本变换机制模型ESTM中获得L层的包络样本集E={E<subgt;1</subgt;,E<subgt;2</subgt;,…,E<subgt;L</subgt;},其中:X<subgt;o</subgt;为原始样本数据集合X<subgt;o</subgt;∈R<supgt;m×d</supgt;,m为样本数量,d为样本特征维度,Y<subgt;o</subgt;为原始数据集的标签,L为包络样本空间层数;S2:将包络样本集E={E<subgt;1</subgt;,E<subgt;2</subgt;,…,E<subgt;L</subgt;}输入二维基分类器矩阵生成与融合机制模型2D_BCMG&FM中得到最终分类结果。本申请通过设置包络样本变换机制模型ESTM和二维基分类器矩阵生成与融合机制模型2D_BCMG&FM进一步提高了数据分类的准确度。

【技术实现步骤摘要】

本专利技术涉及数据分类领域,特别是一种基于包络旋转森林的数据集成分类方法


技术介绍

1、集成学习是提高机器学习模型性能的有效方法之一,它以某种方式建立并组合一系列基分类器。在准确性和鲁棒性方面,它通常比单一分类器表现得更好。因此,集成学习方法被广泛用于解决各种问题,如图像分类或分割、人脸识别、不平衡问题、医疗信息处理等。尤其通过机器学习方法对采集的慢性疾病相关数据进行特征挖掘与分类建模,可以实现高效准确地慢性病检测方式,有着广泛的应用前景。目前存在多种集成分类方法,如随机森林、随机子空间、旋转森林、bagging、adaboost等。

2、现有的集成分类模型主要基于原始样本,没有考虑跳出原始空间模式,在新的样本空间中进行集成学习。基于原始样本空间重采样构建的样本子集信息重叠度高,多样性有限,难以进一步提高准确率。


技术实现思路

1、本专利技术的目的就是提供一种基于包络旋转森林的数据集成分类方法。用于解决现有技术中现有的集成分类方法基于原始样本空间重采样构建的样本子集信息重叠度高,多样性有限,难以本文档来自技高网...

【技术保护点】

1.一种基于包络旋转森林的数据集成分类方法,其特征在于,具体步骤为:

2.根据权利要求1所述的一种基于包络旋转森林的数据集成分类方法,其特征在于,所述包络样本变换机制模型ESTM包括多层迭代均值聚类子模型MIMC和层间一致性机制子模型ICM;

3.根据权利要求2所述的一种基于包络旋转森林的数据集成分类方法,其特征在于,步骤S1中获得L层的包络样本集E={E1,E2,...,EL}的具体步骤为:

4.根据权利要求3所述的一种基于包络旋转森林的数据集成分类方法,其特征在于,步骤S1.1中更新样本集的具体方法为:

5.根据权利要求3所述的一种基于...

【技术特征摘要】

1.一种基于包络旋转森林的数据集成分类方法,其特征在于,具体步骤为:

2.根据权利要求1所述的一种基于包络旋转森林的数据集成分类方法,其特征在于,所述包络样本变换机制模型estm包括多层迭代均值聚类子模型mimc和层间一致性机制子模型icm;

3.根据权利要求2所述的一种基于包络旋转森林的数据集成分类方法,其特征在于,步骤s1中获得l层的包络样本集e={e1,e2,...,el}的具体步骤为:

4.根据权利要求3所述的一种基于包络旋转森林的数据集成分类方法,其特征在于,步骤s1.1中更新样本集的具体方法为:

5.根据权利要求3所述的一种基于包络旋转森林的数据集成分类方法,其特征在于,步骤s1.3中层间一致性机制子模型icm的目标函数为:

6.根...

【专利技术属性】
技术研发人员:李勇明程欢王品马洁黄智勇
申请(专利权)人:重庆大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1