一种极值梯度提升逻辑回归分类预测方法技术

技术编号:20486543 阅读:29 留言:0更新日期:2019-03-02 19:38
一种极值梯度提升逻辑回归分类预测方法,属于大数据分析与智能分类预测领域。通过对样本使用极值梯度提升模型学习之后,将各个样本落在每颗分类与回归树的叶子节点位置进行独热编码组合成新的特征,再与之前的特征结合起来形成组合特征,使得样本的特征增多,组成新的样本。采用逻辑回归法对新样本进行分类预测。融合极值梯度提升与逻辑回归方法;利用极值梯度提升进行特征选择,选择cart树作为基分类器,利用基尼不纯度构成一系列的不相关特征,扩大了特征的维数,将新的特征输入到逻辑回归模型中训练会有更好的预测效果。优点在于,分别利用了极值梯度提升的特征选择和特征扩充的功能,解决了单模型逻辑回归模型预测精度低的问题。

【技术实现步骤摘要】
一种极值梯度提升逻辑回归分类预测方法
本专利技术属于大数据分析与智能分类预测领域,提供了一种极值梯度提升逻辑回归分类预测方法,适用于解决连续或离散的变量,多样本多维离散或连续特征数据的分类与预测,可应用于医疗诊断,故障诊断以及精度预测等领域。
技术介绍
数据处理、分析与特征分类预测广泛应用于各个领域,随着人工智能与机器学习理论与方法的蓬勃发展,基于深度学习的分类预测广泛应用于语音系统,人脸识别和目标检测,并取得了突破性进展。但因基于机器学习的分类预测方法无法满足有限样本的学习,迫切需要新算法新理论的研究与创新。极值梯度提升是由陈天奇提出并封装的一种对数据进行分类与预测的有效集成学习方法之一,由于分类与回归树的基尼分支特性,该集成算法可以不考虑特征之间的相关性,每次选出最优的特征进行分支,极值梯度提升还实现了特征选择的并行化,提高了运行的效率,对样本的随机抽样从一定程度上防止了模型的过拟合问题。但是,极值梯度提升方法不适用于样本特征少且各特征之间的关联性不大的数据的分析,所获预测精度较低。逻辑回归是一种基于概率的分类算法,它是一种广义线性回归算法,是应用非常广泛的一个分类机器学习算法,本文档来自技高网...

【技术保护点】
1.一种极值梯度提升逻辑回归分类预测方法,其特征在于,具体步骤如下:步骤1、将所有样本放入极值梯度提升模型中进行训练,极值梯度提升是由一系列分类与回归树集成的,统计每个样本落在每棵分类与回归树树叶子节点的位置,对于每棵树,对该位置记为1,其余叶子节点记为0,即独热编码;假设有n棵树,每棵树深度为m,则每个样本增加的特征数为:n*2m‑1;步骤2、将步骤1中的特征数据通过极值梯度提升计算每个特征的重要程度;重要程度计算如下:对于每个特征,计算极值梯度提升中所有分类与回归树树每个分支是否选择该特征的总和;这样得到每个特征的重要系数,将重要系数比较低的特征去掉,留下对结果影响相对比较大的特征,提高后...

【技术特征摘要】
1.一种极值梯度提升逻辑回归分类预测方法,其特征在于,具体步骤如下:步骤1、将所有样本放入极值梯度提升模型中进行训练,极值梯度提升是由一系列分类与回归树集成的,统计每个样本落在每棵分类与回归树树叶子节点的位置,对于每棵树,对该位置记为1,其余叶子节点记为0,即独热编码;假设有n棵树,每棵树深度为m,则每个样本增加的特征数为:n*2m-1;步骤2、将步骤1中的特征数据通过极值梯度提升计算每个特征的重要程度;重要程度计算如下:对于每个特征,计算极值梯度提升中所有分类与回归树树每个分支是否选择该特征的总和;这样得到每个特征的重要系数,将重要系数比较低的特征去掉,留下对结果影响相对比较大的特征,提高后续的预测准确率;步骤3、将步骤2中得到的新的数据...

【专利技术属性】
技术研发人员:陈金香范谨麒张云贵
申请(专利权)人:冶金自动化研究设计院
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1