一种粒子群优化XGBoost算法的煤矸识别方法技术

技术编号：29704765 阅读：18 留言：0更新日期：2021-08-17 14:33

本发明专利技术提供了一种粒子群优化XGBoost算法的煤矸识别方法，属于煤矸识别领域，包括：采集煤和矸石的多光谱图像信息，并进行预处理；对采集到的煤和矸石多光谱图像进行样本划分，按照7:3比例将预处理后的煤和矸石多光谱图像随机划分为独立的训练集和测试集，并对样本设定标签；对训练集和测试集中的煤和矸石多光谱图像进行特征提取；利用提取到的多光谱图像特征搭建基于XGBoost算法的煤矸识别模型，在训练集上训练所述煤矸识别模型，通过粒子群优化算法进行XGBoost算法的参数优化；通过测试集来检验煤矸识别模型对煤和矸石的分类准确率，验证模型性能。该方法采用的XGBoost模型识别准确率，可解释性强，不易产生过拟合，可以得到良好的分类效果。

全部详细技术资料下载

【技术实现步骤摘要】
一种粒子群优化XGBoost算法的煤矸识别方法
本专利技术属于煤矸识别
，具体涉及一种粒子群优化XGBoost算法的煤矸识别方法。
技术介绍
煤炭长久以来就是我国的第一能源，在煤炭的开采挖掘过程中，没有经过任何处理的煤炭叫做原煤，原煤中含有大量矸石，矸石的含硫量高，且含有大量的重金属，矸石发热值低，与煤混合后，影响煤的发热量，影响煤炭质量，而且在燃烧过程中会对环境造成污染。而中国一直大力发展洁净煤技术，煤矸分选就是一个重要的步骤。煤与矸石的分选方法主要有人工排矸，跳汰选煤，浮游选煤，选择性破碎，重介质选煤以及射线探测识别选煤等，但这些方法普遍存在识别精度低，占地空间大，投资成本高，环境污染严重等问题。本申请提供了一种多光谱结合粒子群优化XGBoost算法的识别方法，XGBoost是基于梯度提升决策树算法提出的一种基于梯度提升集成学习算法，原理是通过对多个弱分类器进行集成，经过多次迭代得到更加准确的分类效果。XGBoost有很多优点：速度快、效果好、能处理大规模数据、使用二阶导数，损失更精确，还支持自定义损失函数。粒子群优化算法是一种进化计算技术。基本思想是通过群体中个体之间的协作和信息共享来寻找最优解。优点是具有相当快的逼近最优解的速度，简单易实现，参数设置少，可以有效的对系统的参数进行优化。采用粒子群优化XGBoost算法构建煤矸识别模型，是一种有效的识别方法。在国内外选煤技术中，除了人工选矸之外，自动选矸(煤)技术可根据是否利用水资源，分为湿法选矸和干法选矸。湿法选矸需要消耗大量的水资源，同...

【技术保护点】
1.一种粒子群优化XGBoost算法的煤矸识别方法，其特征在于，包括以下步骤：/n采集煤和矸石的多光谱图像信息，并进行预处理；/n对采集到的煤和矸石多光谱图像进行样本划分，按照7:3比例将预处理后的煤和矸石多光谱图像随机划分为独立的训练集和测试集，并对样本设定标签，煤的标签为1，矸石标签为0；/n对训练集和测试集中的煤和矸石多光谱图像进行特征提取；/n利用提取到的多光谱图像特征搭建基于XGBoost算法的煤矸识别模型，在训练集上训练所述煤矸识别模型，通过粒子群优化算法进行XGBoost算法的参数优化；/n通过测试集来检验煤矸识别模型对煤和矸石的分类准确率，验证模型性能。/n

【技术特征摘要】
1.一种粒子群优化XGBoost算法的煤矸识别方法，其特征在于，包括以下步骤：
采集煤和矸石的多光谱图像信息，并进行预处理；
对采集到的煤和矸石多光谱图像进行样本划分，按照7:3比例将预处理后的煤和矸石多光谱图像随机划分为独立的训练集和测试集，并对样本设定标签，煤的标签为1，矸石标签为0；
对训练集和测试集中的煤和矸石多光谱图像进行特征提取；
利用提取到的多光谱图像特征搭建基于XGBoost算法的煤矸识别模型，在训练集上训练所述煤矸识别模型，通过粒子群优化算法进行XGBoost算法的参数优化；
通过测试集来检验煤矸识别模型对煤和矸石的分类准确率，验证模型性能。

2.根据权利要求1所述的粒子群优化XGBoost算法的煤矸识别方法，其特征在于，利用多光谱图像采集系统对煤和矸石的多个样本进行多光谱图像的采集，得到煤和矸石的多光谱图像。

3.根据权利要求1所述的粒子群优化XGBoost算法的煤矸识别方法，其特征在于，对所述煤矸识别模型进行训练，包括：
对给定的具有N个样本M个特征的训练样本集D＝{(xi,yi)}(i＝1,2,…,N,xi∈RM,yi∈R)，经过XGBoost模型训练，最终得到一个由K个CART决策树相加的集成模型：

是XGBoost模型的输出，F＝{f(x)＝wq(x)}(q:RM→T,w∈RT)为模型中所有CART决策树的集合，f表示一棵具体的CART树；每一个决策树函数fk对应一个特有的树结构q以及对应的叶节点权重向量w；对于一个样本，XGBoost模型获取最终的预测值的过程为：在每一棵决策树上将该样本映射到对应的叶节点上，再将该样本对应的K个叶节点的权重相加；机器学习模型均会定义损失函数，用于衡量模型的预测值与真实值之间的偏差；
XGBoost模型的损失函数为：

该式包含两部分，第一部分是训练损失函数，第二部分是正则项；
在XGBoost算法中，训练是以树模型迭代增加的方式进行的，即训练过程中的每一步，增加一个CART决策树函数f，使得损失函数进一步减小；经过多次迭代后，在第t步，添加了一棵最优的CART树ft，即使得损失函数最小的那棵CART树，损失函数变为：

为选取树结构ft的标准即使得损失函数L(t)的...

【专利技术属性】
技术研发人员：周孟然，闫鹏程，胡锋，来文豪，卞凯，
申请(专利权)人：安徽理工大学，
类型：发明
国别省市：安徽;34

全部详细技术资料下载我是这个专利的主人