深度特征聚类的高排放移动源污染识别方法及系统技术方案

技术编号:30151401 阅读:34 留言:0更新日期:2021-09-25 14:59
本发明专利技术的一种深度特征聚类的高排放移动源污染识别方法及系统,包括将收集的车辆年检数据和尾气遥测数据预处理;利用随机森林特征选择算法对移动源排放气体中主要成分CO、HC、NO气体浓度产生影响的外部属性进行重要性评估,选择出各污染气体的主要影响特征因素;利用多种聚类算法对特征选择后的数据进行聚类,得到高排放机动车标签;利用深度森林对高排放类别标签数据训练得到自动分类识别模型。本发明专利技术综合考虑外部实际因素对污染检测的影响,对不同的尾气成分筛选出主要影响因素,再分别建模进行识别,有效的提高了预测精度,为有关部门对高排放移动污染源的监测和管控提供有效的技术方法。的技术方法。的技术方法。

【技术实现步骤摘要】
深度特征聚类的高排放移动源污染识别方法及系统


[0001]本专利技术涉及环境监测
,具体涉及一种深度特征聚类的高排放移动源污染识别方法及系统。

技术介绍

[0002]随着我国经济的发展,城市机动车数量不断增多,在国民生活水平提高的同时,这些移动源排放的有害气体对群众健康和环境保护造成损害,特别是高排放移动源。因此,有必要对超量排放有害气体的高排放移动源进行快速的识别,以便有关部门对移动源尾气排放进行高效的管控。
[0003]由于在实际的移动源排气遥感检测工作中,机动车的使用时间、车重、车速、车辆加速度、车长、VSP(机动车比功率)、风速、气温、空气密度、压强、风向等因素都对排放有着一定的影响,而现有的污染物浓度测量方法,只是从污染物本身出发,没有考虑到移动源污染排放检测受到实际因素的影响,造成对移动源污染排放评估不够准确、可靠,给有关部门对移动源污染排放各成分的针对性管控造成困难。

技术实现思路

[0004]本专利技术提出的一种深度特征聚类的高排放移动源污染识别方法及系统,可解决上述技术问题。<br/>[0005]本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种深度特征聚类的高排放移动源污染识别方法,其特征在于,包括以下步骤,S10、收集机动车尾气遥测数据和车检数据;S20、对收集的尾气数据进行预处理;S30、对预处理后的数据,采用随机森林对尾气排放中成分—CO、HC、NO与实际影响因素进行评估,选择出各污染气体的影响特征因素;S40、根据步骤S30得到的影响各污染气体排放浓度的因素,采用聚类算法分别对CO、HC、NO进行聚类,得到高排放移动污染源的类别标签;S50、根据步骤S40得到的高排放移动污染源的类别标签,更新数据集,通过深度森林算法训练得到高排放移动污染源的分类识别模型;S60、利用训练好的高排放移动污染源的分类识别模型对尾气数据进行污染物识别。2.根据权利要求1所述的深度特征聚类的高排放移动源污染识别方法,其特征在于:所述S10收集机动车尾气遥测数据和车检数据,具体包括,(11)从遥测系统采集的数据包括:设备号,检测车辆通过时间,车牌号码,车辆颜色,识别置信度,车辆行驶速度,加速度,车身长度,CO实测浓度,HC实测浓度,NO实测浓度,烟度值,是否动态/静态测量,数据是否有效,是否通过,比功率,烟度值,风速,风向,气温,湿度,大气压;(12)从车检系统采集的数据包括:车牌号码,最大质量,变速器形式,档位数,燃油规格,车辆类型,使用性质,基准质量,驱动方式,驱动轮胎气压,发动机型号,发动机生产企业,发动机排量,是否有催化转化器,排气后处理装置。3.根据权利要求2所述的深度特征聚类的高排放移动源污染识别方法,其特征在于:所述S20对收集的尾气数据进行预处理,具体包括:(21)通过车牌号将遥测数据与车检数据中的不同特征属性合并成全面的尾气数据信息;(22)找出存在缺失值的数据段进行丢弃处理,再借助箱线图原理找出异常值进行丢弃处理,并删除无关属性;无效属性删除后,剩余基准质量,行驶速度,行驶加速度,比功率,风速,风向,气温,湿度,大气压,车身长度,使用年限为相关外部属性。4.根据权利要求3所述的深度特征聚类的高排放移动源污染识别方法,其特征在于:所述S30对预处理后的数据,采用随机森林对尾气排放中成分—CO、HC、NO与实际影响因素进行评估,选择出各污染气体的影响特征因素,具体包括,输入尾气污染物CO、HC、NO分别和相关外部属性特征构成特征选择集合A
i
={a
i0
,a
i1
,a
i2
,

,a
i11
}(1≤i≤3),其中,a
i0
表示污染物特征值,a
ij
(1≤j≤11)表示影响属性特征值,使用随机森林进行特征选择的方法如下:(31)确定输入样本N和特征维数M;(32)对输入样本进行有放回采样,同时对特征M随机采样,利用GINI指数、采用完全分裂的方式构造决策树;(33)重复步骤(32)构建N棵决策树组成随机森林,对于第n棵决策树(1≤n≤N),利用其袋外数据(outofbag,OOB)计算袋外数据误差,记为E
n1
;(34)随机对袋外数据OOB所有样本的特征x
i
加入噪声干扰值,再次计算袋外数据误差,记为E
n2

(35)特征x
i
的重要性评分VIM
i
计算方式如下:(36)计算出M个特征各自的重要性评分和平均值α(1/M),选取VIM&gt;α的特征作为特定影响特征。5.根据权利要求4所述的深度特征聚类的高排放移动源污染识别方法,其特征在于:所述S40、根据步骤S30得到的影响各污染气体排放浓度的因素,采用聚类算法分别对CO、HC、NO进行聚类,得到高排放移动污染源的类别标签,其中,聚类算法采用K

Meanss聚类算法,具体过程如下:(41)输入样本数据集X={x1,x2,

,x
p
,

,x
P
}(1≤p≤P),其中样本点}(1≤p≤P),其中样本点表示实数集,d为样本点维度;(42)随机选取k个簇中心u1,u2,...

【专利技术属性】
技术研发人员:许镇义康宇曹洋王仁军张聪赵振怡刘斌琨裴丽红王瑞宾
申请(专利权)人:合肥综合性国家科学中心人工智能研究院安徽省人工智能实验室
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1