【技术实现步骤摘要】
本专利技术属于环境监测领域,更具体的说涉及一种基于机器学习的二氧化碳浓度预测方法。
技术介绍
1、在二氧化碳浓度预测中,传统随机森林模型基于信息增益进行决策树分裂时,默认将所有特征视为平等维度,未考虑不同特征对二氧化碳浓度的影响差异。例如温度与二氧化碳浓度可能存在强相关性,而与水平能见度的关联度相对较弱,但传统信息增益无法直接体现这种重要性差异,导致模型在分裂时可能选择非优特征进行分裂,削弱模型对关键信息的捕捉能力。因此,引入加权信息增益至关重要,其核心优势在于通过为不同特征赋予差异化权重,使模型在分裂时优先选择对二氧化碳浓度影响更关键的特征,强化对关键信息的捕捉能力,避免高维冗余特征导致的分裂偏差,从根本上提升模型对二氧化碳浓度的预测精度。
2、要实现加权信息增益,权重的计算逻辑便成为核心。传统方法中,皮尔逊相关系数虽能衡量特征与二氧化碳浓度的线性相关性,却无法捕捉特征与预测值之间的非线性关系(如高温抑制光合作用)等。而shap值作为基于合作博弈论的可解释性工具,能精准量化特征在模型预测中的非线性贡献。因此,将线性相关性(
...【技术保护点】
1.一种基于机器学习的二氧化碳浓度预测方法,其特征在于:所述的方法包括:
2.根据权利要求1所述的一种基于机器学习的二氧化碳浓度预测方法,其特征在于:计算皮尔逊相关系数时,仅计算各个气象要素特征与二氧化碳浓度之间的相关系数,特征之间的相关性不进行计算,从而使相关系数计算更加聚焦于特征与预测目标之间的直接关联,简化计算流程并提高权重分配的针对性。
3.根据权利要求1所述的一种基于机器学习的二氧化碳浓度预测方法,其特征在于:线性权重通过对各特征与二氧化碳浓度的相关性强弱进行归一化确定,非线性权重通过对各特征SHAP值大小进行归一化确定,最终混合权重
...【技术特征摘要】
1.一种基于机器学习的二氧化碳浓度预测方法,其特征在于:所述的方法包括:
2.根据权利要求1所述的一种基于机器学习的二氧化碳浓度预测方法,其特征在于:计算皮尔逊相关系数时,仅计算各个气象要素特征与二氧化碳浓度之间的相关系数,特征之间的相关性不进行计算,从而使相关系数计算更加聚焦于特征与预测目标之间的直接关联,简化计算流程并提高权重分配的针对性。
3.根据权利要求1所述的一种基于机器学习的二氧化碳浓度预测方法,其特征在于:线性权重通过对各特征与二氧化碳浓度的相关性强弱进行归一化确定,非线性权重通过对各特征shap值大小进行归一化确定,最终混合权重通过设定一个权重融合比例,将线性权重与非线性权重加权融合。
4.根据权利要求1所述的一种基于机器学习的二氧化碳浓度预测方法,其特征在于:所采集的气象要素数据包含温度、相对湿度、风速、气压基本气象变量,且采集时间与二氧化碳观测时间严格一致,以确保特征数据与预测标签在时间和空间上的完全对应。
5.根据权利要求1所述的一种基于...
【专利技术属性】
技术研发人员:马芳,张国兴,黄尽染,袁玉,罗晋,邓吉波,杨卫洁,邓健,
申请(专利权)人:云南省大气探测技术保障中心,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。