【技术实现步骤摘要】
基于机器学习的碳排放量预测模型的训练方法及装置
[0001]本申请涉及碳排放量预测
,具体而言,涉及一种基于机器学习的碳排放量预测模型的训练方法及装置。
技术介绍
[0002]随着全球经济和人口的增长,环境问题变得越来越严重。其中,碳排放问题是环境问题的重要组成部分之一。为了有效控制和减少碳排放量,科学家和政府部门需要对碳排放量进行准确的预测和分析,以制定相应的环境政策和行动计划。机器学习作为一种新兴的技术手段,具有自动化、高效率、可靠性等优点,因此在环境保护领域得到了广泛的应用。机器学习技术可以通过处理大量的历史数据,从中学习到环境数据的内在规律和趋势,进而进行精准的预测和分析。在碳排放量预测方面,机器学习技术可以通过构建碳排放量预测模型,对未来碳排放量进行预测。同时,机器学习技术还可以对碳排放量进行分析,找出对碳排放量影响最大的因素,为制定环境政策和行动计划提供科学依据。
[0003]传统的碳排放量预测方法基于历史排放数据,首先进行二氧化碳排放量历史数据的变化趋势分析,然后推测未来二氧化碳排放量的变化,推测 ...
【技术保护点】
【技术特征摘要】
1.一种基于机器学习的碳排放量预测模型的训练方法,其特征在于,所述方法包括:获取包括各企业与碳排放量相关的初始企业训练样本和相应标签数据的多个初始训练集;所述初始企业训练样本为包括企业经营数据、企业生产数据、企业工艺数据和企业周围环境数据的历史企业数据;所述初始企业训练样本包括样本数量大于第一数量的多数类初始样本和样本数量小于第一数量的少数类初始样本;针对任一初始训练集,基于所述初始训练集中的各少数类初始样本,以及各少数类初始样本分别与各多数类初始样本间的欧氏距离,获取当前训练集;以及,基于预设的图卷积网络,对所述当前训练集中的各企业训练样本进行特征提取,得到所述当前训练集对应的图特征向量;所述图卷积网络的输入层包括预先引入与碳排放相关的先验知识;采用预设的损失函数,将不同当前训练集对应的图特征向量输入待训练的多层神经网络分类器进行训练,得到训练完成的多任务预测模型,所述多任务预测模型用于预测碳排放量的任务和与所述预测碳排放量相关的环境指标的任务。2.如权利要求1所述的方法,其特征在于,基于所述初始训练集中的各少数类初始样本以及各少数类初始样本分别与各多数类初始样本间的欧氏距离,获取当前训练集,包括:针对任一少数类初始样本,计算所述少数类初始样本与其相邻的第二数量个多数类初始样本间的欧氏距离;基于预设随机森林分类器对所述初始训练集进行分类得到的各初始企业训练样本的分类准确率,以及所述少数类初始样本的权重因子,确定样本调节系数,所述权重因子是基于所述第二数量个的欧氏距离确定的;基于所述少数类初始样本、所述第二数量个欧氏距离和所述样本调节系数,生成所述少数类初始样本对应的少数类新样本;利用模糊聚类算法,对少数类初始样本、少数类新样本和多数类样本进行聚类,确定不同聚集类的聚类中心和聚类半径;基于不同聚集类的聚类中心和聚类半径,获取当前训练集。3.如权利要求2所述的方法,其特征在于,基于不同聚集类的聚类中心和聚类半径,获取当前训练集,包括:基于不同聚集类的聚类中心和聚类半径,获取新训练集;对所述新训练集中的各企业训练样本进行最大最小归一化;归一化后的企业训练样本进行冗余数据和异常值的去除,得到当前训练集。4.如权利要求1所述的方法,其特征在于,基于预设的图卷积网络,对所述当前训练集中的各企业训练样本进行特征提取,得到所述当前训练集对应的图特征向量,包括:以所述当前训练集中的各企业训练样本作为节点,以各企业训练样本间的相似度作为节点关系,确定所述当前训练集对应的图数据;将所述图数据输入预设的图卷积网络,所述图卷积网络基于所述节点关系的连接强度,确定各企业训练样本的样本权重,之后,采用自注意力机制,对所述各企业训练样本和相应样本权重进行加权聚合,得到所述当前训练集对应的图特征向量。5.如权利要求1所述的方法,其特征在于,采用预设的损失函数,将不同当前训练集对应的图特征向量输入待训练的多层神经网络分类器进行训练,得到训练完成的多任务预测
模型,包括:针对任一迭代,采用预设的损失函数,对多层神经网络分类器输出的各当前训练集对应的多任务预测值与所述标签数据的真实值进行计算,得到当前迭代的梯度;采用预设学习率调整算法,基于所述当前迭代的梯度,对当前迭代的学习率进行动态调整,得到新学习率和所述新学习率对应的模型参数,并进行下一迭代,直到达到预设的迭...
【专利技术属性】
技术研发人员:宫玉柱,李勉允,刘川,涂磊,常苏,周泉,李维虎,牛常宁,刘鑫源,
申请(专利权)人:华能山东发电有限公司众泰电厂,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。