一种基于动态阈值的工业企业碳画像分级方法技术

技术编号:39315410 阅读:10 留言:0更新日期:2023-11-12 15:58
本发明专利技术公开了一种基于动态阈值的工业企业碳画像分级方法,包括:获取工业企业碳排放数据;对工业企业碳排放数据进行预处理;根据预处理后的工业企业碳排放数据所属季节与企业所属行业构建训练输入矩阵;构建集成学习分层架构算法模型,将训练输入矩阵输入至集成学习分层架构算法模型中,进行动态阈值训练,得到训练后的模型;将工业企业碳排放数据输入至训练后的模型中,进行碳画像分级。本发明专利技术基于动态阈值与集成学习模型的工业企业碳画像分级方法能够有效地提高工业界碳排放分级的准确性与速度,辅助于碳分析、碳决策和碳管理,进一步实现节能减排目的。一步实现节能减排目的。一步实现节能减排目的。

【技术实现步骤摘要】
一种基于动态阈值的工业企业碳画像分级方法


[0001]本专利技术涉及节能
,特别涉及一种基于动态阈值的工业企业碳画像分级方法。

技术介绍

[0002]近些年来,我国经济快速发展,不同产业体系逐渐成型,随之而来的碳排放也将不断增加、扩大。随着政府的“碳达峰”、“碳中和”的提出,推动产业结构优化升级,促进高能耗行业和领域减碳迫在眉睫。在此背景下,对产业内企业的碳排放数据进行分级分类显得尤为重要,这有助于分析碳排放量的驱动因素以及碳管理效率的影响因素,为企业和管理部门提供减排决策的客观参考。企业的碳排放数据实质上属于时序数据,这类数据具有强烈的周期性、季节性,带有一定量的噪声等特点,对于企业碳数据的分类实际上就是对于这类时序数据进行分类。
[0003]随着越来越多的产业、企业需要碳效率评估与等级划分,以及行业碳排放水平日新月异。传统的人工分类方法难以快速动态地制定分类指标,存在准确性低、滞后于行业等,指标死板缺点,不能根据不同行业和企业的特点和需求来制定合适的分类标准。因此,需要寻找一种更高效、更智能、更灵活的时序数据分类方法来解决企业碳画像的分级分类问题。

技术实现思路

[0004]本专利技术的目的是提供一种基于动态阈值的工业企业碳画像分级方法,用于实现快速和灵活的进行企业碳画像的分级分类的目的。
[0005]为了实现以上目的,本专利技术通过以下技术方案实现:
[0006]一种基于动态阈值的工业企业碳画像分级方法,包括:步骤S1、获取工业企业碳排放数据。步骤S2、对所述工业企业碳排放数据进行预处理;根据预处理后的所述工业企业碳排放数据所属季节与企业所属行业构建训练输入矩阵。步骤S3、构建集成学习分层架构算法模型,将所述训练输入矩阵输入至所述集成学习分层架构算法模型中,进行动态阈值训练,得到训练后的模型。步骤S4、将待分级的工业企业碳排放数据输入至所述训练后的模型中,进行碳画像分级。
[0007]可选地,所述步骤S1包括:所述工业企业碳排放数据分为不同行业的企业数据,一个企业数据中有不同季度每日的碳数据量。
[0008]可选地,所述步骤S2中对所述工业企业碳数据做预处理包括:对所述工业企业碳数据进行缺失值填充,异常检测与处理和标准化处理。
[0009]可选地,所述步骤S2包括:对于缺失值填充和异常检测处理后的工业企业碳数据进行聚合、拆分,整合成
[0010]其中,i表示某一家企业,j表示某个数据的季节,k表示某个季节中某一天的数据,x
i,j,k
表示企业i,季节j中k天的单个数据;
[0011]对于整合后的工业企业碳数据进行Z

Score标准化:
[0012][0013]其中,x

是经过Z

Score标准化后的值,x表示单个数据的取值,μ表示对应列的均值,σ表示对应列的标准差。
[0014]可选地,所述步骤S2还包括:使用独热码编码,将季节特征和企业行业特征分别转换为两个特征向量;将两个特征向量合并至每个企业每个季节的数据,构建成为训练输入矩阵:
[0015][0016]其中,e为企业所属行业编码,f为数据所属季节编码,x为某企业某季节碳排放量单个数据,i表示某一家企业,j表示某个数据的季节,k表示某个季节中某一天的数据;
[0017]每一行数据都带有碳效率标签,标签分为三个等级,分别为高、中、低。
[0018]可选地,所述步骤S3包括:建立集成学习分层架构,所述集成学习分层架构包括:动态阈值分配器,分别与所述动态阈值分配器连接的四个不同域的基分类器模块。四个基分类器模块分别为基于字典的分类模块、区间森林分类模块、基于形状变换的分类模块和随机卷积核变换分类模块。
[0019]所述基于字典的分类模块用于处理所述工业企业碳数据中的词汇频率特征,它使用不同长度的滑动窗口来提取时间序列中的词,并将它们编码为符号表示;然后,它使用一些统计量来度量每个词在每个类别中出现的频率。
[0020]所述区间森林分类模块用于处理所述工业企业碳数据中的区间特征,它使用不同长度和位置的区间来提取时间序列中的特征,并将它们转换为多种数据表示。所述随机卷积核变换分类模块用于处理所述工业企业碳数据中的全局特征。所述基于形状变换的分类模块用于处理所述工业企业碳数据中的局部模式,提取时间序列中的局部模式,并用这些局部模式来构建一个随机森林分类器,以对测试数据进行分类。所述动态阈值分配器的权重在训练阶段动态调整,在分类定级阶段时使用这个权重来加权基分类器的概率估计,并用投票法来决定最终的类别。将所述训练输入矩阵输入至集成学习分层架构中,通过训练,得到训练后的模型。
[0021]可选地,所述步骤S4包括:向训练后的模型中输入预处理后的工业企业碳排放数据,得到分类分级结果,每一个企业的每一个季度的碳数据得到一个碳画像标签,标签分为三个等级,标志着碳排放比重,分别为高、中、低。
[0022]可选地,对于每个基分类器模块,它使用交叉验证在训练数据上估计其准确度,并用指数函数将其转换为一个权重,公式为:
[0023]w
i
=exp(α
·
a
i
)
[0024]其中,w
i
是第i个基分类器的权重,a
i
是第i个基分类器的交叉验证准确度,α是一个超数,用于控制权重的分布;
[0025]然后,使用这个权重来加权基分类器的概率估计,并用投票法来决定最终的类别,加权投票的公式为:
[0026][0027]p
c
是类别c的最终概率估计,k是基分类器的数量,w
i
是第i个基分类器的权重,p
i,c
是第i个基分类器对类别c的概率估计。
[0028]另一方面,本专利技术还提供一种电子设备,包括处理器和存储器,所述存储器上存储有计算机程序,所述计算机程序被所述处理器执行时,实现如上文所述的方法。
[0029]再一方面,本专利技术还提供一种可读存储介质,所述可读存储介质内存储有计算机程序,所述计算机程序被处理器执行时,实现如上文所述的方法。
[0030]本专利技术至少具有以下技术效果之一:
[0031]1.基于动态阈值与集成学习模型的工业企业碳画像分级方法能够有效地提高工业界碳排放分级的准确性与速度,辅助于碳分析、碳决策和碳管理,进一步实现节能减排目的。
[0032]2.方法中的模型分类阈值是动态的,可根据不同的企业碳排放量、碳排放的季节、企业所属行业等因素,动态调整分类权重,大大地提高了方法的准确性与鲁棒性。
[0033]3.模型采用分层思想,耦合度低,易于模型的修改与扩展,可方便地修改或者添加模型内的基分类器算法,为数据选择合适的搭配。
[0034]4.模型输入数据灵活,可以根据不同工业企业所属行业,不同季节的数据,自适应的选择合适阈值,进行动态的碳画像分类工作,从而提高工业企业的碳本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于动态阈值的工业企业碳画像分级方法,其特征在于,包括:步骤S1、获取工业企业碳排放数据;步骤S2、对所述工业企业碳排放数据进行预处理;根据预处理后的所述工业企业碳排放数据所属季节与企业所属行业构建训练输入矩阵;步骤S3、构建集成学习分层架构算法模型,将所述训练输入矩阵输入至所述集成学习分层架构算法模型中,进行动态阈值训练,得到训练后的模型;步骤S4、将所述工业企业碳排放数据输入至训练后的模型中,进行碳画像分级。2.如权利要求1所述的基于动态阈值的工业企业碳画像分级方法,其特征在于,所述步骤S1包括:所述工业企业碳排放数据分为不同行业的企业数据,一个企业数据中有不同季度每日的碳数据量。3.如权利要求2所述的基于动态阈值的工业企业碳画像分级方法,其特征在于,所述步骤S2中对所述工业企业碳数据做预处理包括:对所述工业企业碳数据进行缺失值填充,异常检测与处理和标准化处理。4.如权利要求3所述的基于动态阈值的工业企业碳画像分级方法,其特征在于,所述步骤S2包括:对于缺失值填充和异常检测处理后的工业企业碳数据进行聚合、拆分,整合成其中,i表示某一家企业,j表示某个数据的季节,k表示某个季节中某一天的数据,x
i,j,k
表示企业i,季节j中k天的单个数据;对于整合后的工业企业碳数据进行均值方差标准化:其中,x表示单个数据的取值,μ表示对应列的均值,σ表示对应列的标准差。5.如权利要求4所述的基于动态阈值的工业企业碳画像分级方法,其特征在于,所述步骤S2包括:使用独热码编码,将季节特征和企业行业特征分别转换为两个特征向量;将两个特征向量合并至每个企业每个季节的数据,构建成为所述训练输入矩阵:其中,e为企业所属行业编码,f为数据所属季节编码,x为某企业某季节碳排放量单个数据,i表示某一家企业,j表示某个数据的季节,k表示某个季节中某一天的数据;每一行数据都带有碳效率标签,标签分为三个等级,分别为高、中、低。6.如权利要求5所述的基于动态阈值的工业企业碳画像分级方法,其特征在于,所述步骤S3包括:建立集成学习分层架构算法模型,所述集成学习分层架构算法模型包括:动态阈值分配器,分别与所述动态阈值分配器
连接的四个不同域的基分类器模块;四个基分类器模块分别为基于字典的分类模块、区间森林分类模块、基于形状变换的分类模块和随机卷积核变换分类模块;所述基于字典的分类模块用于处理所述工业企...

【专利技术属性】
技术研发人员:陈赟周敏沈浩谢邦鹏傅超然潘智俊王佳裕王晓慧杜海舟朱煌增陈通浩
申请(专利权)人:上海电力大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1