基于用电信息的企业能耗类型分类模型构建方法及其应用技术

技术编号:36739709 阅读:12 留言:0更新日期:2023-03-04 10:15
本发明专利技术涉及一种基于用电信息的企业能耗类型分类模型构建方法及其应用,包括:获取企业用电信息及其对应的能耗类型,企业用电信息包括用电类型、电价类别、行业类型和至少一年内的时段用电量;能耗类型分为A类、非A类;对于每一企业,分别哑变量处理用电类型、电价类别、行业类型、用电时段,分别标准化处理用电量的离散系数、用电量峰谷比、用电量波幅比、用户用电量的平稳性,得到特征数据;将特征数据、能耗类型分别作为XGboost初始模型的输入、输出数据,训练分类模型,若得到回归树,则得到能耗类型分类模型。使用同样的处理方法处理待分类企业的企业用电信息,使用能耗类型分类模型分类企业能耗类型的效率高。企业能耗类型的效率高。企业能耗类型的效率高。

【技术实现步骤摘要】
基于用电信息的企业能耗类型分类模型构建方法及其应用


[0001]本专利技术涉及能耗分类
,具体涉及一种基于用电信息的企业能耗类型分类模型构建方法及其应用。

技术介绍

[0002]电能属于能源的一种。一般地,企业生产经营活动必然涉及电能的利用,可能还涉及煤炭、天然气、燃油中的一种或多种。因此,基于用电信息可以对企业能耗进行分类,以降低采用现场排查分类方式所耗费的人力、时间,提高企业能耗分类效率。
[0003]
技术实现思路

[0004]本专利技术的目的是提供一种基于用电信息的企业能耗类型分类模型构建方法及其应用,以提高企业能耗分类效率。
[0005]本专利技术的技术方案是:
[0006]一种基于用电信息的企业能耗类型分类模型构建方法,包括以下步骤:
[0007]基础信息获取步骤;获取企业用电信息及其对应的能耗类型,所述企业用电信息包括用电类型、电价类别、行业类型和至少一年内的时段用电量,所述时段用电量为时长 t的用电量,一日时长为时长t的整数倍;所述能耗类型分为A类、非A类;
[0008]制作样本步骤;具体的,
[0009]1)用电量的离散系数,以年为周期,使用一年内的日用电量构造日用电量序列,用电量的离散系数
[0010][0011]式中,σ为日用电量序列的标准差,μ为日用电量序列的平均值;
[0012]2)用电量峰谷比,以日为周期,计算一日内时段用电量的最大值max和时段用电量的最小值min,用电量峰谷比
[0013][0014]3)用电量波幅比,根据时段用电量计算获得月用电量、年用电量,以月为单位计算一月内的日用电量均值,以年为单位计算一年内的日用电量均值,用电量波幅比为一月内的日用电量均值与一年内的日用电量均值的比值;
[0015]4)用电时段,根据时段用电量计算获得日用电量,以日为单位计算一日内的时段用电量均值,在该日内,时段用电量>时段用电量均值时,该时段用电量对应的时段为用电时段;
[0016]5)用户用电量的平稳性,使用平稳性检验所述日用电量序列,得到P值,用户用电量的平稳性为P值;
[0017]对于每一企业,分别哑变量处理用电类型、电价类别、行业类型、用电时段,分别标准化处理用电量的离散系数、用电量峰谷比、用电量波幅比、用户用电量的平稳性,得到企业的特征数据;
[0018]训练分类模型步骤;建立XGboost初始模型,将所述特征数据作为XGboost初始模型的输入数据,将所述特征数据对应企业的能耗类型作为XGboost初始模型的输出数据,训练XGboost分类模型,若得到回归树,则得到能耗类型分类模型。
[0019]优选的,所述时长t为一小时。
[0020]优选的,所述能耗类型分为“散乱污”类、非“散乱污”类。
[0021]前述分类模型的应用,获取待分类企业的企业用电信息,使用前述的制作样本步骤处理所述企业用电信息,将得到的特征数据输入所述待分类企业的能耗类型分类模型,所述能耗类型分类模型输出待分类企业的能耗类型。
[0022]本专利技术的有益效果是:
[0023]1.通过对企业用电信息进行处理,得到企业特征数据,并选择XGboost算法训练得到能耗类型分类模型。使用同样的处理方法处理待分类企业的企业用电信息,将得到的特征数据输入所述能耗类型分类模型,就可以得到待分类企业的能耗类型。
附图说明
[0024]图1为一种基于用电信息的企业能耗类型分类模型构建方法构建“散乱污”能耗类型识别模型的流程图。
[0025]图2是一种基于用电信息的企业能耗类型分类模型构建方法中训练分类模型的流程图。
[0026]图3是一种分类模型应用于识别“散乱污”能耗类型企业的流程图。
具体实施方式
[0027]下面结合附图,以实施例的形式说明本专利技术,以辅助本
的技术人员理解和实现本专利技术。除另有说明外,不应脱离本
的技术知识背景理解以下的实施例及其中的技术术语。
[0028]一般的,认为低压非居民电力用户为企业电力用户。
[0029]实施例1:一种基于用电信息的企业能耗类型分类模型构建方法,包括以下步骤:
[0030]基础信息获取步骤;获取企业用电信息及其对应的能耗类型,所述企业用电信息包括用电类型、电价类别、行业类型和三年内的时段用电量,所述时段用电量为一小时;所述能耗类型分为“散乱污”类、非“散乱污”类;一般地,环保部门认定有“散乱污”类企业和非“散乱污”类企业清单。本实施例中,获取176家“散乱污”类企业和1617 家非“散乱污”类企业的用电信息数据,模型设置70%作为训练集,30%作为测试集。
[0031]制作样本步骤;具体的,
[0032]1)用电量的离散系数,以年为周期,使用一年内的时段用电量构造日用电量序列,用电量的离散系数
[0033][0034]式中,σ为日用电量序列的标准差,μ为日用电量序列的平均值;
[0035]2)用电量峰谷比,以日为周期,计算一日内时段用电量的最大值max和时段用电量的最小值min,用电量峰谷比
[0036][0037]3)用电量波幅比,根据时段用电量计算获得月用电量、年用电量,以月为单位计算一月内的日用电量均值,以年为单位计算一年内的日用电量均值,用电量波幅比为一月内的日用电量均值与一年内的日用电量均值的比值;
[0038]4)用电时段,根据时段用电量计算获得日用电量,以日为单位计算一日内的时段用电量均值,在该日内,时段用电量>时段用电量均值时,该时段用电量对应的时段为用电时段;
[0039]5)用户用电量的平稳性,使用平稳性检验所述日用电量序列,得到P值,用户用电量的平稳性为P值;
[0040]对于每一企业,分别哑变量处理用电类型、电价类别、行业类型、用电时段,分别标准化处理用电量的离散系数、用电量峰谷比、用电量波幅比、用户用电量的平稳性,得到企业的特征数据。哑变量处理即按照特征类别进行编码,一般一个类别为k的特征需要编码为一组k

1(避免引起多重共线性)个衍生哑变量,这样就可以表示特征内部所有的类别 (将其中基准比较类设为0,当k

1个哑变量都为0时,即为基准类)。标准化处理的具体过程:x

=x

μ/σ。标准化是依照特征矩阵的列处理数据,每个样本点都能对标准化产生影响。能取消由于量纲不同引起的误差,是一种线性变换,对向量X按照比例压缩再进行平移。
[0041]训练分类模型步骤;建立XGboost初始模型,将所述特征数据作为XGboost初始模型的输入数据,将所述特征数据对应企业的能耗类型作为XGboost初始模型的输出数据,训练XGboost分类模型,若得到回归树,则得到能耗类型分类模型。
[0042]XGboost分类模型的算法是:
[0043]步骤S1,初始化
[0044][0045]步骤S2,设置迭代次数n=1,2本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于用电信息的企业能耗类型分类模型构建方法,其特征在于,包括以下步骤:基础信息获取步骤;获取企业用电信息及其对应的能耗类型,所述企业用电信息包括用电类型、电价类别、行业类型和至少一年内的时段用电量,所述时段用电量为时长t的用电量,一日时长为时长t的整数倍;所述能耗类型分为A类、非A类;制作样本步骤;具体的,1)用电量的离散系数,以年为周期,使用一年内的日用电量构造日用电量序列,用电量的离散系数式中,σ为日用电量序列的标准差,μ为日用电量序列的平均值;2)用电量峰谷比,以日为周期,计算一日内时段用电量的最大值max和时段用电量的最小值min,用电量峰谷比3)用电量波幅比,根据时段用电量计算获得月用电量、年用电量,以月为单位计算一月内的日用电量均值,以年为单位计算一年内的日用电量均值,用电量波幅比为一月内的日用电量均值与一年内的日用电量均值的比值;4)用电时段,根据时段用电量计算获得日用电量,以日为单位计算一日内的时段用电量均值,在该日内,时段用电量>时段用电量均值时,该时段用电量对应的时段为用电时段;5)用户用电量的平稳性,使用平稳性检验所述日...

【专利技术属性】
技术研发人员:朱莹王心妍贾静丽冯肖王军义范小杰李瑶李辉
申请(专利权)人:河南东泠电子科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1