海量数据下基于多能源协同企业能耗动态标准库构建方法技术

技术编号:37190699 阅读:17 留言:0更新日期:2023-04-20 22:52
本发明专利技术提供海量数据下基于多能源协同企业能耗动态标准库构建方法,获取企业能耗数据;对企业能耗连续和离散缺失数据分别进行填补;判别企业使用能源类型;对企业能耗进行分类,以及对时间场景进行划分;基于参数寻优策略生成最优DBSCAN参数MinPts和Eps;基于自适应DBSCAN聚类求解企业各能耗类型动态标准区间;按照企业能耗场景合并各能耗类型下的动态标准区间。本发明专利技术考虑到企业能耗分类及时间场景划分;提出基于多能源协调运用的企业能耗动态标准区间建立,提高对于企业能耗异常研判的准确性。准确性。准确性。

【技术实现步骤摘要】
海量数据下基于多能源协同企业能耗动态标准库构建方法


[0001]本专利技术涉及企业能耗异常辨识
,具体涉及海量数据下基于多能源协同企业能耗动态标准库构建方法。

技术介绍

[0002]伴随能源对当今社会经济发展重要性的提升,能源缺乏问题也逐渐成为大家关注的焦点。而企业能耗问题是影响综合能耗的关键,因此企业能耗异常研判将成为节能减排的重中之重。
[0003]现有的企业能耗动态标准区间,对处理运用综合能源的企业存在一定的缺陷。一是没有考虑多种能源协调运用下的企业能耗动态标准区间的构建;二是采用一般的聚类算法导致得到的动态标准区间精确度较低;三是并没有对企业分工序进行能耗异常判断,降低了企业能耗研判的准确性。

技术实现思路

[0004]本专利技术提供的海量数据下基于多能源协同企业能耗动态标准库构建方法,将获得的能耗数据统一折算为标准煤;对企业能耗连续和离散缺失数据分别进行填补;判别企业使用能源类型;企业能耗场景划分和工序能耗计算;自适应DBSCAN算法对企业能耗数据进行聚类;求解企业各能耗类型动态标准区间;本专利技术考虑到企业能耗分类及时间场景划分,提出基于多能源协调运用的企业能耗动态标准区间建立,提高对于企业能耗异常研判的准确性。
[0005]本专利技术提供的海量数据下基于多能源协同企业能耗动态标准库构建方法包括:
[0006]S1、获取企业能耗数据;
[0007]S2、对企业能耗连续和离散缺失数据分别进行填补;
[0008]S3、判别企业使用能源类型;
>[0009]S4、对企业能耗进行分类,以及对时间场景进行划分;
[0010]S5、基于参数寻优策略生成最优DBSCAN参数MinPts和Eps;
[0011]S6、基于自适应DBSCAN聚类求解企业各能耗类型动态标准区间;
[0012]S7、按照企业能耗场景合并各能耗类型下的动态标准区间。
[0013]进一步需要说明的是,步骤S1中企业能耗数据的值用于判断企业能耗是否存在异常;
[0014]还用于建立企业能耗动态标准区间;
[0015]还用于将企业各能源消耗折算为吨标煤数据。
[0016]进一步需要说明的是,步骤S3还包括对企业能耗数据预处理,判别企业使用能源类型;
[0017]对离散缺失数据占比大和连续缺失的能耗数据视作异常数据,具有异常数据的企业相关步骤视为异常;
[0018]对于离散缺失数据,通过计算离散缺失数据的前后数据平均值来进行自动填补。
[0019]进一步需要说明的是,步骤S4中对各能源消耗数据依据四季和节假日划分场景,并对工序能耗进行计算,具体步骤如下所述:
[0020]S41、将企业能耗划分为原料消耗,能源能耗和厂用电;
[0021]S42、根据企业类型匹配相关工序,并按工序对能源能耗类型数据进行分类;
[0022]S43、将同一工序内的能源分为耗热类和耗电类,将耗热类能源消耗进行数据合并;
[0023]S44、将企业能耗数据按照四季,节假日划分为8个场景,在S41

S43能源分类的基础上按照不同场景进行分析。
[0024]进一步需要说明的是,步骤S4中对能耗分类的场景划分中将企业能耗分为原料消耗和能源消耗,并对两种消耗类型数据单独分析;原料消耗是将其折算为吨标煤数据,按照以下所给出的公式:
[0025][0026]式中l
i
指企业所用能源的能耗量;p
i
指企业所用能源的标准煤转换系数;
[0027]将能源消耗分解为企业用电和企业化石能源消耗;对于企业用电数据单独分析;将所属企业化石能源消耗的数据进行折算合并分析,计算公式如下:
[0028]E
h
=p
g
·
l
g
+p
c
·
l
c
+p
s
·
l
s
[0029]式中l
g
,l
c
,l
s
指企业天然气,煤,石油的能耗值;p
g
,p
c
,p
s
指企业所用天然气,煤,石油的标准煤转换系数。
[0030]进一步需要说明的是,步骤S5中基于参数寻优策略生成最优DBSCAN 参数MinPts和Eps,包括步骤如下:
[0031]S51、计算所有数据点到其第K个最近邻距离,并求得平均值作为K

平均邻域距离;
[0032]在K

平均邻域距离基础上生成所有K值的Eps参数集合记作E;
[0033]S52、生成所有K值的MinPts参数集记作M,生成公式如下:
[0034][0035]式中,n为数据集中的对象总个数,Ni为第i个对象的Eps邻域对象数量;
[0036]S53、选用不同K值下的MinPts和Eps参数进行聚类分析,即寻找参数集合E和M中对应K值的参数作为DBSCAN聚类的参数进行聚类;
[0037]S54、对不同K值生成的聚类结果进行簇数分析,当连续3次生成簇类个数一致时将此聚类个数作为最佳聚类个数;
[0038]S55、寻找最佳聚类个数下的最优K值,进而确定最优MinPts和Eps参数。
[0039]进一步需要说明的是,步骤S5中采用适合数据集的参数MinPts和Eps 进行聚类分析,具体步骤如下:
[0040]S501、定义N(p,Eps)为以点p为圆心Eps为半径的圆内数据点的个数,计算N(p,Eps)值判断该店是否为核心点,如果N(p,Eps)>=MinPts,该点为核心点;
[0041]S502、如果N(p,Eps)<MinPts,且在其他核点圆形区域内,则属于边缘点;
[0042]S503、如果既不是核点又不是边缘点,则为离群点;
[0043]S504、重复步骤S501

S503,直到所有点都有明确分类。
[0044]进一步需要说明的是,步骤S6中将自适应DBSCAN聚类后的数据分为主簇和副簇,选择包含数据点数最多的簇作为主簇,并将主簇作为动态标准区间的主体;
[0045]采用簇心扩展法选定动态标准区间的上下限;通过定义指标判断两簇之间的距离:簇类C1和C2的距离等于两个簇类所有样本对距离平方和的平均:
[0046][0047]企业能耗动态标准区间的上下限选取方式为:
[0048][0049][0050]式中mc
max
为主簇上界,mc
min
为主簇下界,C
m
、C
u
和C
l
分别为主簇、上簇、下簇,dist(C
m
,C
u
)为主簇与上簇的簇间距,dist(C
m
,本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.海量数据下基于多能源协同企业能耗动态标准库构建方法,其特征在于,方法包括:S1、获取企业能耗数据;S2、对企业能耗连续和离散缺失数据分别进行填补;S3、判别企业使用能源类型;S4、对企业能耗进行分类,以及对时间场景进行划分;S5、基于参数寻优策略生成最优DBSCAN参数MinPts和Eps;S6、基于自适应DBSCAN聚类求解企业各能耗类型动态标准区间;S7、按照企业能耗场景合并各能耗类型下的动态标准区间。2.根据权利要求1所述的海量数据下基于多能源协同企业能耗动态标准库构建方法,其特征在于,步骤S1中企业能耗数据的值用于判断企业能耗是否存在异常;还用于建立企业能耗动态标准区间;还用于将企业各能源消耗折算为吨标煤数据。3.根据权利要求1所述的海量数据下基于多能源协同企业能耗动态标准库构建方法,其特征在于,步骤S3还包括对企业能耗数据预处理,判别企业使用能源类型;对离散缺失数据占比大和连续缺失的能耗数据视作异常数据,具有异常数据的企业相关步骤视为异常;对于离散缺失数据,通过计算离散缺失数据的前后数据平均值来进行自动填补。4.根据权利要求1所述的海量数据下基于多能源协同企业能耗动态标准库构建方法,其特征在于,步骤S4中对各能源消耗数据依据四季和节假日划分场景,并对工序能耗进行计算,具体步骤如下所述:S41、将企业能耗划分为原料消耗,能源能耗和厂用电;S42、根据企业类型匹配相关工序,并按工序对能源能耗类型数据进行分类;S43、将同一工序内的能源分为耗热类和耗电类,将耗热类能源消耗进行数据合并;S44、将企业能耗数据按照四季,节假日划分为8个场景,在S41

S43能源分类的基础上按照不同场景进行分析。5.根据权利要求4所述的海量数据下基于多能源协同企业能耗动态标准库构建方法,其特征在于,步骤S4中对能耗分类的场景划分中将企业能耗分为原料消耗和能源消耗,并对两种消耗类型数据单独分析;原料消耗是将其折算为吨标煤数据,按照以下所给出的公式:式中l
i
指企业所用能源的能耗量;p
i
指企业所用能源的标准煤转换系数;将能源消耗分解为企业用电和企业化石能源消耗;对于企业用电数据单独分析;将所属企业化石能源消耗的数据进行折算合并分析,计算公式如下:E
h
=p
g
·
l
g
+p
c
·
l
c
+p
s
·
l
s
式中l
g
,l
c
,l
s
指企业天然气,煤,石油的能耗值;p
g
,p
c
,p
s
指企业所用天然气,煤,石油的
标准煤转换系数。6.根据权利要求1所述的海量数据下基于多能源协同企业能耗动态标准库构建方法,其特征在于,步骤S5中基于参数寻优策略生成最优DBSCAN参数MinPts和Eps,包括步骤如下:S51、计算所有数据点到其第K个最近邻距离,并求得平均值作为K

平均邻域距离;在K

平均...

【专利技术属性】
技术研发人员:王中龙耿建刘越雷现惠于涛李鲁燕彭佳刘杨巩庆超
申请(专利权)人:国家电网有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1