【技术实现步骤摘要】
一种针对建筑冷站分项计量数据的数据清洗方法
[0001]本专利技术涉及数据清洗领域,尤其是涉及一种针对建筑冷站分项计量数据的数据清洗方法。
技术介绍
[0002]由于从不同能耗监测平台获取的数据的数据质量各不相同:大量缺失值、零值、异常值或数据标签和变量错位的情况发生,因此原始数据很难客观反应建筑内暖通空调系统的运行状况,这对短时间内分析建筑节能潜力造成困难。并且从不同平台获取的数据的数据质量问题五花八门,导致数据清洗效率低。
技术实现思路
[0003]本专利技术的目的就是为了克服上述现有技术存在的缺陷而提供一种操作简便易上手的针对建筑冷站分项计量数据的数据清洗方法,提高数据清洗效率,便于节能潜力分析。
[0004]本专利技术的目的可以通过以下技术方案来实现:
[0005]一种针对建筑冷站分项计量数据的数据清洗方法,包括如下步骤:
[0006]步骤1)获取建筑冷站相关数据,所述数据均为时间序列数据,包括冷机群总能耗冷冻水泵总能耗冷却水泵总能耗冷却塔风机总能耗单台冷机能耗、单台冷冻水泵能耗、单台冷却水泵能耗、单台冷却塔风机能耗、单台冷机启停状态、单台冷冻水泵频率、单台冷却水泵频率、单台冷却塔风机频率、冷负荷Load、干管冷冻水流量Q
chw
、干管冷却水流量Q
cw
、干管冷冻水供水温度T
chws
、干管冷冻水回水温度T
chwr
、干管冷却水供水温度T
cws
、干管冷却水回水温度T
cw ...
【技术保护点】
【技术特征摘要】
1.一种针对建筑冷站分项计量数据的数据清洗方法,其特征在于,包括如下步骤:步骤1)获取建筑冷站相关数据,所述数据均为时间序列数据,包括冷机群总能耗冷冻水泵总能耗冷却水泵总能耗冷却塔风机总能耗单台冷机能耗、单台冷冻水泵能耗、单台冷却水泵能耗、单台冷却塔风机能耗、单台冷机启停状态、单台冷冻水泵频率、单台冷却水泵频率、单台冷却塔风机频率、冷负荷Load、干管冷冻水流量Q
chw
、干管冷却水流量Q
cw
、干管冷冻水供水温度T
chws
、干管冷冻水回水温度T
chwr
、干管冷却水供水温度T
cws
、干管冷却水回水温度T
cwr
,其中,第z台冷机能耗为E
chz
、第z台冷冻水泵能耗为E
chwpz
、第z台冷却水泵能耗为E
cwpz
、第z台冷却塔风机能耗为E
ctfz
、第z台冷机启停状态为S
chz
、第z台冷冻水泵频率为f
chwpz
、第z台冷却水泵频率为f
cwpz
、第z台冷却塔风机频率为f
ctfz
,所述第z台冷机启停状态为无量纲分类变量,其中0为冷机关闭,1为冷机运行;步骤2)清洗冷机群总能耗冷冻水泵总能耗冷却水泵总能耗冷却塔风机总能耗剔除所述数据时间序列中的缺失值、零值和异常值,所述剔除数据为该剔除值所在时刻对应的所有变量的数据,清洗后数据为冷机群总能耗冷冻水泵总能耗冷却水泵总能耗冷却塔风机总能耗步骤3)清洗单台冷机能耗、单台冷冻水泵能耗、单台冷却水泵能耗、单台冷却塔风机能耗,剔除所述数据时间序列中的缺失值、零值和异常值,所述剔除数据为该剔除值所在时刻对应的所有变量的数据,所述异常值根据基尔霍夫定律判断,清洗后第z台冷机能耗为E
chz
′
、第z台冷冻水泵能耗为E
chwpz
′
、第z台冷却水泵能耗为E
cwpz
′
、第z台冷却塔风机能耗为E
ctfz
′
;步骤4)清洗单台冷机启停状态、单台冷冻水泵频率、单台冷却水泵频率、单台冷却塔风机频率,先剔除所述数据时间序列中的的缺失值、零值,所述剔除数据为该剔除值所在时刻对应的所有变量的数据,再对第z台冷机启停状态S
chz
采用一致性原则修正异常值,对第z台冷冻水泵频率f
chwpz
、第z台冷却水泵频率f
cwpz
、第z台冷却塔风机频率f
ctfz
采用相似准则定律修正数据标签和数据的对应关系,清洗后第z台冷机启停状态为S
chz
′
、第z台冷冻水泵频率为f
chwpz
′
、第z台冷却水泵频率为f
cwpz
′
、第z台冷却塔风机频率为f
ctfz
′
;步骤5)清洗干管冷冻水流量Q
chw
和干管冷却水流量Q
cw
,剔除所述数据时间序列中的缺失值、零值和异常值,其中,所述剔除的缺失值和零值数据为该剔除值所在时刻对应的所有变量的数据,所述异常值根据与采用相似准则计算得到的干管冷冻水流量比较值和干管冷却水流量比较值比较结果确定,清洗后干管冷冻水流量为Q
chw
′
,干管冷却水流量为Q
cw
′
;步骤6)清洗干管冷冻水供水温度T
chws
、回水温度T
chwr
、干管冷却水供水温度T
cws
、回水温度T
cwr
,冷负荷load,首先剔除所述数据时间序列中的的缺失值、零值,其中,所述剔除数据为该剔除值所在时刻对应的所有变量的数据,再根据专家经验判断异常值,利用能量守恒定律剔除异常值并修正数据。2.根据权利要求1所述的一种针对建筑冷站分项计量数据的数据清洗方法,其特征在于,所述数据所有变量的时间戳一一对应,数据颗粒度为每15分钟或每小时,其中冷机群总能耗冷冻水泵总能耗
冷却水泵总能耗冷却水泵总能耗冷却塔风机总能耗第z台冷机能耗E
chz
={E
chz1
,E
chz2
…
E
chzi
…
}、第z台冷冻水泵能耗E
chwpz
={E
chwpz1
,E
chwpz2
…
E
chwpzi
…
}、第z台冷却水泵能耗E
cwpz
={E
cwpz1
,E
cwpz2
…
E
cwpzi
…
}、第z台冷却塔风机能耗E
ctfz
={E
ctfz1
,E
ctfz2
…
E
ctfzi
…
}、第z台冷机启停状态S
chz
={S
chz1
,S
chz2
…
S
chzi
…
}、第z台冷冻水泵频率f
chwpz
={f
chwpz1
,f
chwpz2
…
f
chwpzi
…
}、第z台冷却水泵频率f
cwpz
={f
cwpz1
,f
cwpz2
…
f
cwpzi
…
}、第z台冷却塔风机频率f
ctfz
={f
ctfz1
,f
ctfz2
…
f
ctfzi
…
}、冷负荷Load={load1,load2…
load
i
…
}、干管冷冻水流量Q
chw
={Q
chw1
,Q
chw2
…
Q
chwi
…
}、干管冷却水流量Q
cw
={Q
cw1
,Q
cw2
…
Q
cwi
…
}、干管冷冻水供水温度T
chws
={T
chws1
,T
chws2
…
T
chwsi
…
}、干管冷冻水回水温度T
chwr
={T
chwr1
,T
chwr2
…
T
chwri
…
}、干管冷却水供水温度T<...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。