System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种建筑能源设备表记数据修复方法和系统技术方案_技高网

一种建筑能源设备表记数据修复方法和系统技术方案

技术编号:41420005 阅读:21 留言:0更新日期:2024-05-28 20:20
本申请公开了一种建筑能源设备表记数据修复方法和系统,本申请通过确定待修复设备数据颗粒度,将每个设备的数据按时间点进行排序,并根据数据的完整性进行分组,将完整的数据分到A组,不完整的数据分到B组,筛选出相关性大于预设值的设备组成A'组;对目标设备和A'组中设备在最近时间周期内的趋势进行二次排序,根据设备之间的能耗数据计算相关系数R,并对A'组中的设备按相关系数排序;根据A'组中设备对目标设备中缺失的数据点进行补全,将补全后的数据放入A组,针对基于物联网的建筑能耗采集数据,由于实际生产环境复杂导致数据缺失的情况进行数据补全,并使得补全数据和实际真实情况尽可能逼近。

【技术实现步骤摘要】

本申请涉及建筑能源设备表记数据修复,特别是涉及一种建筑能源设备表记数据修复方法和系统


技术介绍

1、现有能源设备表底数据采集中,由于硬件设备部署环境比较复杂、硬件存储空间限制等情况,会不时出现数据回传失败的情况,导致云端数据采集不全,进而影响后续数据使用。例如:电表表底数据5分钟回传一次,采集器a在0点3分出现死机,0点42分重启恢复,会导致0点5分到0点40分8个数据点缺失。现有技术方案为采用线性插值法进行修正,将采集器a前后采集的数据点按y=ax+b的线性模型进行拟合,x为时间轴,y为采集表底数,通过拟合线性模型,对时间点上没有对应的y值进行补全。

2、现有技术方案采用线性拟合方式,比较适合在较短周期、数据缺失点较少、数据变化本身基本满足线性变化的情况。但是这些条件在能源设备数据采集的较多场景不成立。例如:采集器设备出现故障及临场处理时效性普遍不会很快(数小时甚至十几个小时级别),导致数据丢失不会是几个点;设备用能的曲线在稍长的时间跨度,不满足时间线性,例如空调,功耗会随着温度变化进行调节,会表现出类似正弦波一样上下起伏。用设备自身数据线性拟合的方式,在能源设备数据领域,还会出现一个普遍问题:设备历史数据可用性下降,例如在夏秋换季甚至日内温度变化比较剧烈时间点,空调设备历史数据对缺失数据的曲线拟合度就会表现得更差。

3、建筑节能领域,主要业务逻辑为采集各个设备工控、能耗、建筑环境数据等;通过数据分析或模型检测,发现潜在节能区位,然后对设备进行调节,进而达到节能环保目的。要达成业务目标,首先需要尽量完整、有效采集设备能耗相关数据,通过多数据源整合分析,判断设备能耗合理性,给出节能策略(设备、时间、调节方式)建议和节能预估。在实际业务场景中,环境比较复杂,例如断网、设备过热死机、设备维护、停电、误操作等情况,都会导致数据采集缺失,进而影响后续数据分析、建模。


技术实现思路

1、本申请提供一种建筑能源设备表记数据修复方法和系统,旨在解决现有技术存在设备历史数据对缺失数据的曲线拟合度影响过大的问题。

2、第一方面,一种建筑能源设备表记数据修复方法,所述方法包括:

3、步骤1:确定待修复设备数据颗粒度,修复数据以最小颗粒度进行修复,并将其他级别的数据进行上卷处理;

4、步骤2:将每个设备的数据按时间点进行排序,并根据数据的完整性进行分组,将完整的数据分到a组,不完整的数据分到b组;对b组设备按缺失数据点数进行排序,如果缺失数据点超过整体数据点的50%,则将超过整体数据点的50%的设备放入c组;

5、步骤3:对b组中的设备逐一进行相关设备召回,按缺失点从少到多进行,并筛选出相关性大于预设值的设备组成a'组;

6、步骤4:对目标设备和a'组中设备在最近时间周期内的趋势进行二次排序,筛选出相关性最高的前三个设备,根据设备之间的能耗数据计算相关系数r,并对a'组中的设备按相关系数排序;

7、步骤5:根据a'组中设备对目标设备中缺失的数据点进行补全,将补全后的数据放入a组,并重复执行步骤3-步骤5来补全b组中其他设备的数据;

8、步骤6:对c组中的设备,在当前时间窗内数据点相关性计算表征不足时,进行时间窗的扩展,扩展后的数据窗口进行数据补全,重复执行3-5步。

9、上述方案中,可选的,所述待修复设备数据颗粒度包括5、10或15分钟级别。

10、上述方案中,可选的,所述筛选出相关性大于预设值的设备组成a'组,包括:

11、基于天级别的能耗数据,从a组中召回和目标设备最相似的预设数量设备;

12、计算目标设备和a组中设备的相关系数,筛选出相关性大于预设值的设备组成a'组。

13、上述方案中,可选的,所述根据a'组中设备对目标设备中缺失的数据点进行补全,将补全后的数据放入a组,并重复执行步骤3-步骤5来补全b组中其他设备的数据,具体为:

14、使用目标设备和a'组中设备的环比增长率对缺失数据进行缩放,然后进行补全;

15、将补全后的数据放入a组,并重复执行3-5步来补全b组中其他设备的数据。

16、上述方案中,可选的,所述进行时间窗的扩展,具体为同时向前和向后滑动时间窗,保证有数据点的比例在70%以上。

17、第二方面,一种建筑能源设备表记数据修复系统,所述系统包括:

18、确定模块:用于确定待修复设备数据颗粒度,修复数据以最小颗粒度进行修复,并将其他级别的数据进行上卷处理;

19、分组模块:用于将每个设备的数据按时间点进行排序,并根据数据的完整性进行分组,将完整的数据分到a组,不完整的数据分到b组;对b组设备按缺失数据点数进行排序,如果缺失数据点超过整体数据点的50%,则将超过整体数据点的50%的设备放入c组;

20、召回模块:用于对b组中的设备逐一进行相关设备召回,按缺失点从少到多进行,并筛选出相关性大于预设值的设备组成a'组;

21、排序模块:用于对目标设备和a'组中设备在最近时间周期内的趋势进行二次排序,筛选出相关性最高的前三个设备,根据设备之间的能耗数据计算相关系数r,并对a'组中的设备按相关系数排序;

22、补全模块:用于根据a'组中设备对目标设备中缺失的数据点进行补全,将补全后的数据放入a组;

23、扩展模块:用于对c组中的设备,在当前时间窗内数据点相关性计算表征不足时,进行时间窗的扩展,扩展后的数据窗口进行数据补全。

24、上述方案中,可选的,所述待修复设备数据颗粒度包括5、10或15分钟级别。

25、上述方案中,可选的,所述筛选出相关性大于预设值的设备组成a'组,包括:

26、基于天级别的能耗数据,从a组中召回和目标设备最相似的预设数量设备;

27、计算目标设备和a组中设备的相关系数,筛选出相关性大于预设值的设备组成a'组。

28、上述方案中,可选的,所述根据a'组中设备对目标设备中缺失的数据点进行补全,将补全后的数据放入a组,并重复执行步骤3-步骤5来补全b组中其他设备的数据,具体为:

29、使用目标设备和a'组中设备的环比增长率对缺失数据进行缩放,然后进行补全;

30、将补全后的数据放入a组。

31、上述方案中,可选的,所述进行时间窗的扩展,具体为同时向前和向后滑动时间窗,保证有数据点的比例在70%以上。

32、相比现有技术,本申请至少具有以下有益效果:

33、本申请基于对现有技术问题的进一步分析和研究,针对现有技术方案采用线性拟合方式无法拟合补全较长周期缺失数据,不能补全拟合趋势反转、指数增长等非线性趋势,历史数据失效问题,提出整体解决思路。本申请通过确定待修复设备数据颗粒度,修复数据以最小颗粒度进行修复,并将其他级别的数据进行上卷处理;将每个设备的数据按时间点进行排序,并根据数据的完整性进行分组,将完整本文档来自技高网...

【技术保护点】

1.一种建筑能源设备表记数据修复方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述待修复设备数据颗粒度包括5、10或15分钟级别。

3.根据权利要求1所述的方法,其特征在于,所述筛选出相关性大于预设值的设备组成A'组,包括:

4.根据权利要求1所述的方法,其特征在于,所述根据A'组中设备对目标设备中缺失的数据点进行补全,将补全后的数据放入A组,并重复执行步骤3-步骤5来补全B组中其他设备的数据,具体为:

5.根据权利要求1所述的方法,其特征在于,所述进行时间窗的扩展,具体为同时向前和向后滑动时间窗,保证有数据点的比例在70%以上。

6.一种建筑能源设备表记数据修复系统,其特征在于,所述系统包括:

7.根据权利要求6所述的系统,其特征在于,所述待修复设备数据颗粒度包括5、10或15分钟级别。

8.根据权利要求6所述的系统,其特征在于,所述筛选出相关性大于预设值的设备组成A'组,包括:

9.根据权利要求6所述的系统,其特征在于,所述根据A'组中设备对目标设备中缺失的数据点进行补全,将补全后的数据放入A组,并重复执行步骤3-步骤5来补全B组中其他设备的数据,具体为:

10.根据权利要求6所述的系统,其特征在于,所述进行时间窗的扩展,具体为同时向前和向后滑动时间窗,保证有数据点的比例在70%以上。

...

【技术特征摘要】

1.一种建筑能源设备表记数据修复方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述待修复设备数据颗粒度包括5、10或15分钟级别。

3.根据权利要求1所述的方法,其特征在于,所述筛选出相关性大于预设值的设备组成a'组,包括:

4.根据权利要求1所述的方法,其特征在于,所述根据a'组中设备对目标设备中缺失的数据点进行补全,将补全后的数据放入a组,并重复执行步骤3-步骤5来补全b组中其他设备的数据,具体为:

5.根据权利要求1所述的方法,其特征在于,所述进行时间窗的扩展,具体为同时向前和向后滑动时间窗,保证有数据点的比例在70%以上。

...

【专利技术属性】
技术研发人员:朱亮
申请(专利权)人:金茂云科技服务北京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1