用电负荷特征分析方法和装置、存储介质制造方法及图纸

技术编号:19065610 阅读:21 留言:0更新日期:2018-09-29 14:11
本发明专利技术提供一种用电负荷特征分析方法和装置、存储介质,涉及家庭用电技术领域。该方法包括:抽取用于分析用电负荷特征的用户,形成用户集合;确定进行用电负荷特征分析的时间区间,并获取所述用户集合中各个用户在所述时间区间内的用电负荷数据;针对所述时间区间中的每一个子区间,建立对应的负荷文件;根据所述时间区间内各个子区间各自对应的负荷文件,采用预设聚类算法进行用户聚类,得到各个子区间各自对应的初始聚类结果;根据所述时间区间内的各个子区间对应的初始聚类结果,确定所述时间区间对应的综合聚类结果;根据所述时间区间对应的综合聚类结果,分析所述时间区间内的用电负荷特征。

【技术实现步骤摘要】
用电负荷特征分析方法和装置、存储介质
本专利技术涉及家庭用电
,具体涉及一种用电负荷特征分析方法和装置、存储介质。
技术介绍
随着智能电表的广泛部署,人们能够十分便捷地采集细粒度的家庭智能用电数据。但是由于智能电表能够每15分钟采集一次数据,因此会产生大量的用电负荷数据。如此海量、高维、稀疏的时间序列形式的用电负荷数据增加了数据中心的存储压力、计算压力,同时也为数据的分析和应用带来极大的困难。目前,多采用聚类技术(例如,k-means聚类算法)对用户进行聚类,进而对得到的各类用户的用电负荷特征进行分析。但是当聚类算法直接应用在海量、高维、稀疏的用电负荷数据时,会面临很高的计算压力,使得运算效率较低。
技术实现思路
(一)解决的技术问题针对现有技术的不足,本专利技术提供了一种用电负荷特征分析方法和装置、存储介质,解决了现有技术运算效率低的技术问题。(二)技术方案为实现以上目的,本专利技术通过以下技术方案予以实现:第一方面,本专利技术实施例提供一种电负荷特征分析方法,该方法包括:抽取用于分析用电负荷特征的用户,形成用户集合;确定进行用电负荷特征分析的时间区间,并获取所述用户集合中各个用户在所述时间区间内的用电负荷数据;针对所述时间区间中的每一个子区间,建立对应的负荷文件;其中,所述负荷文件中包括所述用户集合中所有用户在该子区间内的用电负荷数据;根据所述时间区间内各个子区间各自对应的负荷文件,采用预设聚类算法进行用户聚类,得到各个子区间各自对应的初始聚类结果;根据所述时间区间内的各个子区间对应的初始聚类结果,确定所述时间区间对应的综合聚类结果;根据所述时间区间对应的综合聚类结果,分析所述时间区间内的用电负荷特征。第二方面,本专利技术实施例提供一种用电负荷特征分析装置,该装置包括:用户抽取模块,用于抽取用于分析用电负荷特征的用户,形成用户集合;数据获取模块,用于确定进行用电负荷特征分析的时间区间,并获取所述用户集合中各个用户在所述时间区间内的用电负荷数据;文件建立模块,用于针对所述时间区间中的每一个子区间,建立对应的负荷文件;其中,所述负荷文件中包括所述用户集合中所有用户在该子区间内的用电负荷数据;第一聚类模块,用于根据所述时间区间内各个子区间各自对应的负荷文件,采用预设聚类算法进行用户聚类,得到各个子区间各自对应的初始聚类结果;第二聚类模块,用于根据所述时间区间内的各个子区间对应的初始聚类结果,确定所述时间区间对应的综合聚类结果;特征分析模块,用于根据所述时间区间对应的综合聚类结果,分析所述时间区间内的用电负荷特征。第三方面,本专利技术实施例提供一种计算机可读存储介质,该介质上存储有计算机程序,其特征在于,在处理器执行所述计算机程序时可实现上述的方法。(三)有益效果本专利技术实施例提供了一种用电负荷特征分析方法和装置、存储介质,具备以下有益效果:1、本方法针对时间区间内的每一个子区间建立对应的负荷文件,然后基于各个子区间各自对应的负荷文件进行用户聚类,可以得到各个子区间各自对应的初始聚类结果,进而根据多个初始聚类结果确定一个最终的聚类结果即综合聚类结果,进而根据综合聚类结果进行用电负荷特征分析。本方法没有在整个时间区间上直接进行聚类,而是在比时间区间更细分的子区间内进行聚类,这样在每一子区间内进行聚类的过程中,输入数据的维度降低,从而提高了计算效率;2、本方法依据初始聚类结果确定综合聚类结果,保留了完整的时间区间上的用电负荷数据,因此没有因为降维而造成数据的丢失;3、本方法能够充分利用各个初始聚类结果,有效降低孤立点和噪声对综合聚类结果的影响,提高综合聚类结果的鲁棒性和稳定性。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1示出了本专利技术实施例中用电负荷特征分析方法的流程示意图;图2示出了本专利技术实施例中用电负荷特征分析装置的结构示意图。具体实施方式为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。第一方面,本专利技术实施例提供一种用电负荷特征分析方法,该方法可以但不限于应用在家庭用电的数据分析方面。如图1所示,该方法包括:S100、抽取用于分析用电负荷特征的用户,形成用户集合;在实际应用中,可以设置智能电表每隔一定的时间采集一次用户的用电负荷数据,例如,智能电表每隔30分钟采集一次用电负荷数据,这样智能电表在一天内可以在48个时间点上采集用电负荷数据,即采集48次用电负荷数据。进一步,可以将智能电表采集的用电负荷数据按照用户编号传输至分布式数据中心进行存储。其中,分布式数据中心中的各个数据中心依据用户的地理位置分布设置,将用电负荷数据存储到用户所在区域内的数据中心。当然,除了将用电负荷数据存储到数据中心之外,还可以将用户的住宅特征信息、家庭特征信息和/或家电特征信息等信息存储到数据中心。其中,住宅特征信息包括:住宅面积、房型信息等,家庭特征信息包括人口数量、户主年龄、户主受教育情况等,家电特征信息包括各电器的种类、数量等信息。在具体实施时,当用电负荷数据存储在数据中心时,可以根据需要进行负荷分析的区域抽取用户。具体抽取过程可以包括:S101、确定进行用电负荷特征分析的区域,并确定所述区域内所有用于存储用电负荷数据的数据中心;S102、根据各个所述数据中心内存储的用电负荷数据对应的用户数量,确定各个数据中心对应的用户抽取比例;S103、根据预设的用户抽取总量和各个数据中心各自对应的用户抽取比例,确定各个数据中心对应的用户抽取数量;S104、根据每一数据中心对应的用户抽取数量,在该数据中心中进行用户抽取。举例来说,需要进行用电负荷特征分析的区域内一共有3个数据中心。第1个数据中心存储有100个用户的用电负荷数据,第2个数据中心存储有200个用户的用电负荷数据,第3个数据中心存储有300个用户的用电负荷数据,这三个数据中心对应的用户抽取比例为1:2:3,假设预设的用户抽取总量为120个,则需要从三个数据中心中抽取的用户数量即用户抽取数量分别是:20、40、60。在某个数据中心抽取用户时,可以先随机确定第一个用户,然后利用循环的等距抽样方法完成此数据中心内的用户抽样。举例来说,抽取的用户数量有N个,这N个用户构成的用户集合可以记为Xini={X1,...,XN}。在具体实施时,在将抽取到的各个用户形成用户集合之前,还可以对抽取到的用户数据进行数据清洗,处理异常值,清除缺失用户。清除缺失用户后,将剩余n个用户构成的集合记为X={x1,...,xn}。S200、确定进行用电负荷特征分析的时间区间,并获取所述用户集合中各个用户在所述时间区间内的用电负荷数据;在具体实施时,进行用电负荷特征分析的时间区间[T1,Ts]可以根据需要设置,例如,可以设置为一个月(此时s=30)、两本文档来自技高网...

【技术保护点】
1.一种用电负荷特征分析方法,其特征在于,包括:抽取用于分析用电负荷特征的用户,形成用户集合;确定进行用电负荷特征分析的时间区间,并获取所述用户集合中各个用户在所述时间区间内的用电负荷数据;针对所述时间区间中的每一个子区间,建立对应的负荷文件;其中,所述负荷文件中包括所述用户集合中所有用户在该子区间内的用电负荷数据;根据所述时间区间内各个子区间各自对应的负荷文件,采用预设聚类算法进行用户聚类,得到各个子区间各自对应的初始聚类结果;根据所述时间区间内的各个子区间对应的初始聚类结果,确定所述时间区间对应的综合聚类结果;根据所述时间区间对应的综合聚类结果,分析所述时间区间内的用电负荷特征。

【技术特征摘要】
1.一种用电负荷特征分析方法,其特征在于,包括:抽取用于分析用电负荷特征的用户,形成用户集合;确定进行用电负荷特征分析的时间区间,并获取所述用户集合中各个用户在所述时间区间内的用电负荷数据;针对所述时间区间中的每一个子区间,建立对应的负荷文件;其中,所述负荷文件中包括所述用户集合中所有用户在该子区间内的用电负荷数据;根据所述时间区间内各个子区间各自对应的负荷文件,采用预设聚类算法进行用户聚类,得到各个子区间各自对应的初始聚类结果;根据所述时间区间内的各个子区间对应的初始聚类结果,确定所述时间区间对应的综合聚类结果;根据所述时间区间对应的综合聚类结果,分析所述时间区间内的用电负荷特征。2.如权利要求1所述的方法,其特征在于,所述抽取用于分析用电负荷特征的用户,包括:确定进行用电负荷特征分析的区域,并确定所述区域内所有用于存储用电负荷数据的数据中心;根据各个所述数据中心内存储的用电负荷数据对应的用户数量,确定各个数据中心对应的用户抽取比例;根据预设的用户抽取总量和各个数据中心各自对应的用户抽取比例,确定各个数据中心对应的用户抽取数量;根据每一数据中心对应的用户抽取数量,在该数据中心中进行用户抽取。3.如权利要求1所述的方法,其特征在于,所述针对所述时间区间中的每一个子区间,建立对应的负荷文件,包括:针对所述用户集合中的每一个用户,建立该用户在所述时间区间内的每一个子区间的负荷子文件;其中,所述负荷子文件中包括该用户在该子区间内的用电负荷数据;根据所述用户集合中所有用户在每一子区间内的负荷子文件,形成该子区间对应的负荷文件;其中,所述该子区间对应的负荷文件包括所述用户集合中所有用户在该子区间内的负荷子文件。4.如权利要求1所述的方法,其特征在于,所述根据所述时间区间内各个子区间各自对应的负荷文件,采用预设聚类算法进行用户聚类,得到各个子区间各自对应的初始聚类结果,包括:并行执行所述根据所述时间区间内各个子区间各自对应的负荷文件,采用预设聚类算法进行用户聚类,得到各个子区间各自对应的初始聚类结果的步骤。5.如权利要求1所述的方法,其特征在于,所述根据所述时间区间内各个子区间各自对应的负荷文件,采用预设聚类算法进行用户聚类,得到各个子区间各自对应的初始聚类结果,包括:针对所述时间区间内的每一个子区间,执行以下步骤:针对预设的聚类数目选择区间中的每一个聚类数目备选值,计算在该聚类数目备选值下的聚类有效性指标;将所述聚类数目选择区间中对应聚类有效性指...

【专利技术属性】
技术研发人员:周开乐孙莉杨昌辉温露露陆信辉
申请(专利权)人:合肥工业大学
类型:发明
国别省市:安徽,34

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1