对用电行为进行分类的方法、系统、存储介质和电子设备技术方案

技术编号:37145062 阅读:26 留言:0更新日期:2023-04-06 21:55
本发明专利技术实施例公开了一种对用电行为进行分类的方法、系统、存储介质和电子设备,所述方法包括:获取用户的用电量数据;根据所述用电量数据生成聚类数据集;采用密度聚类算法对所述聚类数据集进行聚类,生成多组聚类簇,并识别所述聚类数据集中的计量噪声点;根据所述多组聚类簇和所述聚类数据集中的计量噪声点对用户的用电行为进行分类。本发明专利技术所述的方法和系统通过分析用户用电量数据,利用密度聚类算法实现了负荷大数据的聚类,方法简单易操作。而且基于实际用户负荷数据进行实验,将通过聚类算法进行用户行为分类比采用均值漂移聚类算法,效果更好,从而进一步证明了采用聚类算法对用户用电行为进行分类的可靠性。法对用户用电行为进行分类的可靠性。法对用户用电行为进行分类的可靠性。

【技术实现步骤摘要】
对用电行为进行分类的方法、系统、存储介质和电子设备


[0001]本专利技术涉及电力数据处理领域,尤其是一种对用电行为进行分类的方法、系统、存储介质和电子设备。

技术介绍

[0002]电网智能化、数字化建设的不断推进,越来越多的电力数据可以被感知装置获得,并通过通信网络上送至边缘设备以及云计算服务器,支持多类高级应用。其中,负荷大数据蕴含着丰富的用电信息,以此为基础,可以实现诸多高级应用,如:用电需求预测、台区线损计算、电价制定、需求响应政策制定等,为电网的高效运营管理提供强有力的支撑。而对于多源多维度数据的聚类可发现数据内在规律,并为人工智能高级应用有很好的现实研究意义。具体分析,在大部分情况下,典型的应用场景和典型的用户将具有类似的用电行为,其负荷曲线往往表现出相当程度的高相似性。因此可见,负荷数据的高精度聚类具备可行性。然而传统的聚类方法如k

means聚类算法需要预先知道聚类数k,这对于实际的用户用电行为分类操作是无法预先设定的。

技术实现思路

[0003]为了解决现有技术中对用户的用电行为进行分类需要先知道聚类数,而这在实际操作中又往往是无法预先设定的问题,本专利技术提供一种对用电行为进行分类的方法、系统、存储介质和电子设备。
[0004]根据本专利技术实施例的一个方面,提供了一种对用电行为进行分类方法,包括:
[0005]获取用户的用电量数据;
[0006]根据所述用电量数据生成聚类数据集;
[0007]采用密度聚类算法对所述聚类数据集进行聚类,生成多组聚类簇;
[0008]根据所述多组聚类簇对用户的用电行为进行分类。
[0009]可选地,在本专利技术上述各方法实施例中,获取用户的用电数据包括:
[0010]确定采集用电数据的用户数量u;
[0011]对每个用户,按照预设时间段中采样点的数量v,采集用户的v个用电量数据。
[0012]可选地,在本专利技术上述各方法实施例中,根据所述用电量数据生成数据集包括:
[0013]根据用户数量u和每个用户的v个用电量数据生成矩阵A
vu

[0014]删除所述矩阵A
vu
中存在用电量数据缺失值的行和列,生成矩阵B
qw

[0015]对矩阵B
qw
中的元素进行归一化,得到矩阵D
qw

[0016]根据所述矩阵D
qw
中的元素得到聚类数据集data。
[0017]可选地,在本专利技术上述各方法实施例中,采用密度聚类算法对所述聚类数据集进行聚类,生成多组聚类簇包括:
[0018]步骤4.1,设置密度聚类算法的半径参数ε和邻域宽度阈值minPts;
[0019]步骤4.2,以聚类数据集data为输入,初始化样本集合P=data,初始化聚类簇的数
量k=0;
[0020]步骤4.3,从样本集合P中选择一个未访问样本data
i
,并将未访问样本data
i
标记为访问样本,其中,1≤i≤m,1≤m≤w,i的初始值为1,i为未访问样本集合P中第i个用户,m为未访问样本集合P中的用户总数,data
i
为未访问样本集合P中第i个用户的用电量数据;
[0021]步骤4.4,当根据设置的半径参数ε确定的访问样本data
i
的ε邻域中的样本数量小于minPts时,令i=i+1,当i≤m时,返回步骤4.3,当i=m+1时,转至步骤4.12;
[0022]步骤4.5,当根据设置的半径参数ε确定的访问样本data
i
的ε邻域中的样本数量不小于minPts时,令k=k+1,将访问样本data
i
加入聚类簇C
k

[0023]步骤4.6,对于集合N
ε
(data
i
)中除访问样本data
i
外的样本N
εj
(data
i
),当N
εj
(data
i
)已经标记为访问样本时,将样本N
εj
(data
i
)加入聚类簇C
k
,令j=j+1,当j≤n时,重复步骤4.6,当j=n+1时,转至步骤4.10,其中,N
ε
(data
i
)是根据设置的半径参数ε确定的访问样本data
i
的ε邻域中样本的集合,1≤j≤n,1≤n≤u,j的初始值为1,n为集合N
ε
(data
i
)中的用户总数减1;
[0024]步骤4.7,对于N
ε
(data
i
)中除访问样本data
i
外的样本N
εj
(data
i
),当N
εj
(data
i
)是未访问样本时,将N
εj
(data
i
)标记为访问样本;
[0025]步骤4.8,当根据设置的半径参数ε确定访问样本N
εj
(data
i
)的ε邻域中的样本数量小于minPts时,将样本N
εj
(data
i
)加入聚类簇C
k
,令j=j+1,当j≤n时,返回步骤4.6,当j=n+1时,转至步骤4.10;
[0026]步骤4.9,当根据设置的半径参数ε确定访问样本N
εj
(data
i
)的ε邻域中的样本数量不小于minPts时,根据设置的半径参数ε确定访问样本N
εj
(data
i
)的ε邻域中样本的集合N

ε
(data
i
),并令N
ε
(data
i
)=N
ε
(data
i
)∪N

ε
(data
i
),令n=n+N,j=j+1,当j≤n时,返回步骤4.6,当j=n+1时,转至步骤4.10;
[0027]步骤4.10,当集合P

N
ε
(data
i
)中存在未访问样本时,令P=P

N
ε
(data
i
),返回步骤4.3;当集合P

N
ε
(data
i
)中不存在未访问样本时时,转到步骤4.11;
[0028]步骤4.11,输出聚类簇C1至C
k
,以及不属于任何一个聚类簇的访问样本;
[0029]步骤4.12,输出样本集合P中的全部访问样本对应的用户为本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种对用电行为进行分类的方法,其特征在于,所述方法包括:获取用户的用电量数据;根据所述用电量数据生成聚类数据集;采用密度聚类算法对所述聚类数据集进行聚类,生成多组聚类簇;根据所述多组聚类簇对用户的用电行为进行分类。2.根据权利要求1所述的方法,其特征在于,获取用户的用电数据包括:确定采集用电数据的用户数量u;对每个用户,按照预设时间段中采样点的数量v,采集用户的v个用电量数据。3.根据权利要求2所述的方法,其特征在于,根据所述用电量数据生成数据集包括:根据用户数量u和每个用户的v个用电量数据生成矩阵A
vu
;删除所述矩阵A
vu
中存在用电量数据缺失值的行和列,生成矩阵B
qw
;对矩阵B
qw
中的元素进行归一化,得到矩阵D
qw
;根据所述矩阵D
qw
中的元素得到聚类数据集data。4.根据权利要求3所述的方法,其特征在于,采用密度聚类算法对所述聚类数据集进行聚类,生成多组聚类簇包括:步骤4.1,设置密度聚类算法的半径参数ε和邻域宽度阈值minPts;步骤4.2,以聚类数据集data为输入,初始化样本集合P=data,初始化聚类簇的数量k=0;步骤4.3,从样本集合P中选择一个未访问样本data
i
,并将未访问样本data
i
标记为访问样本,其中,1≤i≤m,1≤m≤w,i的初始值为1,i为未访问样本集合P中第i个用户,m为未访问样本集合P中的用户总数,data
i
为未访问样本集合P中第i个用户的用电量数据;步骤4.4,当根据设置的半径参数ε确定的访问样本data
i
的ε邻域中的样本数量小于minPts时,令i=i+1,当i≤m时,返回步骤4.3,当i=m+1时,转至步骤4.12;步骤4.5,当根据设置的半径参数ε确定的访问样本data
i
的ε邻域中的样本数量不小于minPts时,令k=k+1,将访问样本data
i
加入聚类簇C
k
;步骤4.6,对于集合N
ε
(data
i
)中除访问样本data
i
外的样本N
εj
(data
i
),当N
εj
(data
i
)已经标记为访问样本时,将样本N
εj
(data
i
)加入聚类簇C
k
,令j=j+1,当j≤n时,重复步骤4.6,当j=n+1时,转至步骤4.10,其中,N
ε
(data
i
)是根据设置的半径参数ε确定的访问样本data
i
的ε邻域中样本的集合,1≤j≤n,1≤n≤u,j的初始值为1,n为集合N
ε
(data
i
)中的用户总数减1;步骤4.7,对于N
ε
(data
i
)中除访问样本data
i
外的样本N
εj
(data
i
),当N
εj
(data
i
)是未访问样本时,将N
εj
(data
i
)标记为访问样本;步骤4.8,当根据设置的半径参数ε确定访问样本N
εj
(data
i
)的ε邻域中的样本数量小于minPts时,将样本N
εj
(data
i
)加入聚类簇C
k
,令j=j+1,当j≤n时,返回步骤4.6,当j=n+1时,转至步骤4.10;步骤4.9,当根据设置的半径参数ε确定访问样本N
εj
(data
i
)的ε邻域中的样本数量不小于minPts时,根据设置的半径参数ε确定访问样本N
εj
(data
i
)的ε邻域中样本的集合N

ε
(data
i
),并令N
ε
(data
i
)=N
ε
(data
i
)∪N

ε
(data
i
),令n=n+N,j=j+1,当j≤n时,返回步骤4.6,当j=n+1时,转至步骤4.10;
步骤4.10,当集合P

N
ε
(data
i
)中存在未访问样本时,令P=P

N
ε
(data
i
),返回步骤4.3;当集合P

N
ε
(data
i
)中不存在未访问样本时时,转到步骤4.11;步骤4.11,输出聚类簇C1至C
k
;步骤4.12,输出样本集合P中的全部访问样本对应的用户为所述聚类数据集中计量噪声点。5.根据权利要求4所述的方法,其特征在于,所述方法还包括输出聚类簇C1至C
k
的同时,输出不属于任何一个聚类簇的访问样本,其中,不属于任何一个聚类簇的访问样本对应的用户为所述聚类数据集中的计量噪声点。6.根据权利要求5所述的方法,其特征在于,根据所述多组聚类簇对用户的用电行为进行分类包括:将聚类簇C1至C
k
中每一个聚类簇中用户的行为作为一类用户行为,共输出k类用户行为。7.根据权利要求6所述的方法,其特征在于,所述方法还包括将聚类数据集中的计量噪声点对应的用户的用电行为输出为无法归类的行为。8.一种对用电行为进行分类的系统,其特征在于,所述系统包括:数据采集单元,用于获取用户的用电量数据;数据集单元,用于根据所述用电量数据生成聚类数据集;数据聚类单元,用于采用密度聚类算法对所述聚类数据集进行聚类,生成多组聚类簇;行为分类单元,用于根据所述多组聚类簇对用户的用电行为进行分类。...

【专利技术属性】
技术研发人员:宋如楠杨艺宁张蓬鹤薛阳王聪杨柳赵兵陈昊郑安刚
申请(专利权)人:国家电网有限公司国网福建省电力有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1