电力用户经济属性缺失值的推断方法技术

技术编号:39007445 阅读:21 留言:0更新日期:2023-10-07 10:38
本发明专利技术公开了一种电力用户经济属性缺失值的推断方法,首先对原始数据集进行重组得到待聚类数据集,再依次对待聚类数据集进行聚类处理得到用户群体。对于用户群体中的完备数据子集再次进行聚类并排除离群用户得到一个簇类,并根据该簇类生成缺失属性与未缺失属性的关系模型。将用户群体中的不完备数据子集输入该模型后计算出缺失经济属性的值。本发明专利技术通过将用户划分为不同用户群体,并且在群体内部进行模型训练,可以很好的利用不用户群体之间的差异以及同一用户群体之间的相似最终达到提高推断缺失经济属性的准确性的有益效果。高推断缺失经济属性的准确性的有益效果。高推断缺失经济属性的准确性的有益效果。

【技术实现步骤摘要】
电力用户经济属性缺失值的推断方法


[0001]本专利技术涉及电力分析
,具体为电力用户经济属性缺失值的推断方法。

技术介绍

[0002]电力能源是人类生存和发展的重要基础。随着智能电网的迅猛发展,需求侧资源在电力市场中的作用日益凸显。居民用户作为电网需求侧的重要组成部分,分析其用电行为模式,对于电网进行需求响应以及居民个性化用电服务等具有十分重要的现实意义。无论国内还是国外关于用户用电模式挖掘仍然存在不足之处。目前关于居民用户用电模式的挖掘大多都集中于针对用户往期负荷用电分析,而关于研究用户历史负荷用电结合用户本身各个经济属性的用电行为分析研究较少,但是在目前将用户历史负荷用电结合用户经济属性进行用户行为分析研究的过程中有我们不可忽略的问题,目前研究的公开数据集中,用户的各个经济属性是由调查问卷所得到的,但是由于各种原因导致我们得不到用户的完整经济属性,所以最后的公开数据集中我们得到的是用户大量的缺失的社会经济属性,这对我们更好的研究用户用电行为造成了阻碍,所以设计一个既考虑用户用电行为又考虑了用户各个经济属性之间的关系以此去推断用户经济属性缺失值的算法具有现实意义。

技术实现思路

[0003]本专利技术设计了一种电力用户经济属性缺失值的推断方法,从大量历史电量数据和用户各项经济属性中充分提取信息,挖掘用户群体用电行为以及经济属性之间的内在规律,去推断出缺失的用户经济属性,为之后对用户的用电行为模式挖掘提供了良好的数据基础。
[0004]本专利技术要解决的技术问题的技术方案是:电力用户经济属性缺失值的推断方法,包括以下步骤:步骤1、将原始数据集重组成待聚类数据集Si;首先、根据经济属性的类型是否有缺失将原始数据集划分为完备数据集TC和不完备数据集TM;之后、根据缺失的经济属性的类型提取不完备数据集TM的样本组成不完备数据子集Ti,其中i为区间[1,n]内的整数,n为原始数据集缺失经济属性类型最大的一个下标;所述不完备数据子集Ti的经济属性不包含所述不完备数据子集Ti缺失的经济属性的类型;最后、将不完备数据子集Ti与完备数据集TC合并组成待聚类数据集Si;步骤2、以待聚类数据集Si中不完备数据子集Ti对应的经济属性为输入数据,对每一个待聚类数据集Si使用聚类算法进行聚类得到用户群体Di;步骤3、以无缺失的经济属性为输入数据,对每一个用户群体Di提取无经济属性缺失的样本使用聚类算法进行聚类得到簇类集合;步骤4、对每一个簇类生成缺失经济属性与未缺失经济属性的关系模型;之后,将用户群体Di中的经济属性不完备的用户数据输入所述关系模型,得到缺失的经济属性的
值。
[0005]更好的,使用卷积神经网络学习簇类中缺失的经济属性的类型与簇类对应的经济属性的类型之间的关系进行所述关系模型的训练。
[0006]更好的,所述步骤2中,所述输入数据还包括高维负荷特征向量;所述高维负荷特征向量根据待聚类数据集Si中用户历史用电负荷数据使用卷积神经网络提取得到。
[0007]更好的,步骤3.1:将用户群体Di分为完备数据子集KTC和不完备数据子集KTM;步骤3.2:对完备数据子集KTC以完整的经济属性为输入数据再次进行k

means聚类得到一个簇类Hi;步骤3.3:计算所述簇类Hi中各样本与所述簇类Hi中心的平均欧氏距离,将欧式距离超过所述簇类Hi平均欧式距离的样本视为离群用户并去除,所述簇类Hi剩余的样本组成簇类。
[0008]更好的,所述步骤3.2中:对聚类后完备数据子集KTC以高维负荷特征和完整的经济属性为输入数据再次进行k

means聚类得到一个簇类Hi。
[0009]本专利技术的有益效果为:可以去推断出缺失的用户经济属性,提高用户数据的完整性和准确性,方便其他研究者在此基础上全面了解用户群体的用电行为和经济属性,为用户提供个性化的电力服务和定制化的营销策略以及其他相关研究。
附图说明
[0010]图1为本专利技术一种实施例的控制流程图。
具体实施方式
[0011]为使本专利技术的技术方案和有益效果更加清楚,下面对本专利技术的实施方式做进一步的详细解释。
[0012]用电用户的经济属性用以反应用电用户的用电模式,通过对用电模式模型的建立可以对电网进行需求响应以及居民个性化用电服务提供依据。用电用户的经济属性包括若干个不同的属性,如用电用户的经济属性为{用户收入,用户住宅类型,居住面积大小,家庭人口,节能灯个数}。
[0013]电力用户经济属性缺失值的推断方法,本方法对数据进行合适聚类处理之后进行缺失的经济属性与未缺失经济属性之间的关系模型的训练,然后将缺失经济属性的样本的数据输入到模型中计算出缺失的经济属性,具体包括以下步骤。
[0014]步骤1、将原始数据集重组成待聚类数据集Si。
[0015]首先、对原始数据集中的样本逐一提取并检测样本的经济属性中的各个属性是否缺失,将缺失某些经济属性的样本划分到不完备数据集TM,将不缺失经济属性的样本划分到完备数据集TC。
[0016]之后、根据缺失的经济属性的类型提取不完备数据集TM的样本组成不完备数据子集Ti,其中i为区间[1,n]内的整数。n为原始数据集缺失经济属性类型最大的一个下标,如若原始数据集中的用户缺失的经济属性的下标最大为5,则n为5,不完备数据子集T5里面包含所有缺失第5个经济属性的用户,不完备数据子集T4里面包含所有缺失第4个经济属性的
用户,当用户缺少多个经济属性时,该用户就会没有研究价值,因此本文只考虑用户缺失一个经济属性的情况。
[0017]最后、将不完备数据子集Ti与完备数据集TC合并组成待聚类数据集Si。例如,不完备数据集TM中缺失经济属性为第一个经济属性的样本组成不完备数据子集T1。将不完备数据子集T1与完备数据集TC进行合并得到待聚类数据集S1,即S1=T1+TC。所有的待聚类数据集组成待聚类数据集集合S:{S1,S2,...Sn}。
[0018]设定用电用户的完整的经济属性为P:{P1,P2,...Pm},如本实施例中所述,完整的经济属性为{用户收入,用户住宅类型,居住面积大小,家庭人口,...节能灯个数}。假定Pj标识的经济属性为家庭人口,则缺失该经济属性的待聚类数据集Si的经济属性为{用户收入,用户住宅类型,居住面积大小,...节能灯个数},即待聚类数据集Si的对应的经济属性为Pj:{P1,P2,...Pj

1,Pj+1,...Pn}。
[0019]步骤2、依次对待聚类数据集集合S中的待聚类数据集Si进行聚类处理,该聚类处理的输入数据为经济属性{P1,P2,...Pj

1,Pj+1...Pm},聚类处理后得到相关性更强的用户群体集合D:{D1,D2,...Dn},其中经济属性Pj为待聚类数据集Si中不完备数据子集Ti对应的经济属性,其经济属性在完整的经济属性的基础上缺少类型为Pj为属性。
[0020]更好的,为了通过用电用户的历史数据反应用户的经济属性本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.电力用户经济属性缺失值的推断方法,其特征在于包括以下步骤:步骤1、将原始数据集重组成待聚类数据集Si;首先、根据经济属性的类型是否有缺失将原始数据集划分为完备数据集TC和不完备数据集TM;之后、根据缺失的经济属性的类型提取不完备数据集TM的样本组成不完备数据子集Ti,其中i为区间[1,n]内的整数,n为原始数据集缺失经济属性类型最大的一个下标;所述不完备数据子集Ti的经济属性不包含所述不完备数据子集Ti缺失的经济属性的类型;最后、将不完备数据子集Ti与完备数据集TC合并组成待聚类数据集Si;步骤2、以待聚类数据集Si中不完备数据子集Ti对应的经济属性为输入数据,对每一个待聚类数据集Si使用聚类算法进行聚类得到用户群体Di;步骤3、以无缺失的经济属性为输入数据,对每一个用户群体Di提取无经济属性缺失的样本使用聚类算法进行聚类得到簇类集合;步骤4、对每一个簇类生成缺失经济属性与未缺失经济属性的关系模型;之后,将用户群体Di中的经济属性不完备的用户数据输入所述关系模型,得到缺失的经济属性的值。2.根据权利要求1所述的电力用户经济属性缺失值的推断方法,其特征在于:使用卷积神...

【专利技术属性】
技术研发人员:李子凯周忠堂王春宝李军伟徐明珠范晓燕颜洪正陈玉李中凯
申请(专利权)人:国网山东省电力公司临沂供电公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1