当前位置: 首页 > 专利查询>汪礼君专利>正文

一种基于大数据的电力用户画像构建方法及装置制造方法及图纸

技术编号:28474366 阅读:75 留言:0更新日期:2021-05-15 21:42
本发明专利技术涉及一种大数据的技术领域,揭露了一种基于大数据的电力用户画像构建方法,包括:获取电力用户数据,利用基于前缀树的信息挖掘算法对电力用户数据进行信息挖掘,得到电力用户的特征向量;利用基于时序演变的特征向量处理算法对电力用户的特征向量进行处理,得到基于时序演变的电力用户特征向量;利用改进的特征向量聚类算法对基于时序演变的电力用户特征向量进行聚类处理,得到聚类后的电力用户特征,并根据聚类结果,构建电力用户画像;根据所构建的用户画像,利用基于空间的用户发现方法构建用户社交画像。本发明专利技术还提供了一种基于大数据的电力用户画像构建系统。本发明专利技术实现了电力用户画像的构建。了电力用户画像的构建。了电力用户画像的构建。

【技术实现步骤摘要】
一种基于大数据的电力用户画像构建方法及装置


[0001]本专利技术涉及大数据的
,尤其涉及一种基于大数据的电力用户画像构建方法及装置。

技术介绍

[0002]目前,用户画像技术发展迅速,正在被应用到社交媒体,电子商务,移动等领域。在企业实际应用时,需要根据实际的业务需求在专业的领域从整体到细节对用户画像进行逐级展示,因此在电力企业应用中,通过构建电力用户画像为电力企业决策提供支持成为当前研究的热门话题。
[0003]传统用户特征提取算法计算复杂度较高,且特征聚类算法K

means聚类算法计算量大,容易造成局部最优解,无法快速得到全局最优的用户画像特征,实现用户画像的构建。
[0004]鉴于此,如何更为快速地提取得到用户画像特征,实现用户画像的构建,成为本领域技术人员亟待解决的问题。

技术实现思路

[0005]本专利技术提供一种基于大数据的电力用户画像构建方法,通过利用基于前缀树的信息挖掘算法对电力用户数据进行信息挖掘,得到电力用户的特征向量,并利用基于时序演变的特征向量处理算法对电力用户的特征向量进行处理,得到基于时序演变的电力用户特征,同时利用改进的特征聚类算法对电力用户特征进行聚类处理,将聚类后的电力用户特征构建为用户画像,同时利用基于空间的用户发现方法构建用户社交画像。
[0006]为实现上述目的,本专利技术提供的一种基于大数据的电力用户画像构建方法,包括:
[0007]获取电力用户数据,利用基于前缀树的信息挖掘算法对电力用户数据进行信息挖掘,得到电力用户的特征向量;
[0008]利用基于时序演变的特征向量处理算法对电力用户的特征向量进行处理,得到基于时序演变的电力用户特征向量;
[0009]利用改进的特征向量聚类算法对基于时序演变的电力用户特征向量进行聚类处理,得到聚类后的电力用户特征,并根据聚类结果,构建电力用户画像;
[0010]根据所构建的用户画像,构建不同电力用户的通讯信息关系矩阵;
[0011]构建不同电力用户的移动行为矩阵,并根据不同电力用户的通讯信息关系矩阵和移动行为矩阵,构建电力用户社交画像。
[0012]可选地,所述利用基于前缀树的信息挖掘算法对电力用户数据进行信息挖掘,包括:
[0013]所述电力用户数据包括用户的用电量时序数据、用户电器耗电量时序数据、用户所在区域的用电量时序数据以及用户对电力企业的咨询文本等;
[0014]所述基于前缀树的信息挖掘算法流程为:
[0015]1)对于电力用户数据B=<s1,s2,...,s
k
>,其中,s
i
是发生在时间i的电力事件,电力用户数据B的长度为k,将电力用户数据B构建为前缀树,其中根节点为空,按照时序递增顺序将电力数据置于子节点中;
[0016]2)在电力用户数据B的末尾添加一个电力事件,若电力用户数据的持续时间不发生变化,则称该事件为同时性事件SI,若电力用户数据的持续事件加1,则称该事件为序列性事件SE;
[0017]3)计算所添加的同时性事件SI和序列性事件SE的事件集合:
[0018]SI(B)=(u(B)+u(SI)+u(SE))/u(CES)
[0019][0020]其中:
[0021]u(B)为电力用户数据B的效用值,即电力用户数据B的总发生次数;
[0022]u(SI)为同时性事件的效用值;
[0023]u(SE)为序列性事件的效用值;
[0024]u(CES)为事件的自身效用值与事件序列效用值的总效用和的比值;
[0025]根据上述公式,发生次数更多电力事件将具有更高的效用值;
[0026]4)按电力事件的效用值对事件集合中的电力事件进行排序,其中效用值更高的电力事件将处于更为靠前的位置;
[0027]5)对于同时性事件,将效用值更高的电力事件放置于前缀树中对应时序节点中,对于序列事件,则将效用值更高的电力事件放置于前缀树中对应时序的下一层节点中,其中前缀树中每个节点所存储的事件即为电力用户特征的特征向量。
[0028]可选地,所述利用基于时序演变的特征向量处理算法对电力用户的特征向量进行处理,包括:
[0029]在本专利技术所述前缀树中,时序更为久远的特征向量在前缀树更为靠近根节点的位置,因此本专利技术从前缀树的底层开始,对电力用户特征向量进行处理;
[0030]所述基于时序演变的特征向量处理算法流程为:
[0031]获取电力用户特征向量m的时间节点,计算时间节点与当前时间节点差值的绝对值|t
m
|;
[0032]利用时序演变特征权重计算公式计算电力用户特征向量的权重,并将时序演变特征权重赋于对应的电力用户特征向量,得到基于时序演变的电力用户特征向量,所述时序演变特征权重计算公式为:
[0033][0034]其中:
[0035]w
m
为电力用户特征向量m的权重;
[0036]λ为衰减因子,将其设置为0.4。
[0037]在本专利技术一个具体实施例中,通过对电力用户特征向量进行基于时序演变的特征赋权,使得最新的电力用户特征向量具有更高的权重。
[0038]可选地,所述利用改进的特征向量聚类算法对基于时序演变的电力用户特征向量进行聚类处理,包括:
[0039]1)对于初始给定的m个基于时序演变的电力用户特征向量{m1,m2,...,m
m
},将其转换为m个n维向量组成的电力用户特征矩阵X
m
×
n
,并计算矩阵的协方差矩阵S
m
×
m
=Cov(X
m
×
n
);
[0040]2)计算得到协方差矩阵S
m
×
m
的特征值和特征向量,选取最大的K个特征值所对应的特征向量构成矩阵W
n
×
K
,并利用下式进行电力用户特征矩阵的降维处理:
[0041]Z=X
m
×
n
W
n
×
K
[0042]其中:
[0043]Z为降维后的电力用户特征矩阵;
[0044]3)计算Z中任意两个向量之间的相互距离,并将计算结果保存到矩阵D
m
×
m
中,同时计算任意两个向量之间的平均距离T;
[0045]4)根据矩阵D
m
×
m
,计算任意两个特征向量之间的最大距离,并将最大距离两端的特征向量v1,v2作为初始聚类中心;
[0046]5)重复执行4),若新的聚类中心与已知的聚类中心的距离大于T,则认为新的聚类中心有效,直到获取K个聚类中心,其中聚类中心的特征向量即为用户画像描述,在本专利技术一个具体实施例中,将K取为8,同时本专利技术将特征向量本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于大数据的电力用户画像构建方法,其特征在于,所述方法包括:获取电力用户数据,利用基于前缀树的信息挖掘算法对电力用户数据进行信息挖掘,得到电力用户的特征向量;利用基于时序演变的特征向量处理算法对电力用户的特征向量进行处理,得到基于时序演变的电力用户特征向量;利用改进的特征向量聚类算法对基于时序演变的电力用户特征向量进行聚类处理,得到聚类后的电力用户特征,并根据聚类结果,构建电力用户画像;根据所构建的用户画像,构建不同电力用户的通讯信息关系矩阵;构建不同电力用户的移动行为矩阵,并根据不同电力用户的通讯信息关系矩阵和移动行为矩阵,构建电力用户社交画像。2.如权利要求1所述的一种基于大数据的电力用户画像构建方法,其特征在于,所述利用基于前缀树的信息挖掘算法对电力用户数据进行信息挖掘,包括:所述基于前缀树的信息挖掘算法流程为:1)对于电力用户数据B=<s1,s2,...,s
k
>,其中,s
i
是发生在时间i的电力事件,电力用户数据B的长度为k,将电力用户数据B构建为前缀树,其中根节点为空,按照时序递增顺序将电力数据置于子节点中;2)在电力用户数据B的末尾添加一个电力事件,若电力用户数据的持续时间不发生变化,则称该事件为同时性事件SI,若电力用户数据的持续事件加1,则称该事件为序列性事件SE;3)计算所添加的同时性事件SI和序列性事件SE的事件集合:SI(B)=(u(B)+u(SI)+u(SE))/u(CES)其中:u(B)为电力用户数据B的效用值,即电力用户数据B的总发生次数;u(SI)为同时性事件的效用值;u(SE)为序列性事件的效用值;u(CES)为事件的自身效用值与事件序列效用值的总效用和的比值;4)按电力事件的效用值对事件集合中的电力事件进行排序,其中效用值更高的电力事件将处于更为靠前的位置;5)对于同时性事件,将效用值更高的电力事件放置于前缀树中对应时序节点中,对于序列事件,则将效用值更高的电力事件放置于前缀树中对应时序的下一层节点中,其中前缀树中每个节点所存储的事件即为电力用户特征的特征向量。3.如权利要求2所述的一种基于大数据的电力用户画像构建方法,其特征在于,所述利用基于时序演变的特征向量处理算法对电力用户的特征向量进行处理,包括:所述基于时序演变的特征向量处理算法流程为:获取电力用户特征向量m的时间节点,计算时间节点与当前时间节点差值的绝对值|t
m
|;利用时序演变特征权重计算公式计算电力用户特征向量的权重,并将时序演变特征权
重赋于对应的电力用户特征向量,得到基于时序演变的电力用户特征向量,所述时序演变特征权重计算公式为:其中:w
m
为电力用户特征向量m的权重;λ为衰减因子,将其设置为0.4。4.如权利要求3所述的一种基于大数据的电力用户画像构建方法,其特征在于,所述利用改进的特征向量聚类算法对基于时序演变的电力用户特征向量进行聚类处理,包括:1)对于初始给定的m个基于时序演变的电力用户特征向量{m1,m2,...,m
m
},将其转换为m个n维向量组成的电力用户特征矩阵X
m
×
n
,并计算矩阵的协方差矩阵S
m
×
m
=Cov(X
m
×
n
);2)计算得到协方差矩阵S
m
×
m
的特征值和特征向量,选取最大的K个特征值所对应的特征向量构成矩阵W
n
×
K
,并利用下式进行电力用户特征矩阵的...

【专利技术属性】
技术研发人员:汪礼君
申请(专利权)人:汪礼君
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1