一种基于数据分析实现用电用户画像的方法及系统技术方案

技术编号:35174310 阅读:41 留言:0更新日期:2022-10-12 17:40
本发明专利技术提供了一种基于数据分析实现用电用户画像的方法及系统,包括:步骤1:采集用户的历史用电数据,并对所述历史用电数据进行预分类,得到若干类用电数据;步骤2:构建每类用电数据的初始用电行为,并向每一初始用电行为设置用电标签;步骤3:基于标签设置结果,从所有初始用电行为中提取代表用电行为;步骤4:基于所述代表用电行为构建所述用户的用户用电画像。通过对用户的用电行为设置用电标签,并提取代表用电行为,进而来构建用户用电画像,便于精准锁定用户用电需求,间接方便为用户后续用电情况的精准推荐。续用电情况的精准推荐。续用电情况的精准推荐。

【技术实现步骤摘要】
一种基于数据分析实现用电用户画像的方法及系统


[0001]本专利技术涉及数据分析
,特别涉及基于数据分析实现用电用户画像的方法及系统。

技术介绍

[0002]画像即客户信息标签化,就是分析客户信息,抽象出评价其属性及特征的标签,从而刻画出客户全貌。客户画像反映了客户真实的需求,把握住了客户画像就是把握住了客户体验管理的咽喉。
[0003]近年来,随着大数据技术的迅猛发展,不少电力企业基于用户画像,建立与大数据相关的营销体系,以进行精准营销和信息推荐,在进行用户画像确定的过程是基于采集的用户的所有用电数据来进行分析,此种方式不能精准的确定出用户代表行为,进而不能精准的锁定用户用电需求。
[0004]因此,本专利技术提出基于数据分析实现用电用户画像的方法及系统。

技术实现思路

[0005]本专利技术提供基于数据分析实现用电用户画像的方法及系统,用以通过对用户的用电行为设置用电标签,并提取代表用电行为,进而来构建用户用电画像,便于精准锁定用户用电需求,间接方便为用户后续用电情况的精准推荐。
[0006]本专利技术提供基于数据分析实现用电用户画像的方法,包括:步骤1:采集用户的历史用电数据,并对所述历史用电数据进行预分类,得到若干类用电数据;步骤2:构建每类用电数据的初始用电行为,并向每一初始用电行为设置用电标签,包括:获取每类用电数据中不同用电时刻下的用电信息;基于行为分析模型,对对应类用电数据进行行为分析,得到初始用电行为;基于信息解析模型,对所述用电信息进行解析,确定同个用电时刻下的并列用电操作;从所有并列用电操作中提取独有用电操作,并确定每个独有用电操作的操作线;基于所述并列用电操作以及操作线,得到每个操作线的线特征以及每个时刻的并特征;获取每个操作线的有效线,并提取所述有效线中每个用电时刻下的并列用电操作,得到与所述有效线对应的基准特征;基于所述操作线的线特征以及同个操作线中包含的所有基准特征,构建得到对应操作线的特征阵列;基于所述特征阵列,向对应操作线的初始行为点设置子标签,并得到对应初始用电行为的用电标签;
步骤3:基于标签设置结果,从所有初始用电行为中提取代表用电行为;步骤4:基于所述代表用电行为构建所述用户的用户用电画像。
[0007]优选的,采集用户的历史用电数据,包括:确定所述用户的身份标识;建立与所述身份标识相关的用电网络;分别按照所述用电网络中的每个用电分叉,调取所述用户的用电信息,进而得到历史用电数据。
[0008]优选的,对所述历史用电数据进行预分类,得到若干类用电数据,包括:对所述历史用电数据进行数据预处理,得到第一用电数据;确定所述第一用电数据的数据有效性;其中,表示第一用电数据所对应的用电网络的用电分叉总个数;表示第i1个用电分叉对应的用电数据;表示第i个用电分叉对应的噪声数据;表示第i个用电分叉对应的标准数据;表示不同用电分叉做组成的子有效性集合;基于所述子有效性集合,确定所述第一用电数据的数据有效性;其中,表示第i个用电分叉对应的子有效性;表示第i个用电分叉的分叉权重;当所述数据有效性大于预设有效性时,判定所述第一用电数据合格,并按照预分类方式,对所述第一用电数据进行分类,得到若干类用电数据;否则,将每个与对应的预设阈值进行差值计算,并从中筛选得到不在预设差值范围内的第一子有效性;对所有第一子有效性对应的分叉权重进行累加和计算,若累加和计算结果小于预设结果,对所述第一子有效性对应的用电数据按照筛选比例进行随机筛选,得到第一待用数据;否则,将所述第一子有效性对应的分叉权重进行由大到小排序,筛选分叉权重累加和恰好大于预设结果所对应的第二子有效性,并获取与所述第二子有效性对应的第二待用数据;获取在预设差值范围内的第三子有效性,并获取与所述第三子有效性对应的第三待用数据;基于所述第一待用数据、第二待用数据以及第三待用数据,得到合格的第二用电数据,并按照预分类方式,对所述第二用电数据进行分类,得到若干类用电数据。
[0009]优选的,按照预分类方式,对所述第二用电数据进行分类,得到若干类用电数据,包括:获取所述预分类方式的分类指标;按照所述分类指标,在所述第二用电数据中建立分类中心,并基于所述分类中心,得到围绕所述分类中心的分类数据;在分类之后,判断是否遗留有剩余未分类数据;若不存在,将围绕结果作为若干类用电数据;若存在,确定剩余为分类数据中每个第一数据与每个分类中心的第一距离,并按照最小原则,判断同个第一数据对应的最小距离是否只有一个;若是,将对应第一数据归类到对应分类中心;否则,以所述第一数据所在位置为中心,以所述最小距离为半径,构建包围圈;按照所述最小距离对所述包围圈进行扩展的第一区域进行等区域划分,并分别构建每个第二区域中所存在的其余数据位置中每个位置与该第二区域中分类中心连接线;以所述第二区域的分类中心为中心点,构建绘制框,并确定所述绘制框中所包含的线段总长;将对应第一数据归类到最大线段总长对应的分类中心;基于归类结果以及围绕结果,得到若干类用电数据。
[0010]优选的,基于所述特征阵列,向对应操作线的初始行为点设置子标签,包括:确定所述特征阵列中每个特征元素的特征值;基于所述特征元素的元素属性以及特征值,计算得到所述特征阵列的标签设置值;确定所述特征阵列对应的操作线的线类型,并从标签数据库中,调取与所述线类型相关的设置标签符号;将所述标签设置值附加在所述设置标签符号上,并设置在对应操作线的初始行为点上;其中,附加上标签设置值的设置标签符号即为子标签。
[0011]优选的,基于标签设置结果,从所有初始用电行为中提取代表用电行为,包括:基于标签设置结果,确定每个初始用电行为的标签集合;对所述标签集合进行标签解析,得到解析向量;将所述解析向量进行标准化转换,得到标准向量,并计算所述标准向量的当下值;当所述当下值大于预设值时,判定对应的初始用电行为为代表用电行为;否则,将对应初始用电行为剔除。
[0012]优选的,基于所述代表用电行为构建所述用户的用户用电画像,包括:根据每个代表用电行为的行为向量,构建得到对应代表用电行为的行为矩阵;根据所述行为矩阵中每行行为确定矩阵内部相似比值,同时,确定所述行为矩阵的矩阵外部相似比值;基于同个代表用电行为的矩阵内部相似比值以及矩阵外部相似比值,得到相似加权值;基于所有相似加权值

代表用电行为,构建得到所述用户的用户用电画像。
[0013]优选的,根据所述行为矩阵中每行行为确定矩阵内部相似比值,包括:其中,表示对应行为矩阵中行为向量的总个数;=m1

1;表示对应行为矩阵中第j1个行为向量与第j2个行为向量的相似度;表示除去行为向量之外的剩余行为向量与对应行为矩阵中第j1个行为向量的最大相似度;表示对应行为矩阵的矩阵内部相似比值。
[0014]本专利技术提供了基于数据分析实现用电用户画像的系统,包括:预分类模块,用于采集用户的历史用电数据,并对所述历史用电数据进行预分类,得到若干类用电数据;标签设置模块,用于构建每类用电数据的初始用电行为,并向每一初始本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于数据分析实现用电用户画像的方法,其特征在于,包括:步骤1:采集用户的历史用电数据,并对所述历史用电数据进行预分类,得到若干类用电数据;步骤2:构建每类用电数据的初始用电行为,并向每一初始用电行为设置用电标签,包括:获取每类用电数据中不同用电时刻下的用电信息;基于行为分析模型,对对应类用电数据进行行为分析,得到初始用电行为;基于信息解析模型,对所述用电信息进行解析,确定同个用电时刻下的并列用电操作;从所有并列用电操作中提取独有用电操作,并确定每个独有用电操作的操作线;基于所述并列用电操作以及操作线,得到每个操作线的线特征以及每个时刻的并特征;获取每个操作线的有效线,并提取所述有效线中每个用电时刻下的并列用电操作,得到与所述有效线对应的基准特征;基于所述操作线的线特征以及同个操作线中包含的所有基准特征,构建得到对应操作线的特征阵列;基于所述特征阵列,向对应操作线的初始行为点设置子标签,并得到对应初始用电行为的用电标签;步骤3:基于标签设置结果,从所有初始用电行为中提取代表用电行为;步骤4:基于所述代表用电行为构建所述用户的用户用电画像。2.如权利要求1所述的基于数据分析实现用电用户画像的方法,其特征在于,采集用户的历史用电数据,包括:确定所述用户的身份标识;建立与所述身份标识相关的用电网络;分别按照所述用电网络中的每个用电分叉,调取所述用户的用电信息,进而得到历史用电数据。3.如权利要求1所述的基于数据分析实现用电用户画像的方法,其特征在于,对所述历史用电数据进行预分类,得到若干类用电数据,包括:对所述历史用电数据进行数据预处理,得到第一用电数据;确定所述第一用电数据的数据有效性;其中,表示第一用电数据所对应的用电网络的用电分叉总个数;表示第i1个用电分叉对应的用电数据;表示第i个用电分叉对应的噪声数据;表示第i个用电分叉对应的标准数据;表示不同用电分叉做组成的子有效性集合;基于所述子有效性集合,确定所述第一用电数据的数据有效性;
其中,表示第i个用电分叉对应的子有效性;表示第i个用电分叉的分叉权重;当所述数据有效性大于预设有效性时,判定所述第一用电数据合格,并按照预分类方式,对所述第一用电数据进行分类,得到若干类用电数据;否则,将每个与对应的预设阈值进行差值计算,并从中筛选得到不在预设差值范围内的第一子有效性;对所有第一子有效性对应的分叉权重进行累加和计算,若累加和计算结果小于预设结果,对所述第一子有效性对应的用电数据按照筛选比例进行随机筛选,得到第一待用数据;否则,将所述第一子有效性对应的分叉权重进行由大到小排序,筛选分叉权重累加和恰好大于预设结果所对应的第二子有效性,并获取与所述第二子有效性对应的第二待用数据;获取在预设差值范围内的第三子有效性,并获取与所述第三子有效性对应的第三待用数据;基于所述第一待用数据、第二待用数据以及第三待用数据,得到合格的第二用电数据,并按照预分类方式,对所述第二用电数据进行分类,得到若干类用电数据。4.如权利要求3所述的基于数据分析实现用电用户画像的方法,其特征在于,按照预分类方式,对所述第二用电数据进行分类,得到若干类用电数据,包括:获取所述预分类方式的分类指标;按照所述分类指标,在所述第二用电数据中建立分类中心,并基于所述分类中心,得到围绕所...

【专利技术属性】
技术研发人员:张晓毅许力方杨正
申请(专利权)人:国网冀北综合能源服务有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1