一种基于联合矩阵分解模型的电力用户细分方法技术

技术编号:13086028 阅读:79 留言:0更新日期:2016-03-30 17:00
一种基于联合矩阵分解模型的电力用户细分方法。其包括输入用户的用电记录数据并构建用户用电记录矩阵;输入用户地理位置信息并用层级表示,构建用户地理位置信息相似度矩阵,调节不同层级地理位置信息中不同组成部分权重;根据用户用电记录矩阵构建联合矩阵分解模型的目标函数,并选择合理的目标函数求解算法进行求解,以得到用户用电需求;根据用户用电需求对用户进行细分。本发明专利技术相比于传统方法,用户在需求空间中的表示具有更加丰富的涵义。采用聚类算法,在隐含需求空间中综合考虑用户本身的特性和用户间关系对用户进行聚类,每个簇中的用户的关联关系更加紧密。不同簇之间,用户在用电需求和地理位置等方面均存在较大差异。

【技术实现步骤摘要】

本专利技术属于计算机应用技术,数据挖掘,电力数据分析
,特别是设及一种 基于联合矩阵分解模型的电力用户细分方法
技术介绍
随着电网信息化水平的提高,电力系统中产生了大量的数据,同时也给电力数据 的分析带来了新的挑战。传统的电力数据分析侧重于对生产和供电环节中产生数据的研 究,对用户数据的分析往往是针对所有用户的,从而忽略了用户本身的特点及用户之间的 关联关系。用户数据中通常包含用户的用电行为、地理位置、时间、日期等信息,而目前的用 户数据分析,比较普遍的作法是使用聚类算法根据用电记录对用户进行划分,缺少对其他 信息的综合分析,而运些信息中往往包含影响用户用电行为的重要因素。 例如,王雷分析了电力行业客户行为特征,采用k-means算法根据用户的用电行 为,对用户行为进行聚类。而吴玲等采用终身价值理论,通过广泛调研和专家咨询,构建了 电力用户价值评估体系,并运用层次分析法来评估用户价值。宋才华等运用客户综合价值 评估方法建立了客户细分模型,构建了基于客户综合价值的细分指标体系,运用赌权法和 专家经验相结合的方式进行用户细分。有些研究人员从用户可靠性要求、用户价值和用户 行为Ξ个维度,建立细分指标体系,利用k-means算法对用户进行聚类。还有些研究人员通 过构建电力大客户行为和价值评估指标体系,得到电力大客户的需求特征和经济价值评 估,并设计大客户信用综合测评体系,实现对电力大客户较全面准确的精细化分类。 矩阵分解模型是近年来较为流行的多变量分析模型,因其在文本和图像等数据上 具有良好的可解释性,在数据挖掘领域有着十分广泛的应用。矩阵分解模型将数据矩阵分 解为隐藏特征矩阵和系数矩阵的乘积,得到原始输入数据在低维隐藏特征空间中的表示。 Lee和Seung等人提出一种非负矩阵分解模型,通过对输入数据矩阵和输出隐藏特征矩阵W 及系数矩阵采用非负约束,得到文本和图像的表示,并进行文本聚类和图像恢复。而化i和 化等人在此基础上,采用关系图来约束数据在隐含空间中的表示,提高了非负矩阵分解模 型在文本聚类中的性能。而有些研究人员提出一种关系约束的矩阵分解模型,融合数据间 关联关系和数据内容,抽取隐含特征,并在文本分类数据中取得良好效果。Takeuchi等人则 将多个非负矩阵共同分解,融合用户记录、用户社交关系和歌曲标签,得到用户和歌曲在的 统一表示,并进行歌曲推荐。
技术实现思路
[000引为了解决上述问题,本专利技术的目的在于提供一种基于联合矩阵分解模型的电力用 户细分方法。 为了达到上述目的,本专利技术提供的基于联合矩阵分解模型的电力用户细分方法包 括按顺序执行的下列步骤: 步骤1)输入用户的用电记录数据,根据用电记录数据构建用户的用电记录矩阵; 输入用户的地理位置信息,将用户的地理位置信息用层级表示,构建用户的地理位置信息 相似度矩阵,并调节不同层级的地理位置信息中不同组成部分的权重; 步骤2)根据步骤1)获得的用户的用电记录矩阵构建联合矩阵分解模型的目标函 数,分析影响用户用电行为的时间因素与日期因素,并选择合理的目标函数求解算法进行 求解,W得到用户用电需求; 步骤3)根据上述用户用电需求对用户进行细分: 在用户细分过程中,需要计算两个基本指标:1)不同用户的用电需求矩阵的相似 度的衡量指标,2) -个用户分组中,所有用户的整体用电需求矩阵的计算。 在步骤1)中,所述的输入用户的用电记录数据,根据用户的用电记录数据构建用 电记录矩阵的方法为: 所输入的用户用电记录数据中的所有用户被表示为集合: U={ui,U2,...,un} 其中N表示数据中包含的用户个数,ui表示第i个用户。 第i个用户的用电记录数据被构建为用电记录矩阵: U, e 吸严 其中D表示数据中用电记录包含的天数,T表示每个用户每天的用电记录包含的均 匀采样点的个数,岭?表示T行D列的非负实数矩阵。同时,用巧和货分别表示矩阵化的第t 行和第d列,即用户Ui在每天第t个时间点上的所有用电记录和在第d天的用电记录,并用Mf 表示矩阵化的第t行第d列上的元素; 最终,输出所有用户的用电记录矩阵:Q 在步骤1)中,所述的输入用户的地理位置信息,将用户的地理位置信息用层级表 示,构建用户的地理位置信息相似度矩阵,并调节不同层级的地理位置信息中不同组成部 分的权重的方法为: 第i个用户的地理位置信息被表示为结构体: 其中妊为居住地点中某个组成部分的字符串表示,貧按行政单位,即省、城市、区 县、乡镇、街道、小区等,从大到小的顺序排列; 第i个用户和第j个用户的地理位置信息相似度计算公式为: 其中el嗦示两个用户地理位置信息的相似度值,δ(.,.)为逻辑函数,当两个字 符串相同时取值1,否则为〇,λι^Ε(〇, 1)为平衡参数,用于调节地理位置信息中不同组成部 分的权重,通过系统在验证数据集上的结果来调节平衡参数的选择; 最终,输出所有用户的地理位置信息相似度矩阵: Ee 吸;XW 田 在步骤2)中,所述的构建用电记录矩阵联合分解的目标函数的方法为: (1)最大可能地降低每个用户的用电记录矩阵在分解为时间因素矩阵和日期因素 矩阵过程中的损失公式为: min h= ||Ui-ViSiT| |2 其中Vi表示影响第i个用户用电行为的时间因素矩阵,Si表示影响第i个用户用电 行为的日期因素矩阵; (2)保持不同用户的用电记录矩阵分解得到的日期因素矩阵的一致性: 在此,所有N个用户的分解目标函数被融合到一起,并共享日期因素矩阵; (3)最大可能地降低在地理位置上相邻的用户的时间因素矩阵的差异: (4)最大可能地保持时间因素矩阵的平滑: (5)最大可能地保持日期因素矩阵的平滑: minl5=||S||2 在此,采用矩阵的L2范式的平方II · II2来使矩阵保持平滑。 最终,通过融合步骤(2)、(3)、(4)、(5)中的各项目标函数得到联合矩阵分解模型 的目标函数:[004引其中α、β和丫为平衡参数,用于调节各项目标函数之间的权重,可通过系统在验证 数据集上的结果来调节平衡参数的选择。 在步骤2)中,所述的选择合理的目标函数求解算法进行求解的方法包括如下步 骤: 步骤2.1)初始化矩阵Vi,V2,....Vw €龄《和S6 的S2.1阶段: K表示隐藏空间中用户需求变量的个数,矩阵Vi,V2,…Vn和S中的每个元素被随机 初始化为0到1之间的实数;步骤2.2)对矩阵Vi中每个元素进行求导的S2.2阶段: 根据最终目标函数对Vi中每个元素求导,具体公式为: 步骤2.3)对矩阵Vi中每个元素进行更新的S2.3阶段: 每个皆分别减去步长乘W梯度,具体的更新公式为疗^皆-巧是人工设定的 步长; 步骤2.4)判断所有Vi矩阵是否更新完毕的S2.4阶段: 若所有的矩阵Vi均更新完毕,则进行步骤2.5)阶段,否则返回步骤2.2)对下一个Vi 进行更新; 步骤2.5)对矩阵S中每个元素进行求导的S2当前第1页1 2 3 4 本文档来自技高网
...

【技术保护点】
一种基于联合矩阵分解模型的电力用户细分方法,其特征在于:所述的基于联合矩阵分解模型的电力用户细分方法包括按顺序执行的下列步骤:步骤1)输入用户的用电记录数据,根据用电记录数据构建用户的用电记录矩阵;输入用户的地理位置信息,将用户的地理位置信息用层级表示,构建用户的地理位置信息相似度矩阵,并调节不同层级的地理位置信息中不同组成部分的权重;步骤2)根据步骤1)获得的用户的用电记录矩阵构建联合矩阵分解模型的目标函数,分析影响用户用电行为的时间因素与日期因素,并选择合理的目标函数求解算法进行求解,以得到用户用电需求;步骤3)根据上述用户用电需求对用户进行细分:在用户细分过程中,需要计算两个基本指标:1)不同用户的用电需求矩阵的相似度的衡量指标,2)一个用户分组中,所有用户的整体用电需求矩阵的计算。

【技术特征摘要】

【专利技术属性】
技术研发人员:王扬刘杰吴凡章斌魏睐杨得博梅振鹏郎赫
申请(专利权)人:国网天津市电力公司国家电网公司
类型:发明
国别省市:天津;12

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1