一种用户聚类方法、装置、电子设备和存储介质制造方法及图纸

技术编号:35411397 阅读:12 留言:0更新日期:2022-11-03 11:07
本公开提供了一种用户聚类方法、装置、电子设备和存储介质,涉及人工智能领域,具体涉及机器学习技术。其中,具体实现方案包括:接收服务端发送的全局字典模型;其中,全局字典模型中包括至少一个初始化的子字典模型;从初始化的子字典模型中选出一个目标子字典模型;根据智能电表本地存储的用户用电数据,对目标子字典模型进行更新;将更新后的目标子字典模型反馈到服务端,使得服务端根据不同智能电表所反馈目标子字典模型更新全局字典模型,并根据更新后的全局字典模型得到用户聚类结果。本公开采用联邦学习式用户聚类的方案,并不需要用户将各自电表中的原始用电数据上传到服务器,如此在源头避免出现用户用电数据被泄漏的问题。题。题。

【技术实现步骤摘要】
一种用户聚类方法、装置、电子设备和存储介质


[0001]本公开涉及人工智能领域,具体涉及机器学习技术,尤其涉及一种用户聚类方法、装置、电子设备和存储介质。

技术介绍

[0002]电力行业的用户聚类是一种构成用户画像的方式。它可以帮助电力供应者了解电力用户的行为特征,进而更好的进行电力调度。
[0003]目前常用的用户聚类方法都是中心式的算法,也即用户需要将各自的用电数据上传到中央服务器,由中央服务器根据接收的用电数据进行聚类处理。而这样的方式仍存在一定的不足:存在用户用电数据泄漏的风险,例如在数据上传中受到通信攻击,或者存储在中央服务器时,服务器被攻击造成大规模数据泄露。

技术实现思路

[0004]本公开提供了一种用户聚类方法、装置、电子设备和存储介质,可以达到在源头避免用户用电数据被泄漏的效果。
[0005]根据本公开的一方面,提供了一种用户聚类方法,应用于智能电表,包括:
[0006]接收服务端发送的全局字典模型;其中,所述全局字典模型中包括至少一个初始化的子字典模型,所述子字典模型包含预设的电器设备信息;
[0007]从初始化的子字典模型中选出一个目标子字典模型;
[0008]根据所述智能电表本地存储的用户用电数据,对所述目标子字典模型进行更新;
[0009]将更新后的所述目标子字典模型反馈到所述服务端,使得所述服务端根据不同智能电表所反馈目标子字典模型更新所述全局字典模型,并根据更新后的全局字典模型得到用户聚类结果。
[0010]根据本公开的一方面,提供了一种用户聚类方法,应用于服务端,包括:
[0011]从全量电力用户中选出至少一个目标用户,将全局字典模型发送到所述目标用户关联的智能电表中,使得所述智能电表从所述全局字典模型中选择一个初始化的目标子字典模型并对所述目标子字典模型进行更新;
[0012]接收所述智能电表反馈的更新后的目标子字典模型;
[0013]根据所述更新后目标子字典模型,对所述全局字典模型进行更新,并根据更新后的全局字典模型得到用户聚类结果。
[0014]根据本公开的另一方面,提供了一种用户聚类装置,配置于智能电表,包括:
[0015]第一接收模块,用于接收服务端发送的全局字典模型;其中,所述全局字典模型中包括至少一个初始化的子字典模型,所述子字典模型包含预设的电器设备信息;
[0016]字典选择模型,用于从初始化的子字典模型中选出一个目标子字典模型;
[0017]第一字典更新模块,用于根据所述智能电表本地存储的用户用电数据,对所述目标子字典模型进行更新;
[0018]上传模块,用于将更新后的所述目标子字典模型反馈到所述服务端,使得所述服务端根据不同智能电表所反馈目标子字典模型更新所述全局字典模型,并根据更新后的全局字典模型得到用户聚类结果。
[0019]根据本公开的另一方面,提供了一种用户聚类装置,配置于服务端,包括:
[0020]用户选择与字典下发模块,从全量电力用户中选出至少一个目标用户,将全局字典模型发送到所述目标用户关联的智能电表中,使得所述智能电表从所述全局字典模型中选择一个初始化的目标子字典模型并对所述目标子字典模型进行更新;
[0021]第二接收模块,用于接收所述智能电表反馈的更新后的目标子字典模型;
[0022]第二字典更新模块,用于根据所述更新后目标子字典模型,对所述全局字典模型进行更新,并根据更新后的全局字典模型得到用户聚类结果。
[0023]根据本公开的另一方面,提供了一种电子设备,包括:
[0024]至少一个处理器;以及
[0025]与至少一个处理器通信连接的存储器;其中,
[0026]存储器存储有可被至少一个处理器执行的指令,指令被至少一个处理器执行,以使至少一个处理器能够执行本公开任意实施例的用户聚类方法。
[0027]根据本公开的另一方面,提供了一种存储有计算机指令的非瞬时计算机可读存储介质,计算机指令用于使计算机执行本公开任意实施例的用户聚类方法。
[0028]根据本公开的技术,通过接收服务端分发的字典模型,再根据本地的数据对字典模型进行更新,进而将更新后的算法模型传回至服务器之中,以便服务器根据每个用户更新的字典模型对全局字典模型进行更新,进而根据更新的全局模型进行用户聚类。如此,用户并不需要将各自电表中的原始用电数据上传到服务器,如此在源头避免出现用户用电数据被泄漏的问题;而且利用了智能电表所具备的基本运算能力,将原本巨大的运算处理需求分解分配至各个智能电表进行。而服务端只需要少量的聚合算法即可,极大地缓和对计算资源地需求。另外,智能电表所带来更细粒度的数据可以让用户聚类的结果更加精确。
[0029]应当理解,本部分所描述的内容并非旨在标识本公开的实施例的关键或重要特征,也不用于限制本公开的范围。本公开的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0030]附图用于更好地理解本方案,不构成对本公开的限定。其中:
[0031]图1是本公开实施例提供的一种用户聚类方法的流程示意图;
[0032]图2是本公开实施例提供的又一种用户聚类方法的流程示意图;
[0033]图3是本公开实施例提供的一种用户聚类装置的结构示意图;
[0034]图4是本公开实施例提供的又一种用户聚类装置的结构示意图;
[0035]图5是用来实现本公开实施例的用户聚类方法的电子设备的框图。
具体实施方式
[0036]以下结合附图对本公开的示范性实施例做出说明,其中包括本公开实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本公开的范围和精神。同
样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。
[0037]本公开实施例中,随着智能电表的普及和商用化,可通过智能电表得到很多细粒度的用户用电数据。相比之前粗粒度的用户用电数据,现在得到的细粒度的用户用电数据能够揭示更多的用户用电行为。然而,非侵入式负载监控技术等负载分解技术的兴起,不仅方便了用户了解自己的电器使用状况,也让用户的隐私(生活习惯,用电行为等信息)更容易被别有用心的人所得。由用户用电数据泄露而产生的隐私问题,已越来越严重也越来越受到人们的关注。
[0038]电力供应者为了了解电力用户的行为特征以便更好的进行电力系统调度,节省电力资源,通常会利用电力用户的用电数据,对电力用户进行聚类,以得到电力用户的画像。当下主要使用的用户聚类算法都是中心式的算法,也即是用户需要将用电数据上传到中央服务器再进行后续的处理。而这样的方式会让用户的用电数据可能在很多的地方泄露,比如在数据上传中受到通信攻击,或者存储在中央服务器时服务器被攻击造成大规模数据泄露等。因此,本公开提出一种分布式的不需要用户上传自身用电数据的用户聚类算法,以此避免这一类问题的出本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用户聚类方法,其特征在于,应用于智能电表,所述方法包括:接收服务端发送的全局字典模型;其中,所述全局字典模型中包括至少一个初始化的子字典模型,所述子字典模型包含预设的电器设备信息;从初始化的子字典模型中选出一个目标子字典模型;根据所述智能电表本地存储的用户用电数据,对所述目标子字典模型进行更新;将更新后的所述目标子字典模型反馈到所述服务端,使得所述服务端根据不同智能电表所反馈目标子字典模型更新所述全局字典模型,并根据更新后的全局字典模型得到用户聚类结果。2.根据权利要求1所述的方法,其特征在于,所述从初始化的子字典模型中选出一个目标子字典模型,包括:依次对各初始化的子字典模型进行稀疏系数编码并计算损失结果,将损失最小的字典模型作为所述目标子字典模型。3.根据权利要求2所述的方法,其特征在于,所述子字典模型为平移不变的字典模型;相应的,所述依次对各初始化的子字典模型进行稀疏系数编码并计算损失结果,包括:针对任一初始化的子字典模型,固定所述子字典模型的各个基底不变,通过坐标轴下降方法,计算用户用电数据的最佳稀疏组合系数以及所述子字典模型中每个基底的最佳平移单位;基于用户用电数据、固定的子字典模型、最佳稀疏组合系数以及子字典模型中每个基底的最佳平移单位,计算损失结果。4.根据权利要求3所述的方法,其特征在于,根据所述智能电表本地存储的用户用电数据,对所述目标子字典模型进行更新,包括:固定所述最佳稀疏组合系数以及所述目标子字典模型中每个基底的最佳平移单位不变;基于所述用户用电数据,采用投影梯度下降方法对所述目标子字典模型的每个基底进行更新。5.一种用户聚类方法,其特征在于,应用于服务端,所述方法包括:从全量电力用户中选出至少一个目标用户,将全局字典模型发送到所述目标用户关联的智能电表中,使得所述智能电表从所述全局字典模型中选择一个初始化的目标子字典模型并对所述目标子字典模型进行更新;接收所述智能电表反馈的更新后的目标子字典模型;根据所述更新后目标子字典模型,对所述全局字典模型进行更新,并根据更新后的全局字典模型得到用户聚类结果。6.根据权利要求5所述的方法,其特征在于,从全量电...

【专利技术属性】
技术研发人员:陈凤超张鑫邱泽坚苏俊妮黄安平刘铮周立德胡润锋何毅鹏邓景柱赵俊炜徐睿烽李祺威刘沛林饶欢张锐段孟雍郭清元
申请(专利权)人:广东电网有限责任公司东莞供电局
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1