当前位置: 首页 > 专利查询>东南大学专利>正文

一种面向区域分布式发电预测的联邦学习方法及系统技术方案

技术编号:38773009 阅读:21 留言:0更新日期:2023-09-10 10:46
本发明专利技术提供一种面向区域分布式发电预测的联邦学习方法及系统,涉及电力预测领域。该面向区域分布式发电预测的联邦学习方法,数据划分步骤,基于划分的数据需求节点和数据供给节点,构建联邦学习初始化模型节点,所述数据需求节点和数据供给节点基于构建的各分布式发电节点历史数据集中按需求数据或供给数据进行划分;成本计算步骤,计算数据供给节点的数据训练成本,判断数据供给节点是否参与数据交互参数训练步骤,将参与数据交互的数据供给节点的梯度参数上传并进行训练,将训练后的梯度参数上传至本地梯度需求节点。解决了如何实现分布式发电历史数据集的安全和高效交易并且提高各个数据用户提供真实数据的积极性的问题。问题。问题。

【技术实现步骤摘要】
一种面向区域分布式发电预测的联邦学习方法及系统


[0001]本专利技术涉及电力预测
,具体为一种面向区域分布式发电预测的联邦学习方法及系统。

技术介绍

[0002]在区域分布式发电预测过程中,历史数据集是进行预测和优化的重要数据资源,但数据保护和隐私问题一直是数据交换的瓶颈。目前,数据交换的常规方式是通过集中式数据中心实现。但这种区域式存在中心化风险和数据隐私问题,如何实现分布式发电历史数据集的安全和高效交易并且提高各个数据用户提供真实数据的积极性是当前需要解决的问题。

技术实现思路

[0003](一)解决的技术问题
[0004]针对现有技术的不足,本专利技术提供了一种面向区域分布式发电预测的联邦学习方法及系统,解决了如何实现分布式发电历史数据集的安全和高效交易并且提高各个数据用户提供真实数据的积极性的问题。
[0005](二)技术方案
[0006]为实现以上目的,本专利技术通过以下技术方案予以实现:
[0007]第一方面,提供了一种面向区域分布式发电预测的联邦学习方法,包括以下步骤:
[0008]数据划分步骤,基于划分的数据需求节点和数据供给节点,构建联邦学习初始化模型节点,所述数据需求节点和数据供给节点基于构建的各分布式发电节点历史数据集中按需求数据或供给数据进行划分;
[0009]成本计算步骤,计算数据供给节点的数据训练成本,判断数据供给节点是否参与数据交互:若数据训练成本小于需求节点提供的报酬中数据训练部分,则数据供给节点参与数据交互;若数据训练成本大于需求节点提供的报酬中数据训练部分,数据供给节点不参与数据交互;
[0010]参数训练步骤,将参与数据交互的数据供给节点的梯度参数上传并进行训练,将训练后的梯度参数上传至本地梯度需求节点。
[0011]优选的,发布数据需求通知的为数据需求节点,其余各区域称之为数据供给节点,其中N个数据供给节点可以表示为P={P1,P2,...,P
n
},M个数据需求节点可以表示为R={R1,R2,...,R
m
},其数据包括但不限于训练成本、所获得的报酬以及温度、光照、空气湿度和出力数据。
[0012]优选的,数据供给节点的数据训练成本由隐私成本、计算成本和数据成本组成,计算成本用于计算模型训练时自身所消耗的资源;隐私成本用于计算降低本地模型在上传时额外泄露隐私信息的成本,通过使用不同的梯度参数,达到最大程度减少隐私泄露的风险的效果;数据成本为不同区域获取本地数据时所花费的成本;将隐私成本、计算成本和数据
成本量化得到训练成本。
[0013]优选的,所述训练成本的计算步骤为:
[0014]计算成本表示为:
[0015]C
unit
(P
i
)=αζc
i
s
i
f
i2
[0016]其中,α为成本调控因子,ζ为获取数据过程中所需要花费的成本,c
i
为数据第i轮运算所需要花费的CPU周期;s
i
为第i轮迭代的样本容量,f
i
为CPU时钟频率;
[0017]经过差分隐私处理后的梯度参数表示为:
[0018][0019]其中,μ,b表示Laplace中分布的位置参数和尺度参数,Δf表示噪声局部敏感度,∈是差分隐私预算;
[0020][0021]其中,隐私成本在计算过程中主要参考隐私预算i;
[0022]将上述隐私成本和计算成本量化后加上数据成本,得到最终的训练成本;训练成本表示为:
[0023][0024]优选的,所述参数训练步骤具体包括:
[0025]在首轮数据交互时,每个节点采用Lstm神经网络对本地数据进行训练,生成并上传本地模型参数,训练完成后的模型参数为:
[0026][0027]其中w
k,t
为节点k经过LSTM神经网络训练t轮过后的神经元权重系数,简称模型参数,为训练过程中的梯度下降,η为Lstm神经网络训练过程中的学习率;
[0028]通过Fedavg算法得到全局模型参数w
G,t
,Fedavg算法生成第t轮全局模型参数w
G,t
的公式如下:
[0029][0030]其中,n为所有参与数据供给节点的总数;K为筛选出的节点个数;
[0031]在接收到梯度参数后,数据需求节点R
i
支付报酬B
i
,通过沙普利值对数据供给节点在联邦学习模型第r轮数据交互中的贡献v(P
ir
)进行报酬分配实现数据供给激励。同时对于连续多次贡献度小于0的数据供给节点予以禁止参与交易处罚。
[0032]优选的,所述数据需求节点根据沙普利值分配数据供给节点的数据供给效用,在联邦学习训练过程中,P
i
拥有随时参与和退出数据供给的权力,每轮供给效用最终累计数据供给节点P
i
参与联邦学习时的沙普利值分配,按其贡献值分配交易报酬计算公式为:
[0033][0034][0035][0036]其中,是第r轮参与数据供给的节点的子集,即表示S
r
不含P
i
的数据供给节点集合,N为数据供给节点的个数,v(P
ir
)为数据供给节点P
i
参加训练后对在第r轮训练中对于模型性能提升的贡献度,其中k1,k2分别为各分布式节点的时间和准确率权重参数,为P
i
的第r轮训练时间,为第r轮所有数据供给节点第轮训练的平均时间,为第r轮所有数据供给节点的平均数据均方差,为P
i
第r轮训练的数据均方差,k1<0表示各分布式区域数据训练时间以短为优,k2<0表示各分布式区域数据均方差也以低为优;
[0037]若数据供给节点P
i
对于模型性能提升贡献度为0,则其ξ
i
也为0,若数据供给节点的模型性能提升贡献度为负时,其可以支付一定报酬换取质量更高的模型参数,完成自身参数的更新;在每轮交易结束之后对各数据供给节点贡献度进行记录,当任一数据供给节点连续三次贡献度为负时,则判定其提供虚假数据,对其禁止参与剩下所有数据交互轮次,实现激励数据供给节点提供真实数据。
[0038]优选的,所述训练步骤过程中,行动策略表示为优选的,所述训练步骤过程中,行动策略表示为为迭代次数,为训练成本,训练成本的策略选择即为通过对控制迭代次数的博弈求得迭代次数和行动策略的最优解,直至所述参数训练步骤结束;
[0039]在行动策略贝叶斯博弈定义如下为其中P代表数据供给节点P
i
,Ω为状态空间,具体代表P
i
的训练成本C
cos
(P
i
),表示数据供给节点的行动策略μ表示数据供给节点P
i
选择时的先验概率,效用函数≥为的行动偏好;P<本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种面向区域分布式发电预测的联邦学习方法,其特征在于,包括以下步骤:数据划分步骤,基于划分的数据需求节点和数据供给节点,构建联邦学习初始化模型节点,所述数据需求节点和数据供给节点基于构建的各分布式发电节点历史数据集中按需求数据或供给数据进行划分;成本计算步骤,计算数据供给节点的数据训练成本,判断数据供给节点是否参与数据交互:若数据训练成本小于需求节点提供的报酬中数据训练部分,则数据供给节点参与数据交互;若数据训练成本大于需求节点提供的报酬中数据训练部分,数据供给节点不参与数据交互;参数训练步骤,将参与数据交互的数据供给节点的梯度参数上传并进行训练,将训练后的梯度参数上传至本地梯度需求节点。2.根据权利要求1所述的一种面向区域分布式发电预测的联邦学习方法,其特征在于:发布数据需求通知的为数据需求节点,其余各区域称之为数据供给节点,其中N个数据供给节点可以表示为P={P1,P2,...,P
n
},M个数据需求节点可以表示为R={R1,R2,...,R
m
},其数据包括但不限于训练成本、所获得的报酬以及温度、光照、空气湿度和出力数据。3.根据权利要求2所述的一种面向区域分布式发电预测的联邦学习方法,其特征在于:数据供给节点的数据训练成本由隐私成本、计算成本和数据成本组成,计算成本用于计算模型训练时自身所消耗的资源;隐私成本用于计算降低本地模型在上传时额外泄露隐私信息的成本,通过使用不同的梯度参数,达到最大程度减少隐私泄露的风险的效果;数据成本为不同区域获取本地数据时所花费的成本;将隐私成本、计算成本和数据成本量化得到训练成本。4.根据权利要求3所述的一种面向区域分布式发电预测的联邦学习方法,其特征在于:所述训练成本的计算步骤为:计算成本表示为:C
unit
(P
i
)=αζc
i
s
i
f
i2
其中,α为成本调控因子,ζ为获取数据过程中所需要花费的成本,c
i
为数据第i轮运算所需要花费的CPU周期;s
i
为第i轮迭代的样本容量,f
i
为CPU时钟频率;经过差分隐私处理后的梯度参数表示为:其中,μ,b表示Laplace中分布的位置参数和尺度参数,表示噪声局部敏感度,∈是差分隐私预算;其中,隐私成本在计算过程中主要参考隐私预算i;将上述隐私成本和计算成本量化后加上数据成本,得到最终的训练成本;训练成本表示为:5.根据权利要求4所述的一种面向区域分布式发电预测的联邦学习方法,其特征在于:
所述参数训练步骤具体包括:在首轮数据交互时,每个节点采用Lstm神经网络对本地数据进行训练,生成并上传本地模型参数,训练完成后的模型参数为:其中w
k,t
为节点k经过LSTM神经网络训练t轮过后的神经元权重系数,简称模型参数,为训练过程中的梯度下降,η为Lstm神经网络训练过程中的学习率;通过Fedavg算法得到全局模型参数w
G,t
,Fedavg算法生成第t轮全局模型参数w
G,t
的公式如下:其中,n为所有参与数据供给节点的总数;K为筛选出的节点个数;在接收到梯度参数后,数据需求节点R
i
支付报酬B
i
,通过沙普利值对数据供给节点在联邦学习模型第r轮数据交互中的贡献v(P
ir
)进行报酬分配实现数据供给激励。同时对于连续多次贡献度小于0的数据供给节点予以禁止参与交易处罚。6.根据权利要求5所述的一种面向区域分布式发电预测的联邦学习方法,其特征在于:所述数据需求节点根据沙普利值分配数据供给节点的数据供给效用,在联邦学习训练过程中,P
i
拥有随时参与和退出数据供给的权力,每轮报酬最终累计数据供给节点P
i
参与联邦学习时的沙普利值分配,按其贡献值分配交易报酬计算公式为:计算公式为:计算公式为:其中,是第r轮参与数据供给的节点的子集,即表示S
r
不含P
i
的数据供给节点集合,N为数据供给节点的个数,v(P
ir
)为数据供给节点P
i
参加训练后对在第r轮训练中对于模型性能提升的贡献度,其中k1,k2分别为各分布式节...

【专利技术属性】
技术研发人员:喻洁鄢鹏阳钱长钰潘祎潘家伟
申请(专利权)人:东南大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1