一种用于光伏功率预测模型训练中的数据保护方法技术

技术编号：37671555 阅读：8 留言：0更新日期：2023-05-26 04:33

本发明专利技术公开了一种用于光伏功率预测模型训练中的数据保护方法，涉及数据保密技术领域，主要包括步骤：接收各参与方以当前轮次的全局模型参数为初始化参数，通过本地数据对本地模型进行训练，并经过加权、编码以及加密公钥加密处理后上传的本地模型参数；根据各参与方上传的处理后的本地参数模型进行求和并下发至当前轮次的所有参与方；接收各参与方通过自身的解密私钥，对求和后的本地参数模型进行解密后获得的解密内容；根据接收的各参与方的解密内容进行求和并解码，将解码后的解密内容作为下一轮次的全局模型参数。本发明专利技术在保证模型训练数据丰度的同时，保护了各参与方的数据安全。安全。安全。

全部详细技术资料下载

【技术实现步骤摘要】
一种用于光伏功率预测模型训练中的数据保护方法

[0001]本专利技术涉及数据保密
，具体涉及一种用于光伏功率预测模型训练中的数据保护方法。

技术介绍

[0002]随着光伏发电系统越来越广泛的应用，以及更多光伏电源接入到配电网中，这对电力系统的规划、运行、控制等各方面都带来了巨大挑战。然而，由于太阳辐射量与气象条件密切相关，造成了光伏发电系统输出功率的随机性与波动性这一固有缺点。在电力储能设施与新能源并网电力的不匹配难以短期内改变的状况下，大规模光伏发电系统接入电网时，会对电力系统的安全稳定经济运行造成很大冲击，导致电网运行调度的困难化与复杂化，这也是光伏发电大规模接入电网亟需解决的关键技术问题。世界各国相继开展了光伏发电功率预测的技术研究，这对于电力系统稳定运行具有非常重要的意义，有助于电力系统调度部门统筹安排常规能源和光伏发电的发电规划，合理安排电网运行方式；有效地降低光伏接入对电网的影响，提高电网运行的安全性和稳定性；减少电力系统的旋转备用和运行成本，以充分利用太阳能资源，获得更大的经济效益和社会效益。
[0003]而随着机器学习算法在各行各业的广泛应用，机器学习算法被更多的应用于预测光伏发电功率预测。目前应用于光伏发电功率预测的机器学习模型主要有循环神经网络模型、卷积神经网络模型以及Transformer系列模型。基于给定的数据，例如数值天气预报、光伏电站功率、气象监测数据等，这类机器学习方法训练模型学习给定数据到光伏发电功率的映射关系，然后这个训练好的模型就可被用于预测未来时间段发电量。
>[0004]现有技术存在的问题是，标准的机器学习方法需要将数据集中到一台服务器训练模型。而国内几乎没有公开的光伏发电功率数据，数据都集中在各个电网内部。因此大多数基于机器学习算法预测光伏发电功率的应用都是基于各自拥有的数据。机器学习算法是数据驱动的方法，理论上训练数据越多，模型性能越好。但由于行业竞争、用户隐私以及数据安全等方面的因素，很难将不同组织之间的数据整合到一起。

技术实现思路

[0005]为了在保证模型训练后的预测精准度的同时，保护各训练参与方的数据安全，本专利技术提出了一种用于光伏功率预测模型训练中的数据保护方法，其采用多密钥同态加密算法进行模型参数的加密以及解密，具体包括步骤：S1：接收各参与方训练数据的样本数目和验证数据的样本数目，并在分别求和后发送至各参与方；S2：基于给定的安全参数进行基于多密钥同态加密算法下各参与方解密私钥以及全体参与方加密公钥的获取；S3：接收各参与方以当前轮次的全局模型参数为初始化参数，通过本地数据对本地模型进行训练，并经过加权、编码以及加密公钥加密处理后上传的本地模型参数；
S4：根据各参与方上传的处理后的本地参数模型进行求和并下发至当前轮次的所有参与方；S5：接收各参与方通过自身的解密私钥，对求和后的本地参数模型进行解密后获得的解密内容；S6：根据接收的各参与方的解密内容进行求和并解码，将解码后的解密内容作为下一轮次的全局模型参数，在达到最大轮次前进入下一轮次并返回S3步骤。
[0006]进一步地，所述S2步骤中，解密私钥和加密公钥的获取具体包括如下步骤：S21：根据给定的的安全参数和多项式次数，通过查表确定多项式模数并构成多项式域；S22：根据多项式域随机选取随机多项式和各参与方的解密私钥，并根据随机多项式和各解密私钥生成加密公钥。
[0007]进一步地，所述S22步骤中，加密公钥的获取表示为如下公式：式中，为第k个参与方的解密私钥，为从多项式域随机选取的随机多项式，为第k个参与方引入的噪声，表示多项式的系数对取模，为模数，为加密公钥中第k个参与方提供的加密子钥，K为参与方总数，为加密公钥中的第一项公钥，为加密公钥。
[0008]进一步地，所述S3步骤中，本地模型参数的加权表示为如下公式：式中，为加权后的第k个参与方本地模型参数，为K个参与方训练数据的样本数目总和，为第k个参与方训练数据的样本数目，为第k个参与方在第t轮次基于其本地数据训练的本地模型参数。
[0009]进一步地，所述S3步骤中，加权、编码后本地模型参数的加密表示为如下公式：
式中，为第k个参与方的第一项密文信息，为第k个参与方的第二项密文信息，为随机生成的多项式，为第k个参与方在加密过程中引入的噪声，为比小的整数，表示多项式的系数对取模，为第k个参与方处理后的本地模型参数。
[0010]进一步地，所述S5步骤中，解密内容的获得表示为如下公式：式中，为各参与方第一项密文之和，为第k个参与方的解密内容，为第k个参与方解密过程中引入的噪声。
[0011]进一步地，所述S3步骤之后，还包括步骤：A1：接收各参与方对当前轮次自身本地参数模型进行验证获得的均方误差。
[0012]进一步地，所述A1步骤之后，还包括步骤：A2：根据各参与方上传的均方误差进行加权并求和，并作为当前轮次全局模型的整体表现。
[0013]进一步地，所述S6步骤中，当达到最大轮次之后，还包括步骤：A3：选取各轮次中均方误差加权求和最小值对应的全局模型为最终预测模型。
[0014]进一步地，所述A2步骤中，均方误差的加权求和表示为如下公式：式中，K为参与方的总数，k和i为常数，为第k个参与方验证数据的样本数目，为K个参与方验证数据的样本数目总数，为第k个参与方基于更新后的全局模型在本地验证集数据上得到的均方误差。
[0015]与现有技术相比，本专利技术至少含有以下有益效果：（1）本专利技术所述的一种用于光伏功率预测模型训练中的数据保护方法，通过将横向联邦学习方法与多密钥同态加密算法相结合，帮助各参与方在无需提供具体数据的情况下就能实现多数据下的全局模型训练，从而在提高训练后模型预测精度的同时，保护了各参与方的数据安全；（2）采用多密钥同态加密算法进行解密私钥和加密公钥的设置，通过共用加密公钥保证加密后数据能够被服务器整合，而采用各参与方私有的加密私钥进行解密，则能保证参与方无法获得全部的数据，从而保证了数据的安全性；（3）由于只是对模型参数进行加密，而对模型框架没有限定，因此可以适用于多种模型结构。
附图说明
[0016]图1为一种用于光伏功率预测模型训练中的数据保护方法的步骤图；图2为客户端
‑
服务器端模式的横向联邦学习框架。
具体实施方式
[0017]以下是本专利技术的具体实施例并结合附图，对本专利技术的技术方案作进一步的描述，但本专利技术并不限于这些实施例。
[0018]为保护数据隐私，目前也有基于联邦学习方法训练预测模型的分布式训练系统，这类系统通过在多个拥有本地数据的参与方之间进行分布式模型训练，在不需要交换本地数据的前提下，仅通过交换模型参数的方式，构建基于虚拟融合数据下的全局模型，从而实现数据隐私保护和数据共享计算的平衡。目前主流的联邦学习方法为横向联邦学习方法。各个参与方基于本地数据训练一个本地模型，并且将该本地模型的参数共享。将各个参与方的本地模型的参数做加权平均即可得到一个全局模型的参数。因此，联邦学习本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种用于光伏功率预测模型训练中的数据保护方法，其特征在于，采用多密钥同态加密算法进行模型参数的加密以及解密，具体包括步骤：S1：接收各参与方训练数据的样本数目和验证数据的样本数目，并在分别求和后发送至各参与方；S2：基于给定的安全参数进行基于多密钥同态加密算法下各参与方解密私钥以及全体参与方加密公钥的获取；S3：接收各参与方以当前轮次的全局模型参数为初始化参数，通过本地数据对本地模型进行训练，并经过加权、编码以及加密公钥加密处理后上传的本地模型参数；S4：根据各参与方上传的处理后的本地参数模型进行求和并下发至当前轮次的所有参与方；S5：接收各参与方通过自身的解密私钥，对求和后的本地参数模型进行解密后获得的解密内容；S6：根据接收的各参与方的解密内容进行求和并解码，将解码后的解密内容作为下一轮次的全局模型参数，在达到最大轮次前进入下一轮次并返回S3步骤。2.如权利要求1所述的一种用于光伏功率预测模型训练中的数据保护方法，其特征在于，所述S2步骤中，解密私钥和加密公钥的获取具体包括如下步骤：S21：根据给定的的安全参数和多项式次数，通过查表确定多项式模数并构成多项式域；S22：根据多项式域随机选取随机多项式和各参与方的解密私钥，并根据随机多项式和各解密私钥生成加密公钥。3.如权利要求2所述的一种用于光伏功率预测模型训练中的数据保护方法，其特征在于，所述S22步骤中，加密公钥的获取表示为如下公式：式中，为第k个参与方的解密私钥，为从多项式域随机选取的随机多项式，为第k个参与方引入的噪声，表示多项式的系数对取模，为模数，为加密公钥中第k个参与方提供的加密子钥，K为参与方总数，为加密公钥中的第一项公钥，为加密公钥。4.如权利要求3所述的一种用于光伏功率预测模型训练中的数据保护方法，其特征在于，所述S3步骤中，本地模型参数的加权表示为如下公式：式中，为加权后的第k个参与方本地模型参数，为...

【专利技术属性】
技术研发人员：张东晓，陈云天，赵辛，李哲，蒋春碧，
申请(专利权)人：深圳市峰和数智科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人