一种在智能电厂中基于联邦学习提升火灾检测效果的方法技术

技术编号:27937723 阅读:11 留言:0更新日期:2021-04-02 14:18
本发明专利技术公开了一种在智能电厂中基于联邦学习提升火灾检测效果的方法,通过结合DTs和深度Q网络(Deep Q Network,DQN)来自适应地降低能耗,同时设计一个异步联邦学习框架消除流浪者效应。DT可以做到精确建模和同步更新,进而加强智能电厂的智能性。同时DT也可以通过软件定义并在数字空间中创造虚拟对象,根据虚拟对象的状态和功能在物理空间中准确地映射出实体,有助于帮助决策和执行。最后,DT会将设备的运行状态和行为实时映射到数字世界,从而提高学习模型的可靠性和准确性。

【技术实现步骤摘要】
一种在智能电厂中基于联邦学习提升火灾检测效果的方法
本专利技术属于工业物联网提升联邦学习训练
,特别涉及一种在一种在智能电厂中基于联邦学习提升火灾检测效果的方法。
技术介绍
随着社会对清洁能源需求的不断增加,清洁能源的产业不断扩大,清洁能源特别是光伏产业规模在近年得到迅速增长。一些负责分布式新能源项目的投资、建设和运营工作的公司管理着多个分布式光伏电站,分布在国家的各个角落。公司建设有生产运营中心,对所有的分布式电站进行集中运行管理。同时光伏发电系统主要由光伏组件、控制器、逆变器、蓄电池及其他配件组成。随着光伏电站运行时间的增加,配件和线路逐渐老化,光伏板上热斑产生的概率不断增加。这不仅会降低光伏电站的发电效率,也可能导致火灾,带来巨大的经济损失。由于每个电厂都有各自数据,电厂之间的数据往往都各自存储,各自定义。每个电厂的数据就像一个个孤岛一样无法(或者极其困难)和其他电厂数据进行连接互动。我们把这样的情况称为数据孤岛。简单说就是数据间缺乏关联性,数据库彼此无法兼容。在这种情况下,可以使多个智能电厂基于联邦学习进行火灾检测,并采用异步联邦学习框架对训练效果进行优化。尽管目前可以通过使用数字孪生体(Digitaltwins,DTs)来提高智能电厂中物理设备信息的实时性和可靠性。然而,DTs是由数据驱动的,其决策必定会需要各种设备上的大量数据去支持。在现实中,由于竞争、隐私以及安全的问题,几乎不可能将分散在各个设备上的数据进行集中。因此,在智能电厂中,存在有着隐私保护,成本价格和数据安全等等问题。<br>当涉及到隐私保护、监管需求、数据竖井、成本价格和连接可靠性等问题时,通过在智能电厂中使用联邦学习可以保护隐私,降低通信成本。在隐私保护方面,现有的工作主要是应用同态加密和差分隐私等技术设计高安全保障的联邦学习算法模型。但是,安全性的提升伴随着系统成本的增长,加密、噪声等操作同时也会影响模型的学习效率。YunlongLu等人改进后的异步模式的学习框架虽然加速了学习的收敛速度,但由于这种框架面向点对点的通信场景,会给系统带来很大的通信负担。同时,已有的联邦学习工作主要集中在更新体系结构,聚合策略和频率聚合三方面上。在更新体系架构方面,已有的算法大多采用同步架构。然而,同步架构并不适用于节点资源是异构的情况。
技术实现思路
本专利技术的目的在于提供一种在智能电厂中基于联邦学习提升火灾检测效果的方法,以解决上述问题。为实现上述目的,本专利技术采用以下技术方案:一种在智能电厂中基于联邦学习提升火灾检测效果的方法,包括以下步骤:步骤1,在给定资源预算的时变通信环境中得到局部更新和全局参数聚合,建立聚合频率问题模型,对其进行简化;步骤2,通过使用深度强化学习来解决本地频率更新的问题,DT通过与环境交互学习模型;将优化后的问题制定为MDP模型,其中包括系统状态S(t),动作空间A(t),策略P,奖励函数R和下一状态S(t+1);步骤3,基于DQN的聚合频率优化算法解决MDP问题;步骤4,基于DQN的异步联邦学习,通过聚类对具有不同计算能力的节点进行分类,并为每个聚类配置相应的管理者,使每个聚类能够以不同的本地聚合频率自主训练;对于集群,通过基于DQN的自适应聚合频率校准算法获得聚合频率;进一步的,步骤1具体包括:聚合频率问题P1表述为:其中wk表示第k个全局聚合之后的全局参数,F(wk)是第k次全局聚合后的损失值,{a0,a1,...,ak}是一组本地更新频率的策略,ai指示第i次全局更新所需的本地更新数量;条件(1a)表示现有资源的既定预算,β表示整个学习过程中资源消耗率的上限;通过信任聚合来校准由于DT在节点计算能力中的映射偏差而导致的计算能耗Ecmp的偏差;经过k轮全局聚合,简化P1和长期资源预算约束,训练的损失值写为:其中最优训练结果就是:基于Lyapunov优化,将长期资源预算划分为每个时隙的可用资源预算,通过建立动态资源短缺队列,实现了P1的简化;资源短缺队列的长度被定义为所使用的资源和可用资源之间的差异;资源总量的限制是Rm,第k次聚合中可用的资源是βRm/k;资源短缺队列的表示如下:Q(i+1)=max{Q(i)+(aiEcmp+Ecom)-βRm/k,0}(4)其中,(aiEcmp+Ecom)-βRm/k是第k个聚合中资源的偏差;从而,原始问题P1转化为以下问题P2:其中v和Q(i)是与性能提升难度和资源消耗队列有关的权重参数,v随着训练回合的增加而增加。进一步的,公式(1)和条件(1a)中,损失值F(wk)和计算能耗Ecmp分别包含训练状态和计算能力f(i),由DT对其进行估计,确保能够掌握整个联邦学习的关键状态。进一步的,步骤2具体包括:系统状态:系统状态描述每个节点的特征和训练状态,包括所有节点的当前训练状态资源短缺队列Q(i)的当前状态和每个节点τ(t)的神经网络隐藏层输出的verage值,即,动作空间:该动作集定义为向量表示需要离散化的本地更新的数量;由于决策基于特定时间t,用ai代替奖励函数:目标是确定本地更新和全局参数聚合之间的最佳权衡,以最小化损失函数,奖励函数与总体损失函数的下降程度和资源短缺队列的状态有关;其评估函数:R=[vF(wi-1)-F(wi)]-Q(i)(aiEcmp+Ecom)(7)下一状态:当前状态S(t)由DT实时映射提供,下一个状态S(t+1)是DT对DQN模型在现实运行后状态的预测,表示为S(t+1)=S(t)+P(S(t))。进一步的,步骤3具体包括:训练完成后,将拟定的频率决策部署到管理人上,并根据设备的DT进行自适应聚合频率校准;首先,DT提供训练节点和信道状态,作为训练后DQN的输入;然后通过评估网络得到输出动作的概率分布,并根据贪心策略找到合适的动作作为执行动作;最后在联邦学习中执行选定的动作,并将得到的环境反馈值存储在状态数组,以方便进行再训练。进一步的,步骤4具体包括:步骤一:节点聚类;首先使用K-means聚类算法,根据数据大小和计算能力对节点进行分类,并分配相应的管理者以形成本地训练集群;步骤二:决定聚合频率;每个集群通过运行簇内聚合频率决策算法获得相应的全局聚合频率;使用本轮本地更新所需的最大时间Tm作为基准,并指定其他簇的训练时间不能超过αTm,其中α是0到1之间的公差因子;随着全局聚合次数的增加,容忍因子α增加,全局聚合对学习效率的影响减弱;步骤三:本地聚合;根据DQN给定的频率完成本地训练后,每个集群的管理人使用信任加权聚合策略对节点上传的参数进行本地聚合;具体来说,管理人需要检索更新后的信用值并评估不同节点的重要性;同时让映射偏差变小,让学习质量高的节点上传的参数在局部聚合中占较大的权重,进而提高了模型的准确性和收敛效率;步骤四:全局聚合;最后,时间加权聚合用于聚合全局参本文档来自技高网
...

【技术保护点】
1.一种在智能电厂中基于联邦学习提升火灾检测效果的方法,其特征在于,包括以下步骤:/n步骤1,在给定资源预算的时变通信环境中得到局部更新和全局参数聚合,建立聚合频率问题模型,对其进行简化;/n步骤2,通过使用深度强化学习来解决本地频率更新的问题,DT通过与环境交互学习模型;将优化后的问题制定为MDP模型,其中包括系统状态S(t),动作空间A(t),策略P,奖励函数R和下一状态S(t+1);/n步骤3,基于DQN的聚合频率优化算法解决MDP问题;/n步骤4,基于DQN的异步联邦学习,通过聚类对具有不同计算能力的节点进行分类,并为每个聚类配置相应的管理者,使每个聚类能够以不同的本地聚合频率自主训练;对于集群,通过基于DQN的自适应聚合频率校准算法获得聚合频率。/n

【技术特征摘要】
1.一种在智能电厂中基于联邦学习提升火灾检测效果的方法,其特征在于,包括以下步骤:
步骤1,在给定资源预算的时变通信环境中得到局部更新和全局参数聚合,建立聚合频率问题模型,对其进行简化;
步骤2,通过使用深度强化学习来解决本地频率更新的问题,DT通过与环境交互学习模型;将优化后的问题制定为MDP模型,其中包括系统状态S(t),动作空间A(t),策略P,奖励函数R和下一状态S(t+1);
步骤3,基于DQN的聚合频率优化算法解决MDP问题;
步骤4,基于DQN的异步联邦学习,通过聚类对具有不同计算能力的节点进行分类,并为每个聚类配置相应的管理者,使每个聚类能够以不同的本地聚合频率自主训练;对于集群,通过基于DQN的自适应聚合频率校准算法获得聚合频率。


2.根据权利要求1所述的一种在智能电厂中基于联邦学习提升火灾检测效果的方法,其特征在于,步骤1具体包括:
聚合频率问题P1表述为:






其中wk表示第k个全局聚合之后的全局参数,F(wk)是第k次全局聚合后的损失值,{a0,a1,...,ak}是一组本地更新频率的策略,ai指示第i次全局更新所需的本地更新数量;条件(1a)表示现有资源的既定预算,β表示整个学习过程中资源消耗率的上限;通过信任聚合来校准由于DT在节点计算能力中的映射偏差而导致的计算能耗Ecmp的偏差;
经过k轮全局聚合,简化P1和长期资源预算约束,训练的损失值写为:



其中最优训练结果就是:



基于Lyapunov优化,将长期资源预算划分为每个时隙的可用资源预算,通过建立动态资源短缺队列,实现了P1的简化;资源短缺队列的长度被定义为所使用的资源和可用资源之间的差异;资源总量的限制是Rm,第k次聚合中可用的资源是βRm/k;资源短缺队列的表示如下:
Q(i+1)=max{Q(i)+(aiEcmp+Ecom)-βRm/k,0}(4)
其中,(aiEcmp+Ecom)-βRm/k是第k个聚合中资源的偏差;从而,原始问题P1转化为以下问题P2:






其中v和Q(i)是与性能提升难度和资源消耗队列有关的权重参数,v随着训练回合的增加而增加。


3.根据权利要求2所述的一种在智能电厂中基于联邦学习提升火灾检测效果的方法,其特征在于,公式(1)和条件(1a)中,损失值F(wk)和计算能耗Ecmp分别包含训练状态和计算能力f(i),由DT对其进行估计,确保能够掌握整个联邦学习的关键状态。


4.根据权利要求1所述的一种在智能电厂中基于联邦学习提升火灾...

【专利技术属性】
技术研发人员:杨端许晓伟韩志英孙曼雷施雨张翰轩
申请(专利权)人:西安君能清洁能源有限公司
类型:发明
国别省市:陕西;61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1