一种面向城市分级协同供水的多区域需水量预测方法技术

技术编号:36434377 阅读:14 留言:0更新日期:2023-01-20 22:47
本发明专利技术提出了一种面向城市分级协同供水的多区域需水量预测方法,包括以下步骤:S1,构造HFL模型:基于水务公司整体的供水管网分布以及地理特征,采用聚类算法将整个区域下的各节点划分为L层对象:顶层为中心参数服务器CPS、中间若干层为区域参数服务器RPS、底层为客户client;S2,将水务公司的用水数据输入HFL模型进行训练,所述用水数据为时序数据:S3,将待测数据输入训练好的HFL模型,得到预测结果,所述预测结果是各个公司对某个区域的供水量预测即局部需水量,全区需水量就是局部需水量之和。本发明专利技术能充分挖掘训练数据的显性和隐性特点,利用数据的关联关系以提升模型的精度。此外,还可以在一定程度上加快模型的收敛,并降低通信瓶颈带来的影响。降低通信瓶颈带来的影响。降低通信瓶颈带来的影响。

【技术实现步骤摘要】
一种面向城市分级协同供水的多区域需水量预测方法


[0001]本专利技术涉及城市供水量预测领域,特别是涉及一种面向城市分级协同供水的多区域需水量预测方法。

技术介绍

[0002]目前,在城市用水量预测领域中被广泛应用的数据挖掘技术有:多元线性回归分析模型、ARIMA模型、灰色GM模型、MIC

XGBoost模型、机器学习模型等。但是随着智慧管网及智慧水务系统的不断建设,基于上述数据挖掘技术的城市用水数据预测面临着以下严峻的挑战:1)城市功能的划分使得城市生活区、新开发区、商务区以及工业区等区域在用水特点上呈现出越来越显著的差异,即数据的定义和组织方式具有严重的异构性,“数据孤岛”影响着数据的流通和集成整合,限制了传统的中心化学习(Centralized Learning)推广应用,因此传统中心化的需水预测已经不能满足多区域城市环境下的需求,同时难以让供水公司提供即时匹配的供水调度方案;2)为了降低供水管网的建设和运营成本,新扩展的城市区域越来越多的采用由多个供水公司协同建设管网并运维系统的新模式,但不同供水公司对于共享自己供水区域内的水量数据的意愿不高,这阻碍了数据价值的有效释放;3)部分城市用水区域,如:军事管理区域和特殊产品生产区域的用水数据具有严格的隐私保护要求,而采用传统数据集中化的需水预测方法,需要将这些敏感区域的用水数据进行采集和网络传输,存在严重的数据泄露风险。
[0003]针对新的城市分级和分区域供水背景下的需求,联邦学习(Federated Learning,FL)以“数据不动,模型动”的方式,有效解决了在大规模分布式应用环境下的数据隐私和网络通信问题。经典联邦学习由一个聚合服务器(Parameter Server,PS)和多个客户端(client)构成,作为一种C/S网络架构,各client负责保存组织的私有数据并在本地训练模型,通过网络链路将模型参数上传至PS,PS负责聚合部分或所有客户端的模型参数,再广播回传至相应的client,以此在隐私数据不离开本地的情况下,通过联合协作训练共享模型参数的方式,既保证模型性能,又避免数据的泄露。
[0004]然而,当经典联邦学习应用到多区域需水量预测时存在以下不足之处:
[0005](1)用于联邦学习训练的数据具有显性和隐性强关联的特点,在统计分析方面各用水监测点的数据在层次上存在着密切关联并相互影响,这使得分布在各节点上的数据集不完全是独立的数据个体,但经典联邦学习不能充分利用数据的关联关系以提升模型的精度;
[0006](2)在分布式机器学习中,全局模型训练的质量和模型收敛的时间都受到分布式拓扑结构的网络影响,但经典联邦学习的服务端通常一味地采用同步聚合或异步聚合方法,这使得模型参数的传递和聚合将可能带来性能的受损。

技术实现思路

[0007]本专利技术旨在至少解决现有技术中存在的技术问题,特别创新地提出了一种面向城
市分级协同供水的多区域需水量预测方法。
[0008]为了实现本专利技术的上述目的,本专利技术提供了一种面向城市分级协同供水的多区域需水量预测方法,包括以下步骤:
[0009]S1,构造HFL模型即层次化的联合学习模型:
[0010]基于水务公司整体的供水管网分布以及地理特征,采用聚类算法将整个区域下的各节点划分为L层对象:顶层为中心参数服务器CPS、中间若干层为区域参数服务器RPS、底层为客户client;
[0011]顶层只有一个节点CPS,其余每层均包含若干个节点,上下层级的节点之间是一对多的关系;每个节点均包含网络模型,client节点、CPS节点采用的是LSTM神经网络;
[0012]S2,将水务公司的用水数据输入HFL模型进行训练,所述用水数据为时序数据:
[0013]S2

1,提取出各client节点数据的公共特征,初始化一个全局模型参数w0;
[0014]S2

2,将w0广播至RPS,各RPS节点接收到w0后不会立即参与训练,而是充当路由转发的角色,将w0下发至对应的client,各client节点基于本地数据集和w0会立即开始本地模型训练;
[0015]S2

3,当client完成训练后,将基于Lora无线传输协议将本地模型参数上传至RPS,RPS端按照接收参数的先后顺序,将来自client的本地模型参数存放在本地的缓存区;
[0016]S2

4,当client完成设定的本地迭代训练次数时满足聚合条件,RPS将采用FedAvg算法聚合得到区域模型当RPS所执行的区域聚合次数达到设定的区域聚合次数时,RPS将开始基于自身的用水量数据迭代训练区域的LSTM模型,当训练次数达到设定的区域迭代训练次数时,得到区域更新;
[0017]区域迭代方法与本地迭代方法相同,形式如公式(1)所示。
[0018]S2

5,RPS每一回合的迭代训练执行完成后,RPS仍需将自身的模型参数上传至上级节点CPS,当RPS完成设定的迭代训练次数时满足聚合条件,在CPS中聚合得到全局模型;所述CPS聚合也采用FedAvg算法,形式如公式(2)所示。
[0019]通过采用长短时记忆网络LSTM对RPS和client进行数据预测,有助于避免梯度爆炸和梯度消失对用水量预测带来的影响。
[0020]S3,将待测数据输入训练好的HFL模型,得到预测结果,所述预测结果是各个公司对某个区域的供水量预测即局部需水量,全区需水量就是局部需水量之和。
[0021]进一步地,所述本地迭代训练用以下公式表示:
[0022][0023]其中H interations表示H次本地迭代;
[0024]表示索引为k的client节点在第r轮经过H次本地迭代后得到的本地模型参数;
[0025]η是学习率;
[0026]表示梯度值;
[0027]w0表示初始模型参数;
[0028]此外,在迭代的训练过程中以随机梯度下降法更新参数向量,同时在LSTM的输出中加上Sigmoid函数,以提高模型对信息的选择能力,进一步缓解反向传播梯度时的梯度消失问题。
[0029]进一步地,所述采用FedAvg算法聚合得到区域模型的公式如下:
[0030][0031]其中表示索引为s的RPS节点,在第r轮的初始模型参数;
[0032]α
c
表示被选择参与第r次聚合任务的clients比例,
[0033]K表示clients的总量;
[0034]D
k
表示客户端k的数据集大小;
[0035]表示第r次聚合任务,α
c
K个客户端的总数据集大小;
[0036]表示索引为k的client节点在第r轮经过H次本地迭代后得到的本地模型参数。
[0037]进一步地,所述聚合还包括:在RPS针对client和CPS针对RPS执行聚合本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种面向城市分级协同供水的多区域需水量预测方法,其特征在于,包括以下步骤:S1,构造HFL模型:基于水务公司整体的供水管网分布以及地理特征,采用聚类算法将整个区域下的各节点划分为L层对象:顶层为中心参数服务器CPS、中间若干层为区域参数服务器RPS、底层为客户client;顶层只有一个节点CPS,其余每层均包含若干个节点,上下层级的节点之间是一对多的关系;S2,将水务公司的用水数据输入HFL模型进行训练,所述用水数据为时序数据:S2

1,提取出各client节点数据的公共特征,初始化一个全局模型参数w0;S2

2,将w0广播至RPS,各RPS节点将w0下发至对应的client,各client节点基于本地数据集和w0会立即开始本地模型训练;S2

3,当client完成训练后,将基于Lora无线传输协议将本地模型参数上传至RPS,RPS端按照接收参数的先后顺序,将来自client的本地模型参数存放在本地的缓存区;S2

4,当client完成设定的本地迭代训练次数时满足聚合条件,RPS将采用FedAvg算法聚合得到区域模型当RPS所执行的区域聚合次数达到设定的区域聚合次数时,RPS将开始基于自身的用水量数据迭代训练区域的LSTM模型,当训练次数达到设定的区域迭代训练次数时,得到区域更新;S2

5,RPS每一回合的迭代训练执行完成后,RPS仍需将自身的模型参数上传至上级节点CPS,当RPS完成设定的迭代训练次数时满足聚合条件,在CPS中聚合得到全局模型;S3,将待测数据输入训练好的HFL模型,得到预测结果。2.根据权利要求1所述的一种面向城市分级协同供水的多区域需水量预测方法,其特征在于,所述本地迭代训练用以下公式表示:其中H interations表示H次本地迭代;表示索引为k的client节点在第r轮经过H次本地迭代后得到的本地模型参数;η是学习率;表示梯度值;w0表示初始模型参数。3.根据权利要求1所述的一种面向城市分级协同供水的多区域需水量预测方法,其特征在于,所述采用FedAvg算法聚合得到区域模型的公式如下:其中表示索引为s的RPS节点,在第r轮的初始模型参数;
α
c
表示被选择参与第r次聚合任务的clients比例,K表示clients的总量;D
k
表示客户端k的数据集大小;表示第r次聚合任务,α
c
K个客户端的总数据集大小;表示索引为k的client节点在第r轮经过H次本地迭代后得到的本地模型参数。4.根据权利要求1所述的一种面向城市分级协同供水的多区域需水量预测方法,其特征在于,所述聚合还包括:在RPS针对client和CPS针对RPS执行聚合操作时...

【专利技术属性】
技术研发人员:陈卓周川朱博文
申请(专利权)人:重庆理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1