当前位置: 首页 > 专利查询>深圳大学专利>正文

基于联邦学习的地铁基坑开挖风险识别方法及装置制造方法及图纸

技术编号:32230634 阅读:19 留言:0更新日期:2022-02-09 17:35
本发明专利技术实施例公开了基于联邦学习的地铁基坑开挖风险识别方法及装置。该方法包括参与联邦学习的各个客户端节点获取地铁基坑的监测数据,并得到标准样本;各个客户端节点对本地的标准样本进行加密对齐处理,并从加密后的标准样本筛选出目标数据集;各个客户端节点基于目标数据集训练风险识别模型得到模型局部参数;服务端节点汇总所有模型局部参数,得到更新后的模型全局参数,并反馈给各客户端节点;各客户端节点持续地对模型局部参数进行迭代、上传和接收,直至服务端节点对应的损失函数收敛,得到优化后的风险识别模型;采用验证集测试优化后的风险识别模型,得到最优的风险识别模型;利用最优的风险识别模型确定识别结果。该方法准确性更高。该方法准确性更高。该方法准确性更高。

【技术实现步骤摘要】
基于联邦学习的地铁基坑开挖风险识别方法及装置


[0001]本专利技术涉及风险识别
,尤其涉及一种基于联邦学习的地铁基坑开挖风险识别方法及装置。

技术介绍

[0002]地铁基坑开挖风险因素识别是地铁施工安全管理的重点内容,也是保证地铁基坑开挖施工安全进行的前提。然而,传统的风险因素识别方法主要是依靠人工经验排查、专家现场讨论等,存在较大的主观性;并且随着施工环境越来越复杂,风险的种类也越来越多,传统方法已不能及时、全面地识别风险因素。因此,迫切需要更加客观、快速、智能的地铁深大基坑开挖风险识别方法。
[0003]近年来,随着信息通信和物联网技术在建筑行业的兴起,国内外学者正将以“大数据+机器学习”为代表的人工智能方法应用于地铁基坑开挖风险因素识别。例如,国内学者提出了基于知识的风险识别模型,通过构建地铁施工安全风险知识库,基于规则智能推理出风险因素,但是完整收集安全风险知识是一大难点。针对识别方法,也有不少学者提出了利用人工神经网络(Artificial Neural Networks,ANN)、支持向量机(Support Vector Machine,SVM)和随机森林(Random Forest,RF)等机器学习的方法,来识别地铁基坑施工风险因素。国外在地铁施工风险识别领域有较成熟的体系,并率先将物联网和数据挖掘等技术应用于地铁施工风险因素识别。例如,有学者提出了一种数据挖掘的方法,利用K

means聚类和遗传算法(Genetic Algorithm,GA)筛选出识别关键区域情况的最优特征,但是其关注的重点是风险存在的关键区域和发生时间。此外,利用过往地铁基坑施工案例,通过文本挖掘来识别风险因素也有大量的研究。
[0004]当前,越来越多智能设备在地铁施工现场的使用,产生了多源、异构、海量的工程大数据,并且各参与方数据有所不同,造成“数据孤岛”现象。另一方面,上述识别方法的共性还在于将设备和机器连接到物联网,会使采集的数据暴露在网络犯罪面前,数据传输的保护、防范恶意窃取信息的能力十分薄弱。因此,在保证数据隐私的条件下,如何更加有效地利用工程大数据背后的信息实时、准确地识别地铁基坑开挖风险因素是当前亟待解决的技术问题。

技术实现思路

[0005]本专利技术实施例提供了一种基于联邦学习的地铁基坑开挖风险识别方法及装置,旨在解决现有技术中地铁基坑开挖风险因素的识别准确率较低的问题。
[0006]第一方面,本专利技术实施例提供了一种基于联邦学习的地铁基坑开挖风险识别方法,其包括:
[0007]参与联邦学习的各个客户端节点获取地铁基坑的监测数据,并对所述监测数据进行预处理,得到标准样本,所述样本数据包括施工的影响因素和影响因素对应的数据值以及时间标签;
[0008]服务端节点创建密钥对,并将所述密钥对中的公钥发送至各所述客户端节点,将所述密钥对中的私钥保留在本地,同时将预置的风险识别模型的全局初始参数广播至各所述客户端节点;
[0009]各个所述客户端节点获取所述服务端节点下发的公钥和全局初始参数,基于所述公钥对标准样本进行加密处理,利用隐私保护集合交集技术从加密后的标准样本中筛选出具有相同特征的样本作为目标数据集,并将所述目标数据集划分为训练集和验证集;
[0010]各个所述客户端节点基于所述训练集和全局初始参数对本地的风险识别模型进行训练,得到模型局部参数并采用所述公钥对所述模型局部参数加密后发送至所述服务端节点;
[0011]所述服务端节点采用私钥对各所述局部参数进行解密,并汇总所有所述模型局部参数,得到更新后的模型全局参数;
[0012]所述服务端节点继续将更新后的模型全局参数下发至各所述客户端节点,使各所述客户端节点持续对自身的模型局部参数进行迭代,直至所述服务端节点对应的损失函数收敛,得到优化后的风险识别模型,并采用所述验证集对优化后的风险识别模型进行K次测试,得到最优的风险识别模型;
[0013]所述服务端节点输出最优的风险识别模型的识别结果作为地铁基坑开挖的风险因素。
[0014]第二方面,本专利技术实施例提供了一种基于联邦学习的地铁基坑开挖风险识别装置,包括客户端和服务端:
[0015]所述客户端包括:
[0016]第一交互模块,用于获取地铁基坑的监测数据,并对监测数据进行预处理,得到标准样本;以及,获取服务端节点下发的公钥和全局初始参数,基于所述公钥对标准样本进行加密处理,利用隐私保护集合交集技术从加密后的标准样本中筛选出具有相同特征的样本作为目标数据集,并将所述目标数据集划分为训练集和验证集;以及,基于所述训练集和全局初始参数对本地的风险识别模型进行训练,得到模型局部参数并采用所述公钥对所述模型局部参数加密后发送至服务端;
[0017]所述服务端包括:
[0018]第二交互模块,用于创建密钥对,并将所述密钥对中的公钥发送至各客户端,将所述密钥对中的私钥保留在本地,同时将预置的风险识别模型的全局初始参数广播至各所述客户端;以及,采用私钥对各局部参数进行解密,并汇总所有所述局部参数,得到更新后的模型全局参数;以及,继续将更新后的模型全局参数下发至各所述客户端,使各所述客户端持续对自身的模型局部参数进行迭代,直至服务端对应的损失函数收敛,得到优化后的风险识别模型,并采用所述验证集对优化后的风险识别模型进行K次测试,得到最优的风险识别模型;以及,输出最优的风险识别模型的识别结果作为地铁基坑开挖的风险因素。
[0019]本专利技术实施例提供了基于联邦学习的地铁基坑开挖风险识别方法及装置。该方法包括参与联邦学习的各个客户端节点获取地铁基坑的监测数据,并对监测数据进行预处理,得到标准样本;服务端节点创建密钥对,并将密钥对中的公钥发送至各客户端节点,将密钥对中的私钥保留在本地,同时将预置的风险识别模型的全局初始参数广播至各客户端节点;各个客户端节点获取服务端节点下发的公钥和全局初始参数,基于公钥对标准样本
进行加密处理,利用隐私保护集合交集技术从加密后的标准样本中筛选出具有相同特征的样本作为目标数据集,并将目标数据集划分为训练集和验证集;各个客户端节点基于训练集和全局初始参数对风险识别模型进行训练,得到模型局部参数并采用公钥对模型局部参数加密后发送至服务端节点;服务端节点采用私钥对各模型局部参数进行解密,汇总所有模型局部参数,得到更新后的全局模型参数;服务端节点继续将更新后的模型全局参数下发至各客户端节点,使各客户端节点持续对自身的模型局部参数进行迭代,直至服务端节点对应的损失函数收敛,得到优化后的风险识别模型,并采用验证集对优化后的风险识别模型进行K次测试,得到最优的风险识别模型;所述服务端节点输出最优的风险识别模型的识别结果作为地铁基坑开挖的风险因素。该方法基于客户端节点

服务端节点的异步分布式架构的联邦机器学习方法,解决了地铁基坑施工所产生的环境监测数据非独立同分布的问题,能有效利用工程大数据,提升了地铁基坑开挖风险识别的准确度和效率;此外,通过联邦学习加密算法,客户端本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于联邦学习的地铁基坑开挖风险识别方法,其特征在于,包括:参与联邦学习的各个客户端节点获取地铁基坑的监测数据,并对所述监测数据进行预处理,得到标准样本,所述样本数据包括施工的影响因素和影响因素对应的数据值以及时间标签;服务端节点创建密钥对,并将所述密钥对中的公钥发送至各所述客户端节点,将所述密钥对中的私钥保留在本地,同时将预置的风险识别模型的全局初始参数广播至各所述客户端节点;各个所述客户端节点获取所述服务端节点下发的公钥和全局初始参数,基于所述公钥对标准样本进行加密处理,利用隐私保护集合交集技术从加密后的标准样本中筛选出具有相同特征的样本作为目标数据集,并将所述目标数据集划分为训练集和验证集;各个所述客户端节点基于所述训练集和全局初始参数对本地的风险识别模型进行训练,得到模型局部参数并采用所述公钥对所述模型局部参数加密后发送至所述服务端节点;所述服务端节点采用私钥对各所述模型局部参数进行解密,并汇总所有所述模型局部参数,得到更新后的模型全局参数;所述服务端节点继续将更新后的模型全局参数下发至各所述客户端节点,使各所述客户端节点持续对自身的模型局部参数进行迭代,直至所述服务端节点对应的损失函数收敛,得到优化后的风险识别模型,并采用所述验证集对优化后的风险识别模型进行K次测试,得到最优的风险识别模型;所述服务端节点输出最优的风险识别模型的识别结果作为地铁基坑开挖的风险因素。2.根据权利要求1所述的基于联邦学习的地铁基坑开挖风险识别方法,其特征在于,所述对所述样本数据进行预处理,得到标准样本,包括:遍历所述样本数据,检测是否存在缺失数据;若是,则以缺失数据相邻两个样本的均值作为所述缺失数据的值,得到补全数据;对所述补全数据进行标准化处理,得到所述标准样本。3.根据权利要求1所述的基于联邦学习的地铁基坑开挖风险识别方法,其特征在于,所述将所述目标样本划分为训练集和验证集,包括:将所有客户端划分为K个集合,K次不重复地以其中一个集合的目标样本作为验证集,剩下K

1个集合的目标样本作为训练集。4.根据权利要求1所述的基于联邦学习的地铁基坑开挖风险识别方法,其特征在于,所述风险识别模型为随机森林模型,所述各个所述客户端节点基于所述训练集和全局初始参数对本地的风险识别模型进行训练,得到模型局部参数,包括:预设所述风险识别模型的决策树个数,节点的样本数量阈值,并以分类回归树算法作为所述风险识别模型的分类属性选择算法;根据预置基尼系数计算函数计算当前客户端节点对应训练集中的基尼系数,以基尼系数最小的影响因素作为所述风险识别模型进行节点分裂的分类属性;将属于分类属性的样本和剩下的样本划分为两个新的节点,对两个新的节点的样本继续进行基尼系数的计算,确定新的分类属性,并根据新的分类属性划分出新的节点,直至节点的样本数量小于所述样本数量阈值,则结束分裂,得到所述模型局部参数。
5.根据权利要求4所述的基于联邦学习的地铁基坑开挖风险识别方法,其特征在于,所述基尼系数计算函数如下:其中,k表示当前训练集中影响因素的数量,k=1,2,...,β,p
k
表示选中的样本属于第k种影响的概率。6.根据权利要求3所述的基于联邦学习的地铁基坑开挖风险识别方法,其特征...

【专利技术属性】
技术研发人员:廖龙辉杨川全丽蓉廖奎安梁逸飞
申请(专利权)人:深圳大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1