基于联邦学习的停车流量预测模型训练方法技术

技术编号:33143576 阅读:26 留言:0更新日期:2022-04-22 13:54
本发明专利技术涉及计算机应用技术领域。针对联邦学习法在停车场停车流量的预测中容易被恶意攻击,而现有的判断恶意模型的方法存在容易舍弃正常的本地模型的缺点,从而导致聚合后的全局模型收敛速度慢和模型精度偏低的上述问题,本发明专利技术提供一种提出一种基于联邦学习的停车流量预测模型训练方法,在保障数据隐私和安全的条件下,通过计算各本地模型之间的相似值和本地模型与全局模型之间的相似值,从而减少全局模型的精度偏差,提高模型的性能。提高模型的性能。

【技术实现步骤摘要】
基于联邦学习的停车流量预测模型训练方法


[0001]本专利技术涉及计算机应用
,具体涉及一种基于联邦学习的停车流量预测模型训练方法。

技术介绍

[0002]随着计算机技术的发展,越来越多的技术应用在停车场领域,用户在停车时会产生一定的周期性行为,挖掘用户的停车行为规律并预测用户在每时段的停车流量,可以更好地管理停车泊位资源。在现有技术中,由于用户的停车数据存在隐私等问题,停车流量预测模型主要利用单一停车场的历史停车流量数据进行训练长短期记忆人工神经网络,并通过增加训练次数、调整训练参数来调整长短期记忆人工神经网络的参数以提高停车流量预测模型的准确率。但是,该停车流量模型只能满足单个停车场的停车流量预测需求,无法满足多个停车场的停车流量预测需求。
[0003]为了提高停车流量预测模型对不同停车场的泛化能力,需要使用大量高质量的停车场数据进行停车流量预测模型的训练,但由于停车数据涉及用户隐私,无法获取多个停车场的数据进行集中训练模型,这使得传统的模型训练方式面临着极大的挑战。联邦学习作为人工智能的核心技术,是解决这一挑战的一种有效的方法,该方法使得本地参与方的数据在本地训练本地模型,并将模型参数上传至聚合服务器进行模型参数聚合,然后发送给本地参与方更新本地模型并继续训练。实现了数据不离开本地训练、优化模型。但是,联邦学习易受恶意模型中毒的攻击,当本地参与方存在恶意行为时,其上传的模型参数往往是虚假的,在模型聚合时,会使得聚合后的全局模型精度降低。在现有技术中,可通过计算本地模型与全局模型的余弦相似度判断本地模型是否属于恶意模型并进行舍弃,但是,仅从本地模型与全局模型的相似度判断恶意模型过于片面,没有考虑到当全局模型存在较大偏差时,会存在正常的本地模型与全局模型相似度较低,从而将正常的本地模型舍弃,导致聚合后的全局模型收敛速度慢和模型精度偏低,这对于技术提出了更高的要求。

技术实现思路

[0004]针对联邦学习法在停车场停车流量的预测中容易被恶意攻击,而现有的判断恶意模型的方法存在容易舍弃正常的本地模型的缺点,从而导致聚合后的全局模型收敛速度慢和模型精度偏低的上述问题,本专利技术提供一种提出一种基于联邦学习的停车流量预测模型训练方法,在保障数据隐私和安全的条件下,通过计算各本地模型之间的相似值和本地模型与全局模型之间的相似值,从而减少全局模型的精度偏差,提高模型的性能。
[0005]本专利技术是通过以下技术方案实现的:
[0006]一种基于联邦学习的停车流量预测模型训练方法,该方法包括如下步骤:
[0007]步骤S101,采集停车场历史停车数据,对所述停车场历史停车数据进行预处理;
[0008]步骤S102,对预处理后的历史停车数据统计每时段到来车辆的数量,构建停车流量时间序列数据;
[0009]步骤S103,对所述停车流量时间序列数据进行归一化处理;
[0010]步骤S104,根据归一化后的停车流量时间序列数据进行联邦学习,由每个参与方利用本地数据训练本地停车流量预测模型,将训练后的本地模型参数加密后上传至聚合服务器;
[0011]步骤S105,由聚合服务器验证所有收到的本地模型参数,解密并验证所有本地模型参数,对本地模型参数的验证方式是通过比较本地模型参数之间、本地模型参数与全局模型参数的相似值,相似值的是基于改进的余弦相似度计算获取,对于n维向量A和B,两者的余弦相似度计算公式为设模型参数共有p层,每层的维度为m
×
n,计算两个模型参数w1和w2的相似值其中,为模型参数w1第i层第j行第k列位置的参数,为模型参数w2第i层第j行第k列位置的参数,若两个本地模型的余弦相似度大于0.5,则为相似,否则为不相似;对不相似的本地模型参数进行舍弃,对相似的所有本地模型参数基于加权平均法进行聚合,得到全局模型参数并建立全局模型;
[0012]步骤S106,判断全局模型是否收敛,若未收敛,则将全局模型参数发送给各参与方继续迭代训练,直到全局模型收敛;
[0013]步骤S107,将收敛的全局模型作为停车流量预测模型。
[0014]进一步的,所述步骤S101预处理包括:对所述停车场历史停车数据进行清洗,剔除停车时间异常、缺失的样本数据。
[0015]进一步的,所述步骤S102包括:对所述经过预处理后的历史停车数据按每时段统计到来数量,并按时间顺序构建停车流量时间序列数据。
[0016]进一步的,所述步骤S103归一化处理的方法为:获取停车流量时间序列数据中的最大值和最小值;对每个时段的停车流量时间序列数据归一化在0

1之间,归一化公式为其中x'为归一化后的值,x为停车流量的实际值,x
min
为停车流量时间序列数据中的最小值,x
max
为停车流量时间序列数据中的最大值。
[0017]进一步的,所述步骤S104中加密方式采用同态加密算法,每个参与方和聚合服务器都具有相同的公私钥。通过应用同态加密算法,即使其他人获取了已加密的模型参数,由于缺少密钥信息,无法得知任何原始数据信息,进一步保证了数据的安全。
[0018]进一步的,所述步骤S105对相似的所有本地模型参数聚合的过程为:在第一轮联邦学习过程中,选取与其他本地模型参数相似数量最多的本地模型参数作为基准模型参数,若存在多个数量最多的本地模型参数,则分别计算这些本地模型参数与其相似的本地模型参数的欧氏距离,选取本地模型参数与其他本地模型参数欧氏距离最小的作为基准模
型参数,对本轮模型参数的欧氏距离的计算公式为将该基准模型参数以及与其相似的其他本地模型参数作为第一轮进行聚合的本地模型参数;从第二轮联邦学习开始聚合模型参数之前,首先以上一轮的全局模型参数作为第一基准模型参数,选出与第一基准模型参数相似的所有本地模型,然后从这些本地模型参数中选出与其他本地模型相似数量最多的本地模型参数作为第二基准模型参数,同样,若存在多个数量最多的本地模型参数,则通过计算欧式距离筛选出第二基准模型参数,选出与第二基准模型参数相似的所有本地模型进行本轮模型参数聚合,聚合本地模型参数的加权平均法公式为其中,w为聚合后的全局模型参数,w
i
为参与方i的本地模型参数,p
i
为模型参数w
i
的权重值,n
i
为参与方i的本地训练数据的数量,n为所有参与方本地训练数据的总数量。
[0019]进一步的,所述步骤S106具体过程为:对建立的全局模型进行检测,通过测试数据计算预测误差值,进而判断全局模型是否收敛,若未收敛,聚合服务器将全局模型参数加密后发送给各参与方,各参与方解密全局模型参数并更新本地模型参数,继续迭代训练,直到全局模型收敛。
[0020]本专利技术提供了一种基于联邦学习的停车流量预测模型训练方法,一方面在保障用户数据隐私和安全的条件下训练停车流量预测模型,另一方面防止了模型训练过程中的模型中毒攻击,训练后的停车流量预测模型具有较好的泛化能力。
本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于联邦学习的停车流量预测模型训练方法,其特征在于,该方法包括如下步骤:步骤S101,采集停车场历史停车数据,对所述停车场历史停车数据进行预处理;步骤S102,对预处理后的历史停车数据统计每时段到来车辆的数量,构建停车流量时间序列数据;步骤S103,对所述停车流量时间序列数据进行归一化处理;步骤S104,根据归一化后的停车流量时间序列数据进行联邦学习,由每个参与方利用本地数据训练本地停车流量预测模型,将训练后的本地模型参数加密后上传至聚合服务器;步骤S105,由聚合服务器验证所有收到的本地模型参数,解密并验证所有本地模型参数,对本地模型参数的验证方式是通过比较本地模型参数之间、本地模型参数与全局模型参数的相似值,相似值的是基于改进的余弦相似度计算获取,对于n维向量A和B,两者的余弦相似度计算公式为设模型参数共有p层,每层的维度为m
×
n,计算两个模型参数w1和w2的相似值其中,为模型参数w1第i层第j行第k列位置的参数,为模型参数w2第i层第j行第k列位置的参数,若两个本地模型的余弦相似度大于0.5,则为相似,否则为不相似;对不相似的本地模型参数进行舍弃,对相似的所有本地模型参数基于加权平均法进行聚合,得到全局模型参数并建立全局模型;步骤S106,判断全局模型是否收敛,若未收敛,则将全局模型参数发送给各参与方继续迭代训练,直到全局模型收敛;步骤S107,将收敛的全局模型作为停车流量预测模型。2.根据权利要求1所述的基于联邦学习的停车流量预测模型训练方法,其特征在于,所述步骤S101预处理包括:对所述停车场历史停车数据进行清洗,剔除停车时间异常、缺失的样本数据。3.根据权利要求1所述的基于联邦学习的停车流量预测模型训练方法,其特征在于,所述步骤S102包括:对所述经过预处理后的历史停车数据按每时段统计到来数量,并按时间顺序构建停车流量时间序列数据。4.根据权利要求1所述的基于联邦学习的停车流量预测模型训练方法,其特征在于,所述步骤S103归一化处理的方法为:获取停车流量时间序列数据中的最大值和最小值;对每个时段的停车流量时间序列数据归一化在0

1之间,归一化公式为其...

【专利技术属性】
技术研发人员:宗学森牟伟
申请(专利权)人:青岛亿联信息科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1