System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及轨迹交通模式推断领域,具体涉及一种基于联邦学习满足本地化差分隐私的tmi系统。
技术介绍
1、移动群智感知(mcs),是一种通过移动传感设备(如智能手机、笔记本电脑和可穿戴设备等)收集人们周围信息的群体智能范式。mcs通过分享环境中更高质量的数据,降低了部署成本,提高了无线传感器网络的灵活性,而不需要使用专门的传感设备。目前,大多数智能移动设备可以通过预安装的传感器检测环境的光线与噪音、移动对象的位置与运动状态,具体的传感器设备包括加速度计、麦克风和全球定位系统(gps)等。因此,mcs具有广泛的应用场景,如环境感知、智能交通、室内定位和行为感知等。
2、交通模式推断(tmi)是一种基于mcs环境下的智能交通应用,旨在从用户的gps数据中推断出其出行轨迹的交通模式。通过tmi的任务,其模型可以协助解决各种交通相关的问题,如公共交通规划、路线推荐和交通信号优化等。此外,tmi也是mcs系统中一个数据驱动的任务。然而,为了达到更高的推理精度,tmi模型需要基于gps的大量轨迹数据来训练它。事实上,具有较高隐私级别的样本数据无法通过数据聚合的方式收集到中央服务器上,也就是数据源相互分离的孤立的数据岛问题。在mcs系统中,传统的tmi模型依赖于云服务器来收集和处理参与者上传的传感数据,这通常对于用户而言是具有隐私风险的。因此,一些需要大量隐私数据样本的tmi任务则无法由基于传统技术的mcs系统提供服务。
3、联邦学习(fl)的出现为mcs中的分布式tmi任务提供了一种新型的隐私保护方法。fl也被称为
技术实现思路
1、有鉴于此,本专利技术的目的在于提供一种基于联邦学习满足本地化差分隐私的tmi系统,有效降低联邦学习通信成本,并能够增强模型梯度的隐私性。
2、为实现上述目的,本专利技术采用如下技术方案:
3、一种基于联邦学习满足本地化差分隐私的tmi系统,包括服务器和客户端;所述客户端在本地训练隐私增强的联邦学习模型,并通过协议与服务器交换更新的参数,服务器将这些参数聚集起来进行计算,并将计算结果发送给参与的客户端;所述隐私增强的联邦学习模型将在客户端提取用户轨迹的运动特征作为数据样本来替代原始数据进行训练;所述隐私增强的联邦学习模型在训练前,数据样本信息进行模糊聚类;采用ldp技术来对样本数据进行联合训练隐私增强的联邦学习模型。
4、进一步的,所述隐私增强的联邦学习模型训练,具体如下:
5、获取参与联邦学习的客户端及服务器gps数据,并预处理,得到用户轨迹的运动特征;
6、将用户轨迹的运动特征作为样本数据,采用模糊聚类技术进行客户端分组确定参与者,并采用ldp技术来对样本数据进行联合训练以构建联邦学习模型。
7、进一步的,所述预处理包括基于gps数据的轨迹分割和基于运动属性的轨迹特征提取。
8、进一步的,所述基于gps数据的轨迹分割,具体如下:设每个经过处理的轨迹段s只包含与同一运输模式相对应的基于gps的点,若两点之间的gps记录时间间隔超过δt分钟,就认为它们分别属于两个段的数据点,然后基于行走模式的停留点和轨迹段进行轨迹分割。
9、进一步的,所述基于运动属性的轨迹特征提取,具体为:结合地理和时间信息来开发与速度有关的数据特征:
10、
11、其中i表示轨迹段中gps点的序列号,n表示总记录数;在该轨迹特征序列中,v表示速度,a表示加速度,j表示加加速度,r表示转向率。
12、进一步的,所述基于模糊聚类技术进行客户端分组,具体如下:
13、a.参与训练的客户端相互传输标签类别信息,其具体传输数据信息定义为{nwalk,nbike,nbus,ncar,ntrain},其中nwalk,nbike,nbus,ncar,ntrain分别表示各个交通模式的轨迹数量;
14、b.客户端将整体参与训练的客户端标签信息收集完全后,该客户端将进行模糊聚类迭代;
15、c确定聚类算法参数,分簇数为每轮参与联邦学习的客户端数k,模糊指数m以及数据集dl;
16、d初始化聚类中心c、隶属度矩阵u,其中cj表示第j号簇中心,uij表示样本xi属于j号簇的隶属度,并满足
17、e计算聚类中心,
18、f更新隶属度矩阵,
19、g计算迭代条件,其中r是迭代回合数,ε是设定的误差阈值,隶属度相差值小于某个值则认为该算法基本收敛,不再迭代;
20、h输出该客户端的隶属度矩阵u;
21、i重复c~h,计算出所有客户端的隶属度矩阵,一并上传至服务端,通过聚合平均的方式得出最终的客户端模糊聚类隶属度矩阵。
22、进一步的,在进行联邦学习模型训练时,使用fedsgd算法来更新梯度,训练中的梯度分两个步骤处理,以限制每个梯度更新的隐私损失:一是裁剪梯度,由于对梯度的大小没有先验约束,梯度被缩放,并使其l2范数值的最大边界值为c,计算出最大的隐私损失;二是添加噪声,在梯度更新中加入与裁剪范数边界值c成比例的噪声,并使噪声从标准差为cσ的高斯分布中取样,其中σ是噪声尺度。
23、本专利技术与现有技术相比具有以下有益效果:
24、1、本专利技术使用模糊聚类技术预先分类客户端及客户端模糊选择算法,加速联邦学习模型训练,减少通信轮次及计算开销;
25、2、本专利技术使用本地化差分隐私技术保护联邦学习训练中的更新梯度,并能够防止攻击者通过梯度反推原始数据。
本文档来自技高网...【技术保护点】
1.一种基于联邦学习满足本地化差分隐私的TMI系统,其特征在于,包括服务器和客户端;所述客户端在本地训练隐私增强的联邦学习模型,并通过协议与服务器交换更新的参数,服务器将这些参数聚集起来进行计算,并将计算结果发送给参与的客户端;所述隐私增强的联邦学习模型将在客户端提取用户轨迹的运动特征作为数据样本来替代原始数据进行训练;所述隐私增强的联邦学习模型在训练前,数据样本信息进行模糊聚类;采用LDP技术来对样本数据进行联合训练隐私增强的联邦学习模型。
2.根据权利要求1所述的基于联邦学习满足本地化差分隐私的TMI系统,其特征在于,所述隐私增强的联邦学习模型训练,具体如下:
3.根据权利要求2所述的基于联邦学习满足本地化差分隐私的TMI系统,其特征在于,所述预处理包括基于GPS数据的轨迹分割和基于运动属性的轨迹特征提取。
4.根据权利要求3所述的基于联邦学习满足本地化差分隐私的TMI系统,其特征在于,所述基于GPS数据的轨迹分割,具体如下:设每个经过处理的轨迹段S只包含与同一运输模式相对应的基于GPS的点,若两点之间的GPS记录时间间隔超过ΔT分钟,就认
5.根据权利要求3所述的基于联邦学习满足本地化差分隐私的TMI系统,其特征在于,所述基于运动属性的轨迹特征提取,具体为:结合地理和时间信息来开发与速度有关的数据特征:
6.根据权利要求2所述的基于联邦学习满足本地化差分隐私的TMI系统,其特征在于,所述基于模糊聚类技术进行客户端分组,具体如下:
7.根据权利要求2所述的基于联邦学习满足本地化差分隐私的TMI系统,其特征在于,在进行联邦学习模型训练时,使用FedSGD算法来更新梯度,训练中的梯度分两个步骤处理,以限制每个梯度更新的隐私损失:一是裁剪梯度,由于对梯度的大小没有先验约束,梯度被缩放,并使其L2范数值的最大边界值为C,计算出最大的隐私损失;二是添加噪声,在梯度更新中加入与裁剪范数边界值C成比例的噪声,并使噪声从标准差为Cσ的高斯分布中取样,其中σ是噪声尺度。
...【技术特征摘要】
1.一种基于联邦学习满足本地化差分隐私的tmi系统,其特征在于,包括服务器和客户端;所述客户端在本地训练隐私增强的联邦学习模型,并通过协议与服务器交换更新的参数,服务器将这些参数聚集起来进行计算,并将计算结果发送给参与的客户端;所述隐私增强的联邦学习模型将在客户端提取用户轨迹的运动特征作为数据样本来替代原始数据进行训练;所述隐私增强的联邦学习模型在训练前,数据样本信息进行模糊聚类;采用ldp技术来对样本数据进行联合训练隐私增强的联邦学习模型。
2.根据权利要求1所述的基于联邦学习满足本地化差分隐私的tmi系统,其特征在于,所述隐私增强的联邦学习模型训练,具体如下:
3.根据权利要求2所述的基于联邦学习满足本地化差分隐私的tmi系统,其特征在于,所述预处理包括基于gps数据的轨迹分割和基于运动属性的轨迹特征提取。
4.根据权利要求3所述的基于联邦学习满足本地化差分隐私的tmi系统,其特征在于,所述基于gps数据的轨迹分割,具体如下:设每个经过处理的轨迹段s只包含与同一运...
【专利技术属性】
技术研发人员:章静,黄其涵,黄一睿,曾钻洋,李彪,
申请(专利权)人:福建工程学院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。