一种面向车联网的自适应联邦学习方法技术

技术编号:32136047 阅读:17 留言:0更新日期:2022-01-29 19:45
本发明专利技术公开一种面向车联网的自适应联邦学习方法,在基于密码学的研究基础上,提出了一种面向车联网的自适应联邦学习模型。该方法可在原始数据不共享的情况下,对模型进行训练,并且可以根据实际应用场景选择最合适的联邦学习算法。另一方面,车联网带来便利的同时,也产生了数据孤岛和隐私保护不足等问题,本发明专利技术提出来解决方案,该方案提出联邦学习池模块训练模型,可以根据实时应用场景选择最合适的联邦学习算法,在保护用户隐私的同时,也能得到更好模型的改进。到更好模型的改进。到更好模型的改进。

【技术实现步骤摘要】
一种面向车联网的自适应联邦学习方法


[0001]本专利技术涉及一种面向车联网的自适应联邦学习方法。

技术介绍

[0002]车联网(IoV)是汽车、电子、信息通信、交通、管理等深度融合的新型产业。作为实现智能交通系统和自动驾驶的必要技术手段,车联网是解决当前交通问题的核心技术。在IoV中,车载单元(OBU)、路边单元(RSU)和移动网络之间的数据交换,实现了车辆与所有系统之间的信息共享。例如,在物联网应用之一的车对车(V2V)通信中,传感器节点上运行的功能可以是每辆车车载系统的一部分,而基站上运行的功能可以在路边单元设备上运行。这样一来,当地交通部门就可以准确、全面地掌握实时的交通状况,进行智能分析和决策。并将当前的决策信息反馈给每一辆车,进行交通事故紧急预警和路径规划。车联网和服务能力的发展催生了许多应用,如驾驶安全型应用、交通效率型应用、娱乐型应用等。目前,世界各国都在积极研究车联网的相关技术,并对其发展给予大力支持。2016年,美国交通部官方发布了联邦机动车安全标准第150号(FMVSS No.150),强制要求所有轻型车辆安装车载通信设备,以确保车辆之间安全信息的实时传输。2018年,由国际标准组织3GPP制定的全球统一车联网通信标准LTE
‑ꢀ
V2X的标准化工作完成。2020年,中国车联网的国家标准体系建设完成。随着车联网的应用,车辆可以获得比单车更多的信息,这对提高交通效率,降低交通事故的发生率,提高交通管理水平具有重要意义。
[0003]车联网中数据的传输和共享带来了巨大的价值,但如果数据在传输、存储、共享过程中被泄露,可能会给用户和社会带来严重的风险。与服务器相比,车载系统的计算能力通常较差,因此各种安全防护措施可能存在漏洞。由于车联网的工作机制,车辆需要定期与其他车辆和路边单元交换BSM消息。BSM消息一般以广播形式发送,并且没有经过加密的过程,这就给车联网中的每个节点带来了隐私泄露的风险。数据的收集和分析可以帮助交通部门做出更好的决策,但可能会给用户带来隐私问题。研究表明,物理空间和虚拟空间的活动会相互影响。
[0004]为了解决数据孤岛和数据隐私的两难问题。谷歌和微众银行分别提出了不同的联邦学习算法框架。在联邦学习中,参与者的数据被保存在本地,不泄露隐私,参与者共同建立联合模型并获得收益。与传统的机器学习相比,联邦学习中的节点是不稳定的,具有高度的自治权。而车辆具有高速频繁的移动性,随时驶入驶出,在不同的时空场景下,车辆的密度变化很大。因此,可以将联邦学习应用到车联网中。通过联邦学习,每个车辆可以在不交换本地数据的情况下联合训练机器学习模型。
[0005]针对当前车联网出现的一系列安全问题,本专利技术提出了一个基于区块链的联邦学习池,并将轻量级加密算法融入之中。在这个框架之中,将区块链和联邦学习相结合,实现对用户数据隐私的双重保护。考虑到车载系统较低的性能,采用轻量级加密算法对用户数据进行加密,保证用户在共享信息时的隐私安全。创造了联邦学习池架构——一种自适应学习模型,让服务器根据数据源不同的分布特点自动选择相应的联邦学习方式。通过联邦
学习池架构,用户的隐私数据不仅能够得到更好的保护,同时建立的模型也能更加的完善。

技术实现思路

[0006]针对数据孤岛和隐私保护不足等问题,本专利技术提出来解决方案,该方案提出联邦学习池模块训练模型,可以根据实时应用场景选择最合适的联邦学习算法,在保护用户隐私的同时,也能得到更好模型的改进,具体的
技术实现思路
如下所述。
[0007]一种面向车联网的自适应联邦学习模型,包括以下步骤。
[0008]步骤1:构建联邦学习池。在服务器集群上搭载的一个自适应联邦学习模块,该模块可以根据数据源的特点选择最合适的联邦学习算法。
[0009]同时,针对横向联邦学习、纵向联邦学习、联邦迁移学习,根据实际应用场景选择最适合的学习方式,自主分析数据源的分布特征。
[0010]步骤2:搭建横向联邦学习模型。将车辆作为客户端,区块链中的服务器作为服务器节点;车辆从区块链中下载参数,用本地数据进行本地模型训练。
[0011]训练结束后,通过CPC轻量级算法加密的更新参数返回区块链;在此过程中,基站和路边单元将车辆返回的参数进行汇总,分担服务器的工作。
[0012]步骤3:搭建纵向联邦学习模型。由于同一地区的车辆传感器采集到的数据与交通部门拥有的数据在特征和参数上是不一样的,因此车辆和交通部门利用两个数据集中不同特征的数据来训练本地模型,然后将参数发送给基站和路边单元服务器,进行梯度聚合。最后,将更新后的参数发送到区块链中的服务器,建立联合模型。
[0013]步骤4:搭建联邦迁移学习模型。在保护隐私的前提下,利用迁移学习克服数据或标签的不足的问题。
[0014]迁移学习不仅可以应用于两个样本的空间,还可以应用于两个不同的数据集。迁移学习挑选出有重叠的数据,然后进行样本对齐。利用重叠样本,帮助具有良好标记数据的端单方面预测缺失的特征并建立改进的模型。在此模型的基础上,另一条边对其样本的缺陷特征进行预测,并对模型进行进一步的修正。
[0015]步骤5:构建自适应模型。联合学习框架中,根据数据源的特点和场景,有V2V、V2A、C2A三种自适应学习模型,3个模型中的服务器都是区块链中的服务器。它允许步骤2、3和3中不同的联合学习方式,以满足不同场景的应用需求。
[0016]一种面向车联网的自适应联邦学习方法,包括以下过程内容。
[0017]1) 横向联邦学习方法。
[0018]本方法中有限和的目标函数用表示,其中,表示车辆的数据参数。
[0019]取f
i
=l(x
i
, y
i
; w
vehicle
), 即以车辆的数据参数(x
i
,y
i
)为例进行预测的损失w
vehicle
;假设共有K辆汽车客户端,(DB
vehicle
)
k
表示k个车辆客户端的本地数据集, 此处有n
k
=|(DB
vehicle
)
k |;目标函数等效如下所示。
[0020]上面的定义可以知道,总损耗函数是每个车辆客户端的局部损耗和样本数的加权平均值。而在每一轮通信中,都会有一批梯度计算,通过多轮高效的迭代计算来建立更好的模型。
[0021]每次迭代的方法如下(t表示第t轮迭代)。车辆客户端:这是指当前模型参数(w
vehicle
)
t
下针对当前本地数据的平均梯度。
[0022]车辆信息基站:其中,η表示机器学习速率。
[0023]等效更新方式:车辆客户端的参数需要完成多轮更新才能发送到车辆数据基站,在车辆数据基站将多个车辆客户端的参数进行加权平均。
[0024]2) 纵向联邦学习方法。
[0025]车辆和交通部门拥有的数据本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种面向车联网的自适应联邦学习模型,其特征在于,包括以下步骤:步骤1:构建联邦学习池;在服务器集群上搭载的一个自适应联邦学习模块,该模块可以根据数据源的特点选择最合适的联邦学习算法; 同时,针对横向联邦学习、纵向联邦学习、联邦迁移学习,根据实际应用场景选择最适合的学习方式,自主分析数据源的分布特征;步骤2:搭建横向联邦学习模型;将车辆作为客户端,区块链中的服务器作为服务器节点;车辆从区块链中下载参数,用本地数据进行本地模型训练;训练结束后,通过CPC轻量级算法加密的更新参数返回区块链;在此过程中,基站和路边单元将车辆返回的参数进行汇总,分担服务器的工作;步骤3:搭建纵向联邦学习模型;由于同一地区的车辆传感器采集到的数据与交通部门拥有的数据在特征和参数上是不一样的,因此车辆和交通部门利用两个数据集中不同特征的数据来训练本地模型,然后将参数发送给基站和路边单元服务器,进行梯度聚合;最后,将更新后的参数发送到区块链中的服务器,建立联合模型;步骤4:搭建联邦迁移学习模型;在保护隐私的前提下,利用迁移学习克服数据或标签的不足的问题;它不仅可以应用于两个样本的空间,还可以应用于两个不同的数据集;迁移学习挑选出有重叠的数据,然后进行样本对齐;利用重叠样本,帮助具有良好标记数据的端单方面预测缺失的特征并建立改进的模型;在此模型的基础上,另一条边对其样本的缺陷特征进行预测,并对模型进行进一步的修正;步骤5:构建自适应模型;在联合学习框架中,根据数据源的特点和场景,有V2V、V2A、C2A三种自适应学习模型,3个模型中的服务器都是区块链中的服务器;它允许步骤2、3和3中不同的联合学习方式,以满足不同场景的应用需求。2.根据权利1的要求,一种面向车联网的自适应联邦学习方法,其特征在于,包括以下过程:1) 横向联邦学习方法;本方法中有限和的目标函数用表示,其中,表示车辆的数据参数;取f
i
=l(x
i
, y
i
; w
vehicle
), 即以车辆的数据参数(x
i
,y
i
)为例进行预测的损失w
vehicle
;假设共有K辆汽车客户端,(DB
vehicle
)
k
表示k个车辆客户端的本地数据集, 此处有n
k
=|(DB
vehicle
)
k |;目标函数等效如下所示;上面的定义可以知道,总损耗函数是每个车辆客户端的局部损耗和样本数的加权平均值;而在每一轮通信中,都会有一批梯度计算,通过多轮高效的迭代计算来建立更好的模型;每次迭代的方法如下(t表示第t轮迭代);车辆客户端:这是指当前模型参数(w
vehicle
)
t
下针对当前本地数据的平均梯度;车辆信息基站:
其中,η表示机器学习速率;等效更新方式:...

【专利技术属性】
技术研发人员:程文志欧嵬刘志壮张文昭王林慧袁明潘晴云
申请(专利权)人:湖南科技学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1