面向物联网隐私保护的聚合验证方法技术

技术编号:37334014 阅读:20 留言:0更新日期:2023-04-21 23:12
本发明专利技术公开一种面向物联网隐私保护的聚合验证方法,包括:步骤1,构建物联网系统;步骤2,将物联网终端分簇,每个分簇中包含一个物联网第一终端、若干个物联网第二终端和若干个物联网第三终端;步骤3,对恶意节点进行建模用于影响物联网系统的安全性和效率;步骤4,物联网第二终端将收集到的数据加入其本地数据集并进行本地模型训练,物联网第二终端将本地模型参数上传至物联网第一终端参与模型聚合。所述方法通过模型参数的逐层传递避免了具体数据的上传,保护了数据隐私;通过分层聚合及选取节点参与聚合的方式缓解了模型聚合给服务器带来的负载压力,通过验证保障了聚合的安全性。性。性。

【技术实现步骤摘要】
面向物联网隐私保护的聚合验证方法


[0001]本专利技术属于物联网数据隐私保护
,具体涉及一种面向物联网隐私保护的聚合验证方法。

技术介绍

[0002]物联网技术利用多种传感器设备按照协议将各类物品与互联网相连接,进行信息交换和通信,以实现万物互联,其本质上是一种集成了多种现代信息技术和物理基础设施的微型计算机控制系统,传统的物联网系统架构主要由物联网终端、网关和服务器三部分构成,物联网终端负责收集并上报物联网数据、网关负责转发数据,服务器负责数据存储和数据分析,随着物联网技术的发展和生活需求的不断增加,各类物联网应用及物联网终端不断增加,海量的物联网数据产生并需要存储于服务器中,传统的数据库技术虽然能完成数据的分类存储,但无法满足日益增长的数据隐私性需求及出现的安全性问题。
[0003]联邦学习的提出,为数据的隐私性保护提出了一种新思路,联邦学习作为一种新兴分布式机器学习技术,其设计目标是在保障大数据交换时的信息安全、保护终端数据和个人数据隐私的前提下,在多参与方或多计算结点之间开展高效率的机器学习,联邦学习的学习框架如下:
[0004]在确定训练各参与方后,联邦学习首先在服务器中部署一全局模型,并在各参与方中部署相同的机器学习模型使其构建一个独特的训练小组,使得各参与方能够协作训练机器学习模型,同时将数据保持在本地;
[0005]在每一轮训练中,部署全局模型的服务器将全局模型参数共享给每个参与者,每个参与者基于其本地数据集训练本地模型,并将训练后的本地模型参数发送回服务器;
[0006]服务器根据训练组中预先设定好的聚合规则对所有接收到的本地模型进行聚合。
[0007]根据多参与方之间数据分布的不同,把联邦学习分为三类:横向联邦学习、纵向联邦学习和联邦迁移学习,横向联邦学习适用于联邦学习的参与方的数据特征有重叠,而数据样本空间不同,横向联邦学习中数据特征重叠维度较多,根据重合维度进行对齐,取出参与方数据中特征相同而用户不完全相同的部分进行联合训练,纵向联邦学习适用于联邦学习参与方的训练数据有重叠的数据样本,但是数据特征不相同,联邦迁移学习适用于参与方的数据样本和数据特征重叠都很少的情况。
[0008]同时,随着比特币的提出及发展,作为其底层支撑的区块链技术被视为重要的物联网数据安全解决方案之一,区块链技术作为一种分布式数据存储方案,其去中心化和不可篡改的特点与物联网系统的数据存储需求基本吻合,区块链技术的基础数据结构是一系列被称为“区块”的数据记录通过密码学的方式链接起来形成的账本,其中每一个“区块”包含了上一个“区块”的部分信息,区块链技术通过在各设备上部署区块链节点构成区块链网络,区块链网络内的各节点共同维护区块链账本,保持节点间的数据一致性。
[0009]近年来,随着联邦学习的发展,将联邦学习应用到物联网系统,已成为了保护物联网系统数据隐私性的重要方法之一,在现有的研究中,本地模型和全局模型通常分别部署
在物联网终端和服务器上,使各物联网终端构成一个联邦学习训练组,然而,部署联邦学习模型给物联网系统带来了较大的计算负担,按照联邦学习的算法流程,训练组中的所有参与者参与联邦学习模型的聚合,在物联网系统中普遍存在大量物联网终端,全部参与模型聚合会给服务器带来很大的负荷,影响物联网系统的系统效率,甚至影响系统的正常运行,目前将物联网系统与区块链技术相结合的目的是保证物联网数据的安全性同时提供数据可追溯性,现有研究的普遍做法是将区块链节点部署于物联网服务器中,由各服务器构成区块链网络,这种方案虽然能保证物联网数据的安全存储,但会进一步加剧服务器的负载压力,并对部分时延敏感类物联网应用产生不良影响,同时,将物联网数据集中上链存储不能满足部分用户的数据隐私存储需求。
[0010]在传统的联邦学习算法流程中,本地模型首先根据本地数据集进行训练,并将本地模型参数上传至全局模型进行模型聚合,为了缓解执行聚合任务对部署全局模型的物联网模块的负载,现有面向物联网的联邦学习研究中,研究者结合了边缘计算的概念,并采用一种分层聚合的方式实现联邦学习模型聚合,即在进行联邦学习模型聚合时由基站和服务器分别执行两次模型聚合。
[0011]采用分层聚合的目的是充分利用物联网系统中边缘层模块,例如基站的计算资源,承担了部分聚合任务,但同时,随着系统中物联网终端的增加,作为边缘服务器的基站承担的负载压力也随之增加,基站的受限硬件资源可能成为限制系统效率的因素之一,除了采用分层聚合分散聚合任务外,部分研究在系统中设计节点选取机制,选择部分物联网终端参与模型聚合以减少执行模型聚合任务所需完成的计算量,从而提高联邦学习效率并缓解服务器负载压力,现有研究中的选取方法主要是基于终端具备的资源或终端上报的本地模型参数性能。
[0012]例如,一种现有技术公开了一种基于区块链的联邦学习参与节点选择方法,该联邦学习参与节点选择方法用于包括终端设备和基站的物联网系统,该联邦学习参与节点选择方法包括:获取每个终端设备与基站、其它终端设备之间在预设时间内的交互次数和距离,根据预设截断距离、数据交互次数、终端设备与其它终端设备的距离确定每个终端设备的活跃度密度,根据活跃度密度的大小以选择目标终端设备,计算终端设备到目标终端设备的偏移距离,根据活跃度密度和偏移距离确定终端设备的聚类中心点,通过聚类中心点的终端设备传输对应聚类模型物联网第二终端设备的数据至基站,该方法通过上述步骤减少了进行模型聚合时在物联网系统中模型参数的传输时间,减少联邦学习的整体时延。
[0013]再如,另一种现有技术公开一种基于声誉的物联网边云协同联邦学习节点选择方法,该方法包括:构建基于声誉的物联网边云协同联邦学习体系架构,根据构建的基于声誉的物联网边云协同联邦学习体系架构采用基于多权重主观逻辑模型的声誉评分方法对参与联邦学习模型聚合的节点进行选取,得到最优的节点组合;该专利技术利用多权重主观逻辑模型来计算每个参与节点的声誉值,目的是提高联邦学习的准确率和训练速度。
[0014]但是,上述现有技术在实际的使用过程中存在着如下技术问题:
[0015]当基站的覆盖范围内存在超出其处理能力的物联网终端时,基站执行模型聚合任务会造成较大的时延并对系统的正常运行产生影响;
[0016]在现有节点选取方法中,普遍由基站或服务器收集部署了本地模型的物联网终端的终端信息或模型信息以进行节点选取,被恶意攻击者劫持的物联网终端可能会提交虚构
的相关信息以被选为聚合节点,从而通过上述方式影响模型聚合。因此,基于节点信息的节点选择方法存在着安全性问题。
[0017]基于现有技术存在的上述技术问题,本专利技术提出一种面向物联网隐私保护的聚合验证方法。

技术实现思路

[0018]本专利技术的目的是针对现有技术的不足,提供一种面向物联网隐私保护的聚合验证方法,包括:
[0019]步骤1,构建物联网系统,物联网系统包括服务器、基站、物联网终端,其中,物联网终端包括物联网第一终端、物联网第二终端和物联网第三终端,物联本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种面向物联网隐私保护的聚合验证方法,其特征在于,包括:步骤1,构建物联网系统,物联网系统包括服务器、基站、物联网终端,其中,物联网终端包括物联网第一终端、物联网第二终端和物联网第三终端,物联网第三终端用于收集物联网数据并上报至距离其最近的物联网第二终端,物联网第二终端用于部署联邦学习本地模型,收集物联网第三终端上报的数据并训练本地模型,物联网第一终端用于部署分簇模型,收集物联网第二终端的本地模型参数并执行模型聚合,服务器用于部署全局模型执行全局模型聚合,构建由物联网第一终端和基站构成的边缘区块链网络用于实现物联网系统中信息的可信存证,边缘区块链网络采用RAFT+[4]作为共识机制;步骤2,将物联网终端分簇,每个分簇中包含一个物联网第一终端、若干个物联网第二终端和若干个物联网第三终端,每个分簇的物联网第一终端和物联网第二终端共同维护一个本地区块链网络,本地区块链网络内的物联网第二终端执行模型性能的相互验证并存储验证结果,本地区块链网络采用RAFT+[4]作为共识机制,基站在边缘区块链网络内的物联网第一终端中选择一个Leader节点,被选中的Leader节点打包数据区块并主导区块共识,其余的物联网第一终端是Follower节点,参与区块共识;步骤3,对恶意节点进行建模用于影响物联网系统的安全性和效率;步骤4,物联网第三终端根据设定的采集间隔收集物联网数据并上报至距离其最近的物联网第二终端,物联网第二终端将收集到的数据加入其本地数据集并进行本地模型训练,物联网第二终端将本地模型参数上传至物联网第一终端参与模型聚合,由物联网第一终端、基站和服务器分别执行模型聚合后,全局模型参数被同步至物联网系统中全部的联邦学习模型上。2.根据权利要求1所述的面向物联网隐私保护的聚合验证方法,其特征在于,步骤4包括:步骤4.1,在每轮训练开始时,物联网第三终端根据基于模型性能的聚合节点选取机制选取参与此次模型聚合的Leader节点和聚合节点,物联网第三终端根据其预设类型收集物联网感知数据并上报至距离其最近的物联网第二终端,物联网第二终端收集由物联网第三终端上报的物联网数据并将其加入本地数据集,物联网第二终端根据预设时刻训练部署在物联网第二终端上的本地模型;步骤4.2,物联网第二终端本地训练结束后,本地模型参数被上传到分簇内的物联网第一终端,物联网第二终端在收集了分簇内所有物联网第二终端的本地模型参数后执行分簇模型聚合,物联网第一终端i收集本地模型参数和执行分簇模型聚合的时延用表示;步骤4.3,物联网第一终端为分簇内的每个物联网第二终端分配验证节点并生成簇内验证任务,并将验证任务打包生成验证区块在本地区块链网络内进行广播,由分簇内的物联网第二终端进行相互验证;步骤4.4,由基站通过聚合节点选取机制被选为聚合节点的物联网第一终端上报其分簇模型参数参与边缘模型聚合,未被选为聚合节点的物联网第一终端在此次模型聚合中作为聚合验证方法中的验证节点,基站收集到所有聚合节点上报的分簇模型参数后执行边缘模型聚合,基站收集聚合节点模型参数、执行边缘模型聚合表示为步骤4.5,基站根据聚合节点集合生成验证任务,验证任务被打包生成验证任务区块,
验证任务区块生成后被同步至边缘区块链网络内的各物联网第一终端,此次边缘聚合中作为验证节点的物联网第一终端执行验证任务区块中为其分配的验证任务,并将验证结果包含在响应中发送至Leader节点,当Leader节点收集到的验证结果满足基于区块链的模型性能验证机制的要求后,验证过程完成,Leader节点根据性能验证机制计算各聚合节点的模型准确度,验证时延表示为步骤4.6,Leader节点将各模型准确度与验证结果以交易的形式打包生成验证结果区块并在边缘区块链网络内进行区块共识,各物联网第一终端检查各聚合节点模型准确度及验证任务与验证结果的对应关系,并发送确认响应至Leader节点,验证结果区块生成时延与共识时延分别表示为和区块合法生成后,基站根据区块中包含的边缘模型准确度及各聚合节点分簇模型准确度更新基于模型性能的聚合节点选取机制中的选取策略,并将聚合后的边缘模型参数发送至服务器;步骤4.7,服务器执行全局模型聚合并将全局模型参数依次同步至边缘模型、分簇模型和本地模型,时延表示为步骤4.8,面向物联网隐私保护的聚合验证方法中完成一轮联邦学习模型训练所需的总时延表示为重复执行步骤4.1

4.7直至联邦学习全局模型收敛。3.根据权利要求1所述的面向物联网隐私保护的聚合验证方法,其特征在于,步骤4中还包括对物联网终端进行分簇的步骤:根据物联网系统中基站覆盖范围内物联网第一终端的数量确定分簇的数量,并以物联网第一终端为分簇簇头建立N
S
个分簇;各物联网第二终端根据物联网第二终端与各簇头的距离确认加入的分簇,为了平衡分簇间的计算任务,各分簇内的物联网第二终端数量满足其中N
M
是物联网系统内物联网第二终端的数量;当各物联网第二终端确认物联网第二终端加入的分簇后,物联网第三终端根据物联网第三终端与各物联网第二终端的距离确认物联网第三终端上报数据的目标,以确认物联网第三终端加入的分簇间,各物联网第三终端确认物联网第三终端加入的分簇后,终端分簇完成。4.根据权利要求1所述的面向物联网隐私保护的聚合验证方法,其特征在于,步骤4中还包括联邦学习分层聚合的步骤:在物联网终端分簇完成后,系统中的服务器、基站、物联网第一终端和物联网第二终端通过部署的全局模型、边缘模型、分簇模型和本地模型以参与分层模型聚合,从而实现系统中物联网模块的负载平衡,在分层聚合中,分别通过全局模型、边缘模型、分簇模型执行三次模型聚合以分散模型聚合任务。5.根据权利要求1所述的面向物联网隐私保护的聚合验证方法,其特征在于,步骤4中还包括模型性能的聚合节点选取的步骤:
步骤421,在节点选取开始时,基站收集各物联网第一终端参与聚合的次数、物联网第一终端的计算资源和系统通信环境信息,参与聚合次数最多的节点成为新的Leader,在聚合节点选取过程中,确定参与模型聚合的物联网第一终端数量并根据模型准确度对参与上次模型聚合的物联网第一终端进行排序,前50%的物联网第一终端继续参与模型聚合,并加入聚合节点集合W,其余参与上次模型聚合的物联网第一终端作为此次模型聚合的验证节点,参加此次模型聚合的...

【专利技术属性】
技术研发人员:侯璐刘智铭梅杰郑侃
申请(专利权)人:宁波镇海数字经济研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1