联邦学习审计装置、系统及方法制造方法及图纸

技术编号:31083668 阅读:23 留言:0更新日期:2021-12-01 12:32
本申请涉及数据安全和隐私保护技术领域中的一种联邦学习审计装置、系统及方法。联邦学习审计装置包括:数据收集模块,用于获得参与方所接收或者发送的数据包;和数据分析模块,用于根据参与方的审计级别而开启控制流审计、算法流审计以及数据流审计中的一种或者多种,从而审计数据包并生成审计结果。控制流审计用于校验数据包的控制流信息且与参与方所参与的联邦学习任务相关。算法流审计用于检验数据包的算法流信息且与联邦学习算法相关。数据流审计用于校验数据包的数据流信息,数据流信息与参与方的通信数据相关。通过不同的审计级别和设定各自独立的审计机制,可以满足每个参与方对通信和计算的安全性多样化的诉求,有利于系统整体安全性。利于系统整体安全性。利于系统整体安全性。

【技术实现步骤摘要】
联邦学习审计装置、系统及方法


[0001]本申请涉及数据安全和隐私保护
,具体涉及一种联邦学习审计装置、系统及方法。

技术介绍

[0002]随着人工智能和大数据挖掘分析等应用领域的发展,对数据量的需求越来越大。例如训练人工智能的应用模型需要使用大量带有合适的数据标签或者特征数值的训练数据。高质量的数据往往来源于经营活动中产生和积累的应用数据。但是应用数据往往分散在不同的组织和个体手上,例如交易数据分散在各个金融机构,医疗诊断数据分散在各个医疗机构。跨行业跨领域的应用数据往往也是分散的,例如互联网领域的社交属性数据和电商交易数据往往由不同实体掌控。随着数据所有权的重要性、用户隐私和数据安全等受到更多重视,也随着法律法规对数据收集处理提出更严格的约束和要求,掌握应用数据的各个组织或个体往往不愿意或者没有合适手段进行彼此之间的合作,从而很难让各自掌握的应用数据共同发挥作用。这种数据分享和协同合作方面的困境被称之为数据孤岛现象。为了解决跨行业跨组织的数据合作难题,尤其是关键的隐私保护及数据安全的问题,提出了联邦学习的概念。联邦学习指的是拥有数据的本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种联邦学习审计方法,其特征在于,所述联邦学习审计方法包括:获得参与方所接收和/或发送的数据包;和根据所述参与方的审计级别而开启控制流审计、算法流审计以及数据流审计中的一种或者多种,从而审计所述数据包并生成审计结果,其中,所述控制流审计用于校验所述数据包的控制流信息,所述控制流信息与所述参与方所参与的联邦学习任务相关,所述算法流审计用于检验所述数据包的算法流信息,所述算法流信息与联邦学习算法相关,所述联邦学习算法对应所述联邦学习任务中的模块,所述数据流审计用于校验所述数据包的数据流信息,所述数据流信息与所述参与方的通信数据相关。2.根据权利要求1所述的联邦学习审计方法,其特征在于,所述联邦学习审计方法还包括:根据所述审计结果来判断所述数据包是否存在错误,并且根据判断结果确定是否让所述数据包用于所述联邦学习任务或者所述联邦学习算法。3.根据权利要求1所述的联邦学习审计方法,其特征在于,所述联邦学习审计方法还包括:根据所述审计结果来判断所述数据包是否存在错误,在进行判断同时继续让所述数据包用于所述联邦学习任务或者所述联邦学习算法。4.根据权利要求1至3中任一项所述的联邦学习审计方法,其特征在于,所述控制流信息包括与所述参与方所参与的联邦学习任务相对应的模块调用列表和模块调用次序。5.根据权利要求4所述的联邦学习审计方法,其特征在于,所述控制流审计包括,根据所述数据包的控制流信息,确定与所述联邦学习任务相对应的模块调用列表是否与参考模块调用列表一致以及确定与所述联邦学习任务相对应的模块调用次序是否与参考模块调用次序一致,其中,所述参考模块列表和所述参考模块调用次序均预先设定。6.根据权利要求5所述的联邦学习审计方法,其特征在于,根据所述数据包的控制流信息,确定与所述联邦学习任务相对应的模块调用列表是否与所述参考模块调用列表一致以及确定与所述联邦学习任务相对应的模块调用次序是否与所述参考模块调用次序一致,包括:根据所述数据包的控制流信息,判断与所述联邦学习任务相对应的模块调用列表和与所述联邦学习任务相对应的模块调用次序是否均符合用于控制流审计的有限状态机FSM,其中,所述用于控制流审计的FSM预先设定。7.根据权利要求6所述的联邦学习审计方法,其特征在于,所述用于控制流审计的FSM是多个预设的联邦学习任务FSM之一,所述多个预设的联邦学习任务FSM与多个联邦学习任务一一对应,所述多个联邦学习任务包括以下至少一种任务:纵向安全梯度提升树任务、纵向逻辑回归任务、本地sklearn逻辑回归任务、纵向线性回归任务、纵向泊松回归任务、横向逻辑回归任务、横向神经网络任务、纵向快速安全梯度提升树任务、纵向神经网络任务、横向安全梯度提升树任务、纵向联邦迁移学习任务、纵向k

means任务、Feldman安全求和任务。8.根据权利要求7所述的联邦学习审计方法,其特征在于,所述多个预设的联邦学习任务FSM均是有向无环图DAG并且可通过拓扑排序被转化为一个或者多个单向无分叉的DAG。
9.根据权利要求8所述的联邦学习审计方法,其特征在于,获得所述参与方所接收或者发送的数据包,包括:根据所述多个预设的联邦学习任务FSM中与所述参与方所参与的联邦学习任务相对应的FSM,确定抓取间隔,并根据所述抓取间隔来间隔地获得所述参与方所接收或者发送的数据包。10.根据权利要求9所述的联邦学习审计方法,其特征在于,所述抓取间隔是所述多个预设的联邦学习任务FSM中与所述参与方所参与的联邦学习任务相对应的FSM中的最短子路径的长度减一。11.根据权利要求9或10所述的联邦学习审计方法,其特征在于,审计所述数据包并生成所述审计结果,包括:审计根据所述抓取间隔来间隔地获得的所述数据包并生成所述控制流审计的审计结果。12.根据权利要求1至3中任一项所述的联邦学习审计方法,其特征在于,所述算法流信息包括所述联邦学习算法的执行流程。13.根据权利要求12所述的联邦学习审计方法,其特征在于,所述算法流审计包括,根据所述数据包的算法流信息确定所述联邦学习算法的执行流程是否与参考算法执行流程一致,其中,所述参考算法执行流程预先设定。14.根据权利要求13所述的联邦学习审计方法,其特征在于,根据所述数据包的算法流信息确定所述联邦学习算法的执行流程是否与所述参考算法执行流程一致,包括:根据所述数据包的算法流信息判断所述联邦学习算法的执行流程是否符合用于算法流审计的FSM,其中,所述用于算法流审计的FSM基于所述参考算法执行流程。15.根据权利要求14所述的联邦学习审计方法,其特征在于,所述用于算法流审计的FSM是多个预设的联邦学习算法FSM之一,所述多个预设的联邦学习算法FSM与多个联邦学习算法一一对应,所述多个联邦学习算法包括以下至少一种算法:求交集算法、纵向安全梯度提升树算法、纵向逻辑回归算法、本地sklearn逻辑回归算法、纵向线性回归算法、纵向泊松回归算法、横向逻辑回归算法、横向神经网络算法、纵向快速安全梯度提升树算法、纵向安全梯度提升树特征编码算法、纵向神经网络算法、横向安全梯度提升树算法、纵向联邦迁移学习算法、纵向k

means算法、Feldman安全求和算法。16.根据权利要求15所述的联邦学习审计方法,其特征在于,所述多个预设的联邦学习算法FSM包括不带有迭代计算的第一类联邦学习算法FSM和带有迭代计算的第二类联邦学习算法FSM,其中,所述第一类联邦学习算法FSM均是DAG并且可通过拓扑排序被转化为一个或者多个单向无分叉的DAG。17.根据权利要求16所述的联邦学习审计方法,其特征在于,获得所述参与方所接...

【专利技术属性】
技术研发人员:彭瑞孙军欢陈沫
申请(专利权)人:深圳致星科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1