联邦学习中数据审计方法、设备、介质及程序产品技术

技术编号:31310151 阅读:13 留言:0更新日期:2021-12-12 21:39
本申请公开了一种联邦学习中数据审计方法、设备、介质及程序产品,所述联邦学习中数据审计方法包括:获取联邦学习设备的通信数据流信息,其中,通信数据流信息至少包括明文数据以及密态数据中的一种;若通信数据流信息包括明文数据,对明文数据进行基础特征审计,并在明文数据的基础特征审计通过时,对明文数据进行内容特征审计;若通信数据流信息包括密态数据,对密态数据进行基础特征审计,并在密态数据的基础特征审计通过时,依据是否具备对密态数据的解密权限选择性地对密态数据进行内容特征审计;在审计结束或者审计过程发现异常状态的情况下,生成审计结果。本申请解决了由于联邦设备通信中存在恶意数据而导致联邦学习效率低的技术问题。效率低的技术问题。效率低的技术问题。

【技术实现步骤摘要】
联邦学习中数据审计方法、设备、介质及程序产品


[0001]本申请涉及大数据
,尤其涉及一种联邦学习中数据审计方法、设备、介质及程序产品。

技术介绍

[0002]随着人工智能技术的不断发展,研究人员提出了一种名为联邦学习的机器学习方案,联邦学习是一种在多个去中心化的边缘设备或服务器上训练模型的机器学习技术,允许多个数据方在不共享原始数据的前提下共同建立一个共有的、强有力的机器学习模型,从而解决数据隐私、数据安全、数据访问权限、异构数据访问等关键性问题,目前,在进行联邦学习时,各个联邦学习设备之间通常需要传输密态数据,例如,加密的梯度、加密的损失或者加密的模型网络参数本身等,一旦存在恶意设备向联邦服务器发送恶意数据参与联邦学习,将会导致基于联邦学习构建的模型难以收敛,进而影响联邦学习的效率。

技术实现思路

[0003]本申请的主要目的在于提供一种联邦学习中数据审计方法、设备、介质及程序产品,旨在解决现有技术中由于联邦学习通信过程中存在恶意数据而导致联邦学习效率低的技术问题。
[0004]为实现上述目的,本申请提供一种联邦学习中数据审计方法,所述联邦学习中数据审计方法应用于联邦学习中数据审计设备,所述联邦学习中数据审计方法包括:
[0005]获取联邦学习设备的通信数据流信息,其中,所述通信数据流信息至少包括明文数据以及密态数据中的一种;
[0006]若所述通信数据流信息包括所述明文数据,则对所述明文数据进行基础特征审计,并在所述明文数据的基础特征审计通过的情况下,对所述明文数据进行内容特征审计;
[0007]若所述通信数据流信息包括所述密态数据,则对所述密态数据进行基础特征审计,并在所述密态数据的基础特征审计通过的情况下,依据是否具备对所述密态数据的解密权限选择性地对所述密态数据进行内容特征审计;
[0008]在审计结束或者审计过程发现异常状态的情况下,生成审计结果。
[0009]可选地,所述审计结果包括明文数据审计结果,
[0010]所述在审计结束或者审计过程发现异常状态的情况下,生成审计结果的步骤包括:
[0011]若所述明文数据的基础特征审计或内容特征审计过程中发现异常状态,则根据该异常状态生成明文数据审计结果;
[0012]若所述明文数据的基础特征审计和内容特征审计过程中未发现异常状态,且在所述明文数据的基础特征审计和内容特征审计结束的情况下,生成结果为基础特征审计和内容特征审计均通过的明文数据审计结果。
[0013]可选地,所述审计结果包括密文数据审计结果,
[0014]所述在审计结束或者审计过程发现异常状态的情况下,生成审计结果的步骤包括:
[0015]若所述密态数据的基础特征审计或内容特征审计过程中发现异常状态,则根据该异常状态生成密文数据审计结果;
[0016]在所述密态数据的基础特征审计通过的情况下,若不具备对所述密态数据的解密权限,则生成结果为基础特征审计通过的密态数据审计结果;
[0017]若所述密态数据的基础特征审计和内容特征审计过程中未发现异常状态,且在所述密态数据的基础特征审计和内容特征审计结束的情况下,生成结果为基础特征审计和内容特征审计均通过的密态数据审计结果。
[0018]可选地,所述密态数据包括密态张量,
[0019]所述依据是否具备对所述密态数据的解密权限选择性地对所述密态数据进行内容特征审计的步骤包括:
[0020]若具备对所述密态数据的解密权限,则对所述密态张量进行解密,获得待审计张量;
[0021]获取所述待审计张量对应的规则表索引信息,并依据所述规则表索引信息,在预设规则模型中查询所述待审计张量对应的目标规则表;
[0022]基于所述目标规则表中的审计规则,对所述待审计张量的内容特征进行审计,直至审计结束或者审计过程发现异常状态;
[0023]若不具备对所述密态数据的解密权限,则不对所述密态数据进行内容特征审计,审计结束。
[0024]可选地,所述审计规则包括数据定位信息和审计子规则,
[0025]所述基于所述目标规则表中的审计规则,对所述待审计张量的内容特征进行审计的步骤包括:
[0026]基于所述数据定位信息,在所述待审计张量中定位待审计内容;
[0027]基于所述审计子规则,对所述待审计内容中数值的取值范围以及所述待审计内容中数值是否可为空进行审计。
[0028]可选地,所述获取所述待审计张量对应的规则表索引信息的步骤包括:
[0029]获取所述待审计张量对应的联邦学习任务标识信息、对应的联邦设备身份信息、对应的联邦迭代次数信息以及对应的中间结果数据类型信息;
[0030]将所述联邦学习任务标识信息、所述联邦设备身份信息、所述联邦迭代次数信息和所述中间结果数据类型信息进行聚合,获得所述规则表索引信息。
[0031]可选地,所述规则表索引信息至少由联邦学习任务标识信息、联邦设备身份信息、联邦迭代次数信息和中间结果数据类型信息中的一种组成。
[0032]可选地,在所述依据所述规则表索引信息,在预设规则模型中查询所述待审计张量对应的目标规则表的步骤之前,所述联邦学习中数据审计方法还包括:
[0033]获取预设联邦任务对应的各样本特征的特征取值范围,并依据所述各样本特征的特征取值范围,构建测试样本集;
[0034]基于所述测试样本集,与其他联邦学习设备进行联邦学习建模,以计算所述测试样本集对应的若干中间结果张量;
[0035]构建所述若干中间结果张量对应的规则表索引信息,并依据所述若干中间结果张量的数据分布情况以及所述若干中间结果张量对应的规则表索引信息,构建所述预设规则模型。
[0036]可选地,在所述依据所述规则表索引信息,在预设规则模型中查询所述待审计张量对应的目标规则表的步骤之前,所述联邦学习中数据审计方法还包括:
[0037]获取预设联邦任务对应的各样本特征的特征取值范围,以及所述预设联邦任务对应的联邦学习模型对应的中间结果计算表达式;
[0038]依据所述各样本特征特征取值范围和所述中间结果计算表达式,计算所述联邦学习模型对应的若干中间结果张量的数据分布情况;
[0039]构建所述若干中间结果张量对应的规则表索引信息,并依据所述若干中间结果张量的数据分布情况以及所述若干中间结果张量对应的规则表索引信息,构建所述预设规则模型。
[0040]本申请还提供一种联邦学习中数据审计装置,所述联邦学习中数据审计装置为虚拟装置,且所述联邦学习中数据审计装置应用于联邦学习中数据审计设备,所述联邦学习中数据审计装置包括:
[0041]获取模块,用于获取联邦学习设备的通信数据流信息,其中,所述通信数据流信息至少包括明文数据以及密态数据中的一种;
[0042]明文数据审计模块,用于若所述通信数据流信息包括所述明文数据,则对所述明文数据进行基础特征审计,并在所述明文数据的基础特征审计通过的情况下本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种联邦学习中数据审计方法,其特征在于,所述联邦学习中数据审计方法包括:获取联邦学习设备的通信数据流信息,其中,所述通信数据流信息至少包括明文数据以及密态数据中的一种;若所述通信数据流信息包括所述明文数据,则对所述明文数据进行基础特征审计,并在所述明文数据的基础特征审计通过的情况下,对所述明文数据进行内容特征审计;若所述通信数据流信息包括所述密态数据,则对所述密态数据进行基础特征审计,并在所述密态数据的基础特征审计通过的情况下,依据是否具备对所述密态数据的解密权限选择性地对所述密态数据进行内容特征审计;在审计结束或者审计过程发现异常状态的情况下,生成审计结果。2.如权利要求1所述联邦学习中数据审计方法,其特征在于,所述审计结果包括明文数据审计结果,所述在审计结束或者审计过程发现异常状态的情况下,生成审计结果的步骤包括:若所述明文数据的基础特征审计或内容特征审计过程中发现异常状态,则根据该异常状态生成明文数据审计结果;若所述明文数据的基础特征审计和内容特征审计过程中未发现异常状态,且在所述明文数据的基础特征审计和内容特征审计结束的情况下,生成结果为基础特征审计和内容特征审计均通过的明文数据审计结果。3.如权利要求1所述联邦学习中数据审计方法,其特征在于,所述审计结果包括密文数据审计结果,所述在审计结束或者审计过程发现异常状态的情况下,生成审计结果的步骤包括:若所述密态数据的基础特征审计或内容特征审计过程中发现异常状态,则根据该异常状态生成密文数据审计结果;在所述密态数据的基础特征审计通过的情况下,若不具备对所述密态数据的解密权限,则生成结果为基础特征审计通过的密态数据审计结果;若所述密态数据的基础特征审计和内容特征审计过程中未发现异常状态,且在所述密态数据的基础特征审计和内容特征审计结束的情况下,生成结果为基础特征审计和内容特征审计均通过的密态数据审计结果。4.如权利要求1所述联邦学习中数据审计方法,其特征在于,所述密态数据包括密态张量,所述依据是否具备对所述密态数据的解密权限选择性地对所述密态数据进行内容特征审计的步骤包括:若具备对所述密态数据的解密权限,则对所述密态张量进行解密,获得待审计张量;获取所述待审计张量对应的规则表索引信息,并依据所述规则表索引信息,在预设规则模型中查询所述待审计张量对应的目标规则表;基于所述目标规则表中的审计规则,对所述待审计张量的内容特征进行审计,直至审计结束或者审计过程发现异常状态;若不具备对所述密态数据的解密权限,则不对所述密态数据进行内容特征审计,审计结束。5.如权利要求4所述联邦学习中数据审计方法,其特征在于,所述审计规则包括数据定
位信息和审计子规则,所述基于所述目标规则表中的审计规则,对所述待审计张量的内容特征进行审计的步骤包括:基于所述数据定位信息,在所述待审计张量中定位待审计内容;基于所述审计子规则,对所述待审计内容中数值的...

【专利技术属性】
技术研发人员:彭瑞孙军欢陈沫
申请(专利权)人:深圳致星科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1