数据收集方法、数据收集装置、存储介质与电子设备制造方法及图纸

技术编号:38280103 阅读:23 留言:0更新日期:2023-07-27 10:29
本公开提供数据收集方法、装置、存储介质与电子设备,涉及信息安全技术领域。其中,应用于第一端的数据收集方法包括:将构建匿名数据库所使用的特征匿名化信息发送至第二端;接收第二端发送的第二匿名特征数据,确定第二匿名特征数据所属的目标等价类,并判断增加第二匿名特征数据后的目标等价类是否满足K匿名条件;在判断满足K匿名条件的情况下,向第二端发送数据采集指令,并接收第二端响应于数据采集指令发送的经过隐私化处理的第二敏感数据;利用第二匿名特征数据和经过隐私化处理的第二敏感数据更新匿名数据库。本公开实现了多方协作场景下的数据收集与隐私保护,收集的数据满足K匿名条件,安全性较高,且数据处理与使用成本较低。本较低。本较低。

【技术实现步骤摘要】
数据收集方法、数据收集装置、存储介质与电子设备


[0001]本公开涉及信息安全
,尤其涉及数据收集方法、数据收集装置、计算机可读存储介质与电子设备。

技术介绍

[0002]随着数据共享、信息同步等方面的需求日益增长,如何在多方协作的场景(如端云协同的场景)下对数据进行有效的隐私保护,不向外界暴露数据内的个体信息,成为业界关注的重点问题。
[0003]相关技术中,提高数据安全性的方案大多是针对本地数据的单方处理的方案,不适用于多方协作的场景。

技术实现思路

[0004]本公开提供数据收集方法、数据收集装置、计算机可读存储介质与电子设备,以至少在一定程度上解决相关技术无法在多方协作的场景下对数据进行隐私保护的问题。
[0005]根据本公开的第一方面,提供一种数据收集方法,应用于第一端,所述方法包括:将构建匿名数据库所使用的特征匿名化信息发送至第二端,使所述第二端采用所述特征匿名化信息对第二待处理数据中的第二特征数据进行匿名化处理以得到第二匿名特征数据;所述第二待处理数据包括第二敏感数据和所述第二敏感数据对应的所本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种数据收集方法,应用于第一端,其特征在于,所述方法包括:将构建匿名数据库所使用的特征匿名化信息发送至第二端,使所述第二端采用所述特征匿名化信息对第二待处理数据中的第二特征数据进行匿名化处理以得到第二匿名特征数据;所述第二待处理数据包括第二敏感数据和所述第二敏感数据对应的所述第二特征数据;接收所述第二端发送的所述第二匿名特征数据,确定所述第二匿名特征数据在所述匿名数据库中所属的目标等价类,并判断增加所述第二匿名特征数据后的所述目标等价类是否满足K匿名条件;K为不小于2的正整数;在判断增加所述第二匿名特征数据后的所述目标等价类满足K匿名条件的情况下,向所述第二端发送数据采集指令,并接收所述第二端响应于所述数据采集指令发送的经过隐私化处理的所述第二敏感数据;利用所述第二匿名特征数据和经过隐私化处理的所述第二敏感数据更新所述匿名数据库。2.根据权利要求1所述的方法,其特征在于,所述判断增加所述第二匿名特征数据后的所述目标等价类是否满足K匿名条件,包括:将属于所述目标等价类的所述第二匿名特征数据对应的数据数量进行累加,并与所述目标等价类的数据数量求和,若求和结果大于或等于K,则判断增加所述第二匿名特征数据后的所述目标等价类满足K匿名条件。3.根据权利要求2所述的方法,其特征在于,所述将属于所述目标等价类的所述第二匿名特征数据对应的数据数量进行累加,包括:将第一预设时间内接收到的属于所述目标等价类的所述第二匿名特征数据对应的数据数量累加。4.根据权利要求1所述的方法,其特征在于,在接收所述第二端发送的所述第二匿名特征数据之后,所述方法还包括:若确定所述第二匿名特征数据不属于所述匿名数据库中已有的等价类,则将所述第二匿名特征数据记录为待归类匿名特征数据;若在第二预设时间内累积的待归类匿名特征数据满足归类条件,则根据所述第二预设时间内累积的待归类匿名特征数据在所述匿名数据库中增加新的等价类。5.根据权利要求1所述的方法,其特征在于,在将构建匿名数据库所使用的特征匿名化信息发送至第二端之前,所述方法还包括:对第一待处理数据中的第一特征数据构造层级泛化信息;所述第一待处理数据包括第一敏感数据和所述第一敏感数据对应的所述第一特征数据;基于所述层级泛化信息对所述第一特征数据进行匿名化处理,得到第一匿名特征数据,使得以所述第一匿名特征数据为准标识符,对所述第一待处理数据划分的等价类满足K
S
匿名条件;K
S
为[2,K]内的正整数;将在所述匿名化处理中所使用的所述层级泛化信息中的目标层级的泛化信息记录为所述特征匿名化信息;对所述第一敏感数据进行隐私化处理;结合所述第一匿名特征数据和经过隐私化处理的所述第一敏感数据,以构建所述匿名
数据库。6.根据权利要求5所述的方法,其特征在于,所述基于所述层级泛化信息对所述第一特征数据进行匿名化处理,得到第一匿名特征数据,使得以所述第一匿名特征数据为准标识符,对所述第一待处理数据划分的等价类满足K
S
匿名条件,包括:使用所述层级泛化信息中的最高层级的泛化信息对所述第一特征数据进行匿名化处理,得到第一匿名特征数据;最高层级的泛化信息表示最高的泛化程度;通过以下方式对所述第一匿名特征数据进行迭代更新,直到以更新后的第一匿名特征数据为准标识符,对所述第一待处理数据划分的等价类恰好满足K
S
匿名条件:在所述第一特征数据中确定一种待降级特征,使用所述层级泛化信息中的低一层级的泛化信息对所述待降级特征重新进行匿名化处理或将所述待降级特征恢复为原始数据,以更新所述第一匿名特征数据。7.根据权利要求6所述的方法,其特征在于,所述在所述第一特征数据中确定一种待降级特征,包括:针对所述第一特征数据的每一种特征,在使用所述层级泛化信息中的低一层级的泛化信息对所述特征重新进行匿名化处理或将所述特征恢复为原始数据的情况下,获取所述特征对应的取值数量,将取值数量最小的所述特征确定为待降级特征。8.根据权利要求5所述的方法,其特征在于,在结合所述第一匿名特征数据和经过隐私化处理的所述第一敏感数据,以构建所述匿名数据库之前,所述方法还包括:将所述第一待处理数据中每个等价类的所述第一敏感数据,与全部所述第一敏感数据计算数据分布相似性;若所述第一待处理数据中存在数据分布相似性不满足相似性要求的等价类,将该等价类作为待优化等价类,通过合并所述待优化等价类与所述第一待处理数据中的其他等价类,使合并后的等价类的数据分布相似性满足所述相似性要求,并根据合并结果更新所述特征匿名化信息。9.根据权利要求8所述的方法,其特征在于,所述合并所述待优化等价类与所述第一待处理数据中的其他等价类,包括:将所述其他等价类中与所述待优化等价类的第一匿名特征数据最为相近的等价...

【专利技术属性】
技术研发人员:吴钧杰王俊孟丹宫建涛谢堉鑫
申请(专利权)人:OPPO广东移动通信有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1