一种数据处理方法、装置及通信设备制造方法及图纸

技术编号:37149597 阅读:18 留言:0更新日期:2023-04-06 22:04
本发明专利技术提供一种数据处理方法、装置及通信设备,涉及数据安全领域。该方法包括:将结构化数据匿名化,达到k匿名要求,形成多个等价类,根据水印分片数选择待插入水印分片的目标等价类;基于目标等价类中的数据的k组元组的属性值以及待插入水印分片的值,生成目标等价类的伪行数据;将N个水印分片分别插入目标等价类对应的伪行数据中。本发明专利技术的方案解决了已有匿名结构化数据水印鲁棒性较差,且需建立索引表以恢复水印信息的问题。表以恢复水印信息的问题。表以恢复水印信息的问题。

【技术实现步骤摘要】
一种数据处理方法、装置及通信设备


[0001]本专利技术涉及数据安全领域,特别是指一种数据处理方法、装置及通信设备。

技术介绍

[0002]数字水印是进行版权保护的一种技术手段,针对图片、视频、音频等类型的数据,已经有了很成熟的水印方案,而针对结构化数据的水印方案相对较少。随着数据成为企业的一种资产,为了更好的发挥数据价值,避免出现数据孤岛问题,结构化数据在企业内、外部共享的场景越来越多。。为保护敏感信息,数据发布方的企业团体在对外发布数据时,往往会先对数据进行匿名化处理获得匿名数据,然后对匿名数据进行发布。但由于数据分析技术的进步,从匿名化数据中也可以关联提取出很多有价值的信息,匿名化数据也日渐面临版权保护和泄露溯源的需求。此外,由于匿名化数据不存在唯一主键或能唯一标识元组的属性值,因此目前的数据水印算法难以适用于匿名化数据。

技术实现思路

[0003]本专利技术的目的是提供一种数据处理方法及装置,以解决目前数据水印算法难以适用于匿名化数据的问题。
[0004]为达到上述目的,本专利技术的实施例提供一种数据处理方法,应用于数据发布方,包括:
[0005]对结构化数据进行匿名化处理,达到k匿名要求,形成多组等价类,其中,属于同一等价类的数据的k组元组的属性值的准标识符相同,k为正整数;
[0006]在等价类中选择待插入水印分片的目标等价类;
[0007]基于目标等价类中的k组元组的属性值以及待插入水印分片的值,生成目标等价类的伪行数据,伪行数据的准标识符与对应目标等价类的k组元组的准标识符相同;
[0008]将N个水印分片分别插入目标等价类对应的伪行数据中,N个水印分片由水印信息分割生成,N为正整数。
[0009]可选地,在所述等价类中选择待插入水印分片的目标等价类的步骤,包括:
[0010]根据所述每组等价类对应的准标识符,生成每组等价类各自的等价类标识;
[0011]基于所述等价类标识,在所述等价类中选择待插入水印分片的目标等价类。
[0012]可选地,根据所述等价类对应的准标识符,生成每组等价类各自的等价类标识的步骤,包括:
[0013]将所述等价类的准标识符中未匿名的数值型数据进行拼接,得到q,;
[0014]将所述q与私钥key进行拼接,将拼接结果作为哈希变换或伪随机函数变换的输入,生成对应等价类的主键p;
[0015]将每组等价类的主键p作为各自的等价类标识。
[0016]可选地,根据所述等价类对应的准标识符,生成每组等价类各自的等价类标识的步骤,包括:
[0017]针对所述每组等价类,将等价类对应的各个准标识符进行拼接并映射为数据值型数据后,得到q;
[0018]将所述q与对应等价类的私钥key进行拼接,将拼接结果作为哈希变换或伪随机函数变换的输入,生成对应等价类的主键p;
[0019]将每组等价类的主键p作为各自的等价类标识。
[0020]可选地,基于所述等价类标识,在所述等价类中选择待插入水印分片的目标等价类的步骤,包括:
[0021]在所述等价类中选择等价类标识最大的M组等价类作为待插入水印分片的目标等价类,M为N的整数倍;
[0022]或者,
[0023]将第i片水印分片插入第一等价类中,所述第一等价类为等价类标识与对应等价类的私钥key的拼接对N取模的值为i的等价类。
[0024]可选地,所述的数据处理方法还包括:
[0025]对所述水印信息进行编码,生成所述水印信息的数字序列;
[0026]根据门限秘密分享算法,将所述数字序列分割为N个水印分片。
[0027]可选地,所述伪行数据的作为水印标记的属性值是基于所述目标等价类中k个元组的该属性的值以及待插入水印分片的值确定的。
[0028]为达到上述目的,本专利技术的实施例提供一种数据处理方法,应用于数据接收方,包括:
[0029]获取多组等价类中每组等价类的等价类标识,其中,属于同一等价类的数据的k组元组的属性值的准标识符相同,k为正整数;
[0030]根据等价类标识,在等价类中确定插入了水印分片的目标等价类;
[0031]在目标等价类中提取对应水印分片;
[0032]将提取出的水印分片进行重组,得到水印信息。
[0033]可选地,获取至少一组等价类中每组等价类的等价类标识的步骤,包括:
[0034]将所述等价类的准标识符中未匿名化处理的数值型数据进行拼接,得到q;
[0035]将所述q与私钥key进行拼接,将拼接结果作为哈希变换或伪随机函数变换的输入,生成对应等价类的主键p;
[0036]将每组等价类的主键p作为各自的等价类标识。
[0037]可选地,获取至少一组等价类中每组等价类的等价类标识的步骤,包括:
[0038]针对每组等价类,将所述等价类对应的各准标识符进行拼接,并映射为数值型数据,得到q;
[0039]将所述q与对应等价类的私钥key进行拼接,将拼接结果作为哈希变换或伪随机函数变换的输入,生成对应等价类的主键p;
[0040]将每组等价类的主键p作为各自的等价类标识。
[0041]可选地,根据所述等价类标识,在所述至少一组等价类中确定插入了水印分片的目标等价类的步骤,包括:
[0042]在等价类中选择等价类标识最大的M组等价类作为待插入水印分片的目标等价类,M为N的整数倍;
[0043]或者,
[0044]将第i片水印分片插入第一等价类中,所述第一等价类为等价类标识与对应等价类的私钥key的拼接对N取模的值为i的等价类。
[0045]可选地,在所述目标等价类中提取对应水印分片的步骤,包括:
[0046]根据每组目标等价类中k组元组的属性值,确定对应的水印分片。
[0047]可选地,将提取出的水印分片进行重组,得到水印信息的步骤,包括:
[0048]将提取出水印分片中的t个目标水印分片进行重组,得到水印信息,其中,目标水印分片为从至少两组目标等价类中提取出的相同的水印分片,t为门限秘密分享算法对应的门限值。
[0049]可选地,将提取出的水印分片进行重组,得到水印信息的步骤,包括:
[0050]将提取出水印分片中满足第二预设条件的目标水印分片进行重组,得到水印信息,所述第二预设条件为:等价类标识与对应等价类的私钥key的拼接对N取模的值相同次数最多。
[0051]为达到上述目的,本专利技术的实施例提供一种数据处理装置,应用于数据发布方,包括:
[0052]划分模块,对结构化数据进行匿名化处理,达到k匿名要求,形成多组等价类,其中,属于同一等价类的k组元组的属性值的准标识符相同,k为正整数;
[0053]第一选择模块,用于在等价类中选择待插入水印分片的目标等价类;
[0054]第一生成模块,用于基于目标等价类中的k组元组属性值以及待插入水印分片的值,生成目标等价类的伪行本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据处理方法,应用于数据发布方,其特征在于,包括:对结构化数据进行匿名化处理,达到k匿名要求,形成多组等价类,其中,属于同一等价类的k组元组的属性值的准标识符相同,k为正整数;在所述等价类中选择待插入水印分片的目标等价类;基于所述目标等价类中的k组元组的属性值以及待插入水印分片的值,生成所述目标等价类的伪行数据,所述伪行数据的准标识符与对应目标等价类的k组元组的属性值的准标识符相同;将N个水印分片分别插入所述目标等价类对应的伪行数据中,所述N个水印分片由水印信息分割生成,N为正整数。2.根据权利要求1所述的数据处理方法,其特征在于,在所述等价类中选择待插入水印分片的目标等价类的步骤,包括:根据所述等价类中每组等价类对应的准标识符,生成每组等价类各自的等价类标识;基于所述等价类标识,在所述等价类中选择待插入水印分片的目标等价类。3.根据权利要求2所述的数据处理方法,其特征在于,根据所述等价类中每组等价类对应的准标识符,生成每组等价类各自的等价类标识的步骤,包括:将所述等价类的准标识符中未匿名化处理的数值型数据进行拼接,得到q;将所述q与私钥key进行拼接,将拼接结果作为哈希变换或伪随机函数变换的输入,生成对应等价类的主键p;将每组等价类的主键p作为各自的等价类标识。4.根据权利要求2所述的数据处理方法,其特征在于,根据所述等价类中每组等价类对应的准标识符,生成每组等价类各自的等价类标识的步骤,包括:针对每组等价类,将所述等价类对应的各准标识符进行拼接,并映射为数值型数据,得到q;将所述q与私钥key进行拼接,将拼接结果作为哈希变换或伪随机函数变换的输入,生成对应等价类的主键p;将每组等价类的主键p作为各自的等价类标识。5.根据权利要求2至4任一项所述的数据处理方法,其特征在于,基于所述等价类标识,在所述等价类中选择待插入水印分片的目标等价类的步骤,包括:在所述等价类中选择等价类标识最大的M组等价类作为待插入水印分片的目标等价类,M为N的整数倍;或者,将第i片水印分片插入第一等价类中,所述第一等价类为等价类标识与对应等价类的私钥key的拼接对N取模的值为i的等价类。6.根据权利要求1至4任一项所述的数据处理方法,其特征在于,还包括:对所述水印信息进行编码,生成所述水印信息的数字序列;根据门限秘密分享算法,将所述数字序列分割为N个水印分片。7.根据权利要求1至4任一项所述的数据处理方法,其特征在于,所述伪行数据的作为水印标记的属性值是基于所述目标等价类中k组元组的属性值以及待插入水印分片的值确定的。
8.一种数据处理方法,应用于数据接收方,其特征在于,包括:获取多组等价类中每组等价类的等价类标识,其中,属于同一等价类的k组元组的属性值的准标识符相同,k为正整数;根据所述等价类标识,在所述等价类中确定插入了水印分片的目标等价类;在所述目标等价类中提取对应水印分片;将提取出的水印分片进行重组,得到水印信息。9.根据权利要求8所述的数据处理方法,其特征在于,获取多组等价类中每组等价类的等价类标识的步骤,包括:将所述等价类的准标识符中未匿名化处理的数值型数据进行拼接,得到q;将所述q与私钥key进行拼接,将拼接结果作为哈希变换或伪随机函数变换的输入,生成对应等价类的主键p;将每组等价类的主键p作为各自的等价类标识。10.根据权利要...

【专利技术属性】
技术研发人员:陆黎耿慧拯叶剑飞刘阳张天林宗明刘炯
申请(专利权)人:中国移动通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1