基于隐私保护的数据处理方法、装置和服务器制造方法及图纸

技术编号:27936198 阅读:36 留言:0更新日期:2021-04-02 14:16
本说明书提供了基于隐私保护的数据处理方法、装置和服务器。第一服务器根据第二服务器发送的第一标签列,确定出特征数据所对应的数据标签的密文数据;再根据数据值排列特征数据,得到第一特征列;基于第一特征列,将特征数据划分为多个第一数据组,并统计出第一数据组的数据标签的密文和;第二服务器获取上述数据,并通过解密得到第一数据组的数据标签的明文和;再根据预设的卡方分组规则,对第一数据组进行进一步合并,得到合并后的第二数据组的数据标签的明文和,以及合并参数;第一服务器获取并根据上述数据计算出特征数据的信息值。从而可以在保护双方数据隐私的前提下,通过合作完成符合要求的数据分箱,并确定出特征数据的信息值。

【技术实现步骤摘要】
基于隐私保护的数据处理方法、装置和服务器
本说明书属于互联网
,尤其涉及基于隐私保护的数据处理方法、装置和服务器。
技术介绍
在许多数据处理场景中,常常会出现一个数据方(例如,第一数据方)持有与一组标识信息对应的特征数据,而另一个数据方(例如,第二数据方)持有与同一组标识信息对应的数据标签的情况。有时第二数据方需要与第一数据方合作进行下述数据处理:先合作对第一数据方所持有的特征数据进行指定要求的数据分箱,再合作基于分箱后的特征数据计算出特征数据的信息值。并且,还要求在上述数据处理过程中保护双方的数据隐私,避免向对方泄露己方所持有的数据。目前,亟需一种能够在保护双方数据隐私的前提下,使得不同的数据方可以通过合作完成符合要求的数据分箱,并基于分箱后的数据确定出特征数据的信息值的方法。
技术实现思路
本说明书提供了一种基于隐私保护的数据处理方法、装置和服务器,以在保护数据隐私的前提下,使得第一服务器和第二服务可以通过合作,完成符合要求的数据分箱,并基于分箱后的数据准确地确定出特征数据的信息值。r>本说明书提供的一本文档来自技高网...

【技术保护点】
1.一种基于隐私保护的数据处理方法,应用于第一服务器,包括:/n接收第二服务器发送的第一标签列,并根据所述第一标签列确定出特征数据所对应的数据标签的密文数据;其中,所述第一标签列包含有与标识信息对应的数据标签的密文数据,所述特征数据包括与标识信息对应的特征数据;/n根据特征数据的数据值,排列特征数据,以得到第一特征列;/n根据所述第一特征列,将所述特征数据划分为按顺序排列的多个第一数据组;并根据特征数据所对应的数据标签的密文数据,统计出各个第一数据组的数据标签的密文和;/n向所述第二服务器提供各个第一数据组的数据标签的密文和、各个第一数据组所包含的特征数据的数量,以及第一数据组的排列顺序;其中...

【技术特征摘要】
1.一种基于隐私保护的数据处理方法,应用于第一服务器,包括:
接收第二服务器发送的第一标签列,并根据所述第一标签列确定出特征数据所对应的数据标签的密文数据;其中,所述第一标签列包含有与标识信息对应的数据标签的密文数据,所述特征数据包括与标识信息对应的特征数据;
根据特征数据的数据值,排列特征数据,以得到第一特征列;
根据所述第一特征列,将所述特征数据划分为按顺序排列的多个第一数据组;并根据特征数据所对应的数据标签的密文数据,统计出各个第一数据组的数据标签的密文和;
向所述第二服务器提供各个第一数据组的数据标签的密文和、各个第一数据组所包含的特征数据的数量,以及第一数据组的排列顺序;其中,所述第二服务器解密得到各个数据组的数据标签的明文和;所述第二服务器根据预设的卡方分组规则,利用第一数据组的排列顺序、各个第一数据组的数据标签的明文和、各个第一数据组所包含的特征数据的数量,对第一数据组进行多次合并,得到多个第二数据组的数据标签的明文和,并记录合并参数;
接收第二服务器发送的多个第二数据组的数据标签的明文和,以及合并参数;并根据所述多个第二数据组的数据标签的明文和、合并参数,以及多个第一数据组,确定出特征数据的信息值。


2.根据权利要求1所述的方法,根据所述第一标签列确定出特征数据所对应的数据标签的密文数据,包括:
根据基于标识信息的排列顺序排列特征数据,得到初始特征列;
根据所述初始特征列和所述第一标签列,确定出特征数据所对应的数据标签的密文数据。


3.根据权利要求1所述的方法,根据所述第一特征列,将所述特征数据划分为按顺序排列的多个第一数据组,包括:
根据参考数量和特征数据的数据值,从位于第一特征列的起始位置处的特征数据出发,沿所述第一特征列中特征数据的排列方向,遍历第一特征列中的特征数据的数据值,以将第一特征列中的特征数据划分为按顺序排列的多个第一数据组;其中,不同的第一数据组之间所包含的特征数据的数量的差值小于预设的数量阈值。


4.根据权利要求1所述的方法,在向所述第二服务器提供各个第一数据组的数据标签的密文和、各个第一数据组所包含的特征数据的数量,以及第一数据组的排列顺序之前,所述方法还包括:
对各个第一数据组的数据标签的密文和分别进行随机化操作,得到各个第一数据组的数据标签的随机化操作后的密文和。


5.根据权利要求1所述的方法,所述合并参数至少包括被合并为第二数据组的第一数据组的数据组标识。


6.根据权利要求5所述的方法,根据所述多个第二数据组的数据标签的明文和、合并参数,以及多个第一数据组,确定出特征数据的信息值,包括:
根据合并参数确定出被合并为第二数据组的第一数据组的数据组标识;
根据所述被合并为第二数据组的第一数据组的数据组标识,和所述多个第一数据组,确定出第二数据组所包含的特征数据;
根据所述第二数据组所包含的特征数据,以及第二数据组的数据标签的明文和,确定出特征数据的信息值。


7.一种基于隐私保护的数据处理方法,应用于第二服务器,包括:
将第一标签列发送至第一服务器;其中,所述第一标签列包含有与标识信息对应的数据标签的密文数据;所述第一服务器根据第一标签列确定出特征数据所对应的数据标签的密文数据;所述第一服务器还将多个特征数据划分为多个第一数据组,统计得到各个第一数据组的数据标签的密文和;
获取来自第一服务器的各个第一数据组的数据标签的密文和、各个第一数据组所包含的特征数据的数量,以及第一数据组的排列顺序;
对所述各个第一数据组的数据标签的密文和进行解密,得到各个第一数据组的数据标签的明文和;并根据第一数据组的排列顺序排列第一数据组,得到排序后的多个第一数据组;
根据预设的卡方分组规则,利用各个第一数据组的数据标签的明文和、各个第一数据组所包含的特征数据的数量,对所述排序后的多个第一数据组进行多次合并,得到多个第二数据组的数据标签的明文和,并记录合并参数;
将所述多个第二数据组的数据标签的明文和,以及合并参数发送至第一服务器;其中,第一服务器根据所述多个第二数据组的数据标签的明文和、合并参数,以及多个第一数据组,确定出特征数据的信息值。


8.根据权利要求7所述的方法,在将第一标签列发送至第一服务器之前,所述方法还包括:
生成基于同态加密算法的公钥和私钥;
根据基于标识信息的排列顺序排列数据标签,得到初始标签列;
利用公钥加密所述初始标签列中的数据标签,得到第一标签列。


9.根据权利要求8所述的方法,在得到第一标签列之后,所述方法还包括:
将所述第一标签列和公钥发送至第一服务器;其中,所述第一服务器利用所述公钥对各个第一数据组的数据标签的密文和进行随机化操作。


10.根据权利要求7所述的方法,根据预设的卡方分组规则,利用各个第一数据组的数据标签的明文和、各个第一数据组所包含的特征数据的数量,对所述排序后的多个第一数据组进行多次合并,包括:
按照以下方式进行当前次合并:
获取上一次合并后的多个数据组,并计算出上一次合并后的多个数据组中相邻的两个数据组之间的卡方值,得到多个卡方值;
从多个卡方值中筛选出数值最小的卡方值,作为当前次的目标卡方值;
检测当前次合并是否满足预设的合并条件;
在确定当前次合并满足预设的合并条件的情况下,将当前次的目标卡方值所对应的相邻的两个数据组合并为一个数据组;并记录下被合并的数据组的数据组标识,作为当前次的合并参数。


11.根据权利要求10所述的方法,检测当前次合并是否满足预设的合并条件,包括:
确定预设的卡方值阈值,以及预设的数据组数阈值;
统计上一次合并后的多个数据组数量,作为当前次的参考数据组数;
比较所述预设的卡方值阈值和所述当前次的目标卡方值,得到第一比较结果;比较所述预设的数据组数阈值和当前次的参考数据组数,得到第二比较结果;
根据所述第一比较结果和所述第二比较结果,确定当前次合并是否满足预设的合并条件。


12.根据权利要求10所述的方法,在检测当前次合并是否满足预设的合并条件之后,所述方法还包括:
在确定当前次合并不满足预设的合并条件的情况下,停止当前次合并;并将上一次合并后的多个数据组确定为多个第二数据组。


13.根据权利要求7所述的方法,获取来自第一服务器的各个第一数据组的数据标签的密文和、各个第一数据组所包含的特征数据的数量,以及第一数据组的排列顺序,包括:
生成并向第一服务器发起第一询问请求;其中,所述第一询问请求用于根据预设的通信规则在向第二服务器返回第一服务器针对所述第一询问请求的确认信息的同时,还...

【专利技术属性】
技术研发人员:周亚顺李漓春尹栋
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1