【技术实现步骤摘要】
数据匿名处理方法及装置、数据推送方法及装置
[0001]本申请涉及数据安全
,具体涉及一种数据匿名处理方法及装置
、
数据推送方法及装置
。
技术介绍
[0002]随着大数据等的研究和应用需求的不断增长,如何对数据进行有效的隐私保护
、
不向外界暴露数据内个体敏感信息成为了众多研究关注的问题
。
例如在信息搜索查询
、
广告投放等服务中,终端设备会向云端提交相关的服务申请,将自身的信息发送给云端,然后云端根据终端设备发送的信息获取相应的数据再返回给终端设备
。
然而,在这个过程中如果终端设备不经处理地将自身的信息发送给云端,云端很可能会根据接收到的信息推测得到终端设备的个体敏感信息,造成端侧隐私泄露危险
。
[0003]因此,如何对数据进行有效的隐私保护,以保证数据安全性,成了亟需解决的技术问题
。
技术实现思路
[0004]本申请实施例公开了一种数据匿名处理方法及装置
、
数据推送方法及装置
、
电子设备
、
存储介质,能够对终端数据进行有效的隐私保护,提高了数据安全性,且可以在保证终端数据不被服务器精确获取的情况下,完成服务器的数据推送服务
。
[0005]本申请实施例公开了一种数据匿名处理方法,应用于终端设备,所述方法包括:
[0006]获取第一请求信息,所述第一请求信息包括一个或多个目标标签,每个所述目标标 ...
【技术保护点】
【技术特征摘要】
1.
一种数据匿名处理方法,其特征在于,应用于终端设备,所述方法包括:获取第一请求信息,所述第一请求信息包括一个或多个目标标签,每个所述目标标签对应一条终端数据,所述目标标签为对终端数据进行第一匿名处理得到;根据所述一个或多个目标标签,对所述第一请求信息进行第二匿名处理,得到一个或多个第二请求信息,每个所述第二请求信息包括一个或多个混淆标签,所述一个或多个混淆标签与所述一个或多个目标标签一一对应;将所述第一请求信息及所述一个或多个第二请求信息上传至服务器,以使所述服务器确定各个请求信息对应的推送数据;接收所述服务器反馈的所述各个请求信息对应的推送数据,并从所述各个请求信息对应的推送数据中,确定与所述第一请求信息对应的推送数据
。2.
根据权利要求1所述的方法,其特征在于,对终端数据进行第一匿名处理,得到目标标签,包括:分别计算第一终端数据与多个集群的质心之间的距离;所述第一终端数据为任一终端数据;所述多个集群的质心为服务器发送给所述终端设备,所述多个集群为所述服务器根据存储的多个第一样本终端数据进行匿名划分确定的;根据所述第一终端数据与所述多个集群的质心之间的距离,确定所述第一终端数据对应的目标标签
。3.
根据权利要求2所述的方法,其特征在于,所述根据所述第一终端数据与所述多个集群的质心之间的距离,确定所述第一终端数据对应的目标标签,包括:根据所述第一终端数据与所述多个集群的质心之间的距离,生成输入向量;将所述输入向量输入到分类模型中,通过所述分类模型根据所述输入向量对所述第一终端数据进行分类,以得到所述第一终端数据对应的目标标签;其中,所述分类模型为所述服务器根据存储的多个第二样本终端数据及各个所述第二样本终端数据标注的分类标签进行训练得到
。4.
根据权利要求3所述的方法,其特征在于,所述通过所述分类模型根据所述输入向量对所述第一终端数据进行分类,以得到所述第一终端数据对应的目标标签,包括:通过所述分类模型根据所述输入向量对所述第一终端数据进行分类,以得到多个类别分别对应的置信度;若所述多个类别分别对应的置信度中的最大置信度大于置信度阈值,则将所述最大置信度对应类别的分类标签确定为所述第一终端数据对应的目标标签;若所述多个类别分别对应的置信度中的最大置信度不大于所述置信度阈值,则确定质心与所述第一终端数据的距离最小的目标集群,并将所述目标集群的集群标识确定为所述第一终端数据对应的目标标签
。5.
根据权利要求1所述的方法,其特征在于,所述根据所述一个或多个目标标签,对所述第一请求信息进行第二匿名处理,得到一个或多个第二请求信息,包括:根据所述第一请求信息包括的目标标签的标签数量,从混淆池中随机选择一组或多组与所述标签数量匹配的混淆标签,以得到一个或多个第二请求信息;每个所述第二请求信息对应一组与所述标签数量匹配的混淆标签
。6.
根据权利要求5所述的方法,其特征在于,从混淆池中随机选择一组或多组与所述标
签数量匹配的混淆标签,包括:按照第一随机概率及第二随机概率,从所述混淆池包含的与第一目标标签对应的相似标签中或者从所述混淆池包含的所有标签中随机选择所述第一目标标签对应的第一混淆标签;所述第一目标标签为任一所述目标标签,所述第一混淆标签为任一组与所述标签数量匹配的混淆标签中,与所述第一目标标签对应的混淆标签;其中,所述第一随机概率与所述相似标签具备对应关系,所述第二随机概率与所述混淆池包含的所有标签具备对应关系;所述第一随机概率与所述第二随机概率的和为
1。7.
根据权利要求5所述的方法,其特征在于,所述方法还包括:接收所述服务器按照目标时间周期发送的混淆池更新信息;所述混淆池更新信息包括最新的混淆池包含的所有标签,或者,包括最新的混淆池增加和
/
或减少的标签;根据所述混淆池更新信息对存储的混淆池进行更新
。8.
根据权利要求1~7任一项所述的方法,其特征在于,所述将所述第一请求信息及所述一个或多个第二请求信息上传至服务器,包括:将所述第一请求信息及所述一个或多个第二请求信息的排列顺序打乱;将排列顺序打乱后的所述第一请求信息及所述一个或多个第二请求信息上传至服务器
。9.
一种数据推送方法,其特征在于,应用于服务器,所述方法包括:接收终端设备发送的多个请求信息;所述多个请求信息包括第一请求信息及一个或多个第二请求信息,其中,所述第一请求信息包括一个或多个目标标签,每个所述目标标签对应所述终端设备中的一条终端数据,所述目标标签为所述终端设备对终端数据进行第一匿名处理得到,所述第二请求信息为所...
【专利技术属性】
技术研发人员:吴钧杰,孟丹,王俊,齐越,易兰军,徐杰,
申请(专利权)人:深圳市与飞科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。