【技术实现步骤摘要】
数据处理方法、装置、介质及电子设备
[0001]本申请属于计算机
,具体涉及一种数据处理方法、数据处理装置、计算机可读介质、电子设备以及计算机程序产品。
技术介绍
[0002]记录链接是在数据集中查找跨越不同数据源(例如,数据文件、书籍、网站和数据库等)引用同一实体的记录的任务。传统的记录链接的方法是基于明文对不同数据源的记录数据进行比对以判断其是否归属于相同的实体,这种链接方法存在安全性差的问题。
技术实现思路
[0003]本申请提供一种数据处理方法、数据处理装置、计算机可读介质、电子设备以及计算机程序产品,目的在于提高数据安全性。
[0004]本申请的其他特性和优点将通过下面的详细描述变得显然,或部分地通过本申请的实践而习得。
[0005]根据本申请实施例的一个方面,提供一种数据处理方法,该方法包括:
[0006]获取由第一主体持有的特征序列,所述特征序列包括对目标实体的原始特征进行拼接处理得到的衍生特征;
[0007]获取由所述第一主体持有的交集秘密分片,所述交集秘密分片对应的明文用于指示所述特征序列中的各个元素是否为所述第一主体与第二主体持有数据的交集数据;
[0008]根据所述第一主体持有的交集秘密分片预测所述目标实体是否为所述第一主体和所述第二主体共同持有特征的实体。
[0009]根据本申请实施例的一个方面,提供一种数据处理装置,该装置包括:
[0010]第一获取模块,被配置为获取由第一主体持有的特征序列,所述特征序列包括对目标 ...
【技术保护点】
【技术特征摘要】
1.一种数据处理方法,其特征在于,包括:获取由第一主体持有的特征序列,所述特征序列包括对目标实体的原始特征进行拼接处理得到的衍生特征;获取由所述第一主体持有的交集秘密分片,所述交集秘密分片对应的明文用于指示所述特征序列中的各个元素是否为所述第一主体与第二主体持有数据的交集数据;根据所述第一主体持有的交集秘密分片预测所述目标实体是否为所述第一主体和所述第二主体共同持有特征的实体。2.根据权利要求1所述的数据处理方法,其特征在于,根据所述第一主体持有的交集秘密分片预测所述目标实体是否为所述第一主体和所述第二主体共同持有特征的实体,包括:获取根据明文数据训练得到的预测模型,所述预测模型用于预测所述明文数据是否为交集数据与所述明文数据是否归属于相同实体之间的映射关系;根据所述预测模型对所述第一主体持有的交集秘密分片进行映射处理,得到所述第一主体持有的实体秘密分片,所述实体秘密分片对应的明文用于指示所述目标实体是否为所述第一主体和所述第二主体共同持有特征的实体;根据所述第一主体持有的实体秘密分片确定所述目标实体是否为所述第一主体和所述第二主体共同持有特征的实体。3.根据权利要求2所述的数据处理方法,其特征在于,根据所述第一主体持有的实体秘密分片确定所述目标实体是否为所述第一主体和所述第二主体共同持有特征的实体,包括:分别从所述第一主体持有的实体秘密分片和所述第二主体持有的实体秘密分片中提取最高有效位;将两个所述最高有效位进行异或运算,得到所述实体秘密分片对应的符号位明文;根据所述符号位明文与零值的比较结果确定所述目标实体是否为所述第一主体和所述第二主体共同持有特征的实体。4.根据权利要求2所述的数据处理方法,其特征在于,在根据所述预测模型对所述第一主体持有的交集秘密分片进行映射处理之前,所述方法还包括:将所述第一主体持有的交集秘密分片由布尔分片转换为算数分片。5.根据权利要求2所述的数据处理方法,其特征在于,根据所述预测模型对所述第一主体持有的交集秘密分片进行映射处理,得到所述第一主体持有的实体秘密分片,包括:从所述预测模型中获取用于对输入数据做乘法运算的映射参数;将所述映射参数转换为用于表示所述输入数据的不同特征状态的状态权重,所述状态权重包括用于表示所述输入数据是交集数据的交集权重和用于表示所述输入数据不是交集数据的非交集权重;根据所述状态权重对所述第一主体持有的交集秘密分片进行加权运算,得到所述第一主体持有的实体秘密分片。6.根据权利要求5所述的数据处理方法,其特征在于,所述状态权重还包括用于表示所述输入数据为缺省值的缺省值权重;根据所述状态权重对所述第一主体持有的交集秘密分片进行加权运算,得到所述第一主体持有的实体秘密分片,包括:
根据所述交集权重和所述非交集权重对所述第一主体持有的交集秘密分片进行加权运算得到加权结果;根据所述交集权重和所述缺省值权重对所述加权结果进行修正,得到所述第一主体持有的实体秘密分片。7.根据权利要求1所述的数据处理方法,其特征在于,获取由第一主体持有的特征序列,包括:获取由第一主体持有的目标实体的多个原始特征;对至少两个所述原始特征进行拼接处理,得到所述目标实体的衍生特征;获取包括所述衍生特征的特征序列。8.根据权利要求7所述的数据处理方法,其特征在于,将至少两个所述原始特征进行拼接处理,得到所述目标实体的衍生特征,包括:对所述目标实体的多个原始特征进行分类处理,得到能够唯一标识所述目标实体的唯一标识特征,以及不能够唯一标识所述目标实体的非唯一标识特征;对至少两个所述非唯一标识特征进行拼接处理,得到所述目标实体的衍生特征。9.根据权利要求8所述的数据处理方法,其特征在于,获取包括所述衍生特征的特征序列,包括:将所述唯一标识特征和所述衍生特征组成所述目标实体的特征序列。10.根据权利要求1至9中任...
【专利技术属性】
技术研发人员:黄晨宇,蒋杰,刘煜宏,陈鹏,张凡,程勇,
申请(专利权)人:腾讯科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。