数据处理方法、装置和电子设备制造方法及图纸

技术编号:22565411 阅读:23 留言:0更新日期:2019-11-16 12:09
本说明书实施例提供一种数据处理方法、装置和电子设备。所述方法包括:基于加密决策森林,获取与业务数据相匹配的目标叶子节点;所述加密决策森林包括至少一个决策树,所述决策树的分裂节点对应有分裂条件的明文数据,所述决策树的叶子节点对应有叶子值的密文数据,所述密文数据由同态加密算法对叶子值进行加密得到;向第一设备发送所述目标叶子节点对应的密文数据。

Data processing methods, devices and electronic equipment

The embodiment of the specification provides a data processing method, device and electronic device. The method comprises the following steps: obtaining target leaf node matching with business data based on encrypted decision forest; the encrypted decision forest comprises at least one decision tree, the split node of the decision tree corresponds to plaintext data with split conditions, the leaf node of the decision tree corresponds to ciphertext data with leaf values, and the ciphertext data is processed by homomorphic encryption algorithm for leaf values Encrypted; sending ciphertext data corresponding to the target leaf node to the first device.

【技术实现步骤摘要】
数据处理方法、装置和电子设备
本说明书实施例涉及计算机
,特别涉及一种数据处理方法、装置和电子设备。
技术介绍
在业务实际中,通常一方拥有需要保密的模型(以下称为模型方),另一方拥有需要保密的业务数据(以下称为数据方)。如何在所述模型方不泄漏所述模型、且所述数据方不泄漏所述业务数据的条件下,使得模型方获得基于所述模型对所述业务数据进行预测后的预测结果,是当前亟需解决的技术问题。
技术实现思路
本说明书实施例的目的是提供一种数据处理方法、装置和电子设备,以便于在第一设备不泄漏原始决策森林、且第二设备不泄漏业务数据的条件下,第一设备获得基于所述原始决策森林对所述业务数据进行预测后的预测结果。为实现上述目的,本说明书中一个或多个实施例提供的技术方案如下。根据本说明书一个或多个实施例的第一方面,提供了一种数据处理方法,应用于第一设备,包括:保持原始决策森林中决策树的分裂节点所对应的分裂条件不变,使用同态加密算法对原始决策森林中决策树的叶子节点所对应的叶子值进行加密,得到加密决策森林;向第二设备发送所述加密决策森林。根据本说明书一个或多个实施例的第二方面,提供了一种数据处理装置,应用于第一设备,包括:加密单元,用于保持原始决策森林中决策树的分裂节点所对应的分裂条件不变,使用同态加密算法对原始决策森林中决策树的叶子节点所对应的叶子值进行加密,得到加密决策森林;发送单元,用于向第二设备发送所述加密决策森林。根据本说明书一个或多个实施例的第三方面,提供了一种电子设备,包括:存储器,用于存储计算机指令;处理器,用于执行所述计算机指令以实现如第一方面所述的方法步骤。根据本说明书一个或多个实施例的第四方面,提供了一种数据处理方法,应用于第二设备,包括:基于加密决策森林,获取与业务数据相匹配的目标叶子节点;所述加密决策森林包括至少一个决策树,所述决策树的分裂节点对应有分裂条件的明文数据,所述决策树的叶子节点对应有叶子值的密文数据,所述密文数据由同态加密算法对叶子值进行加密得到;向第一设备发送所述目标叶子节点对应的密文数据。根据本说明书一个或多个实施例的第五方面,提供了一种数据处理装置,应用于第二设备,包括:获取单元,用于基于加密决策森林,获取与业务数据相匹配的目标叶子节点;所述加密决策森林包括至少一个决策树,所述决策树的分裂节点对应有分裂条件的明文数据,所述决策树的叶子节点对应有叶子值的密文数据,所述密文数据由同态加密算法对叶子值进行加密得到;发送单元,用于向第一设备发送所述目标叶子节点对应的密文数据。根据本说明书一个或多个实施例的第六方面,提供了一种电子设备,包括:存储器,用于存储计算机指令;处理器,用于执行所述计算机指令以实现如第四方面所述的方法步骤。由以上本说明书实施例提供的技术方案可见,本说明书实施例中,通过加密决策森林,第二设备可以获取与业务数据相匹配的目标叶子节点;进而通过所述目标叶子节点,获得基于决策森林对业务数据进行预测后的预测结果,或者,获得基于决策森林对业务数据进行预测后的预测结果和预设阈值之间的比较结果。由于使用了加密决策森林,因此在上述过程中,所述第一设备无需泄漏自身拥有的原始决策森林,第二设备无需泄漏自身拥有的业务数据。附图说明为了更清楚地说明本说明书实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本说明书中记载的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本说明书实施例一种决策树的结构示意图;图2为本说明书实施例一种数据处理方法的流程图;图3为本说明书实施例一种满二叉树的结构示意图;图4为本说明书实施例一种数据处理方法的流程图;图5为本说明书实施例一种数据处理方法的示意图;图6为本说明书实施例一种数据处理方法的流程图;图7为本说明书实施例一种数据处理装置的功能结构示意图;图8为本说明书实施例一种数据处理装置的功能结构示意图;图9为本说明书实施例一种数据处理装置的功能结构示意图;图10为本说明书实施例一种电子设备的功能结构示意图。具体实施方式下面将结合本说明书实施例中的附图,对本说明书实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本说明书一部分实施例,而不是全部的实施例。基于本说明书中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都应当属于本说明书保护的范围。此外,应当理解,尽管在本说明书可能采用术语第一、第二、第三等来描述各种信息,但这些信息不应限于这些术语。这些术语仅用来将同一类型的信息彼此区分开。例如,在不脱离本说明书范围的情况下,第一信息也可以被称为第二信息,类似地,第二信息也可以被称为第一信息。为了便于本领域技术人员理解本说明书实施例的技术方案,下面先对本说明书实施例的技术术语进行说明。决策树:一种有监督的机器学习模型。所述决策树可以为二叉树等。所述决策树包括了多个节点。所述多个节点能够形成多个预测路径。所述预测路径的起始节点为所述决策树的根节点,终止节点为所述决策树的叶子节点。所述决策树具体可以包括回归决策树和分类决策树。所述回归决策树的预测结果可以为一个具体的数值。所述分类决策树的预测结果可以为一个具体的类别。值得说明的是,为了便于计算,通常可以采用向量来表示类别。例如,向量[100]可以表示类别A,向量[010]可以表示类别B,向量[001]可以表示类别C。当然,此处的向量仅为示例,在实际应用中还可以采用其它的数学方式来表示类别。分裂节点:当决策树中的一个节点能够向下分裂时,可以将该节点称为分裂节点。所述分裂节点具体可以包括根节点、以及除去叶子节点和根节点以外的其它节点(以下称为普通节点)。所述分裂节点对应有分裂条件,所述分裂条件可以用于选择预测路径。叶子节点:当决策树中的一个节点不能够向下分裂时,可以将该节点称为叶子节点。所述叶子节点对应有叶子值。决策树的不同叶子节点所对应的叶子值可以相同或不同。每个叶子值可以表示一种预测结果。所述叶子值可以为数值或向量等。例如,回归决策树的叶子节点所对应的叶子值可以为数值,分类决策树的叶子节点所对应的叶子值可以为向量。满二叉树:当一个二叉树除最后一层外,每一层上的所有节点都分裂为了两个子结点时,可以将该二叉树称为满二叉树。为了便于对以上术语进行理解,以下介绍一个场景示例。请参阅图1。在本场景示例中,决策树Tree1可以包括节点1、2、3、4、5等5个节点。节点1为根节点;节点1和2分别为普通节点;节点3、4和5分别为叶子节点。节点1、节点2和节点4可以形成一个预测路径,节点1、节点2和节点5可以形成另一个预测路径,节点1和节点3可以形成另一个预测路径。节点1、节点2和节点3对应的分裂条件如下表1所示。表1...

【技术保护点】
1.一种数据处理方法,应用于第一设备,包括:/n保持原始决策森林中决策树的分裂节点所对应的分裂条件不变,使用同态加密算法对原始决策森林中决策树的叶子节点所对应的叶子值进行加密,得到加密决策森林;/n向第二设备发送所述加密决策森林。/n

【技术特征摘要】
1.一种数据处理方法,应用于第一设备,包括:
保持原始决策森林中决策树的分裂节点所对应的分裂条件不变,使用同态加密算法对原始决策森林中决策树的叶子节点所对应的叶子值进行加密,得到加密决策森林;
向第二设备发送所述加密决策森林。


2.如权利要求1所述的方法,原始决策森林中的至少一个决策树为非满二叉树;
相应地,所述方法还包括:
在非满二叉树的决策树中添加虚假的节点,以使得该决策树形成满二叉树。


3.如权利要求1所述的方法,所述方法还包括:
在原始决策森林中添加虚假的决策树。


4.一种数据处理装置,应用于第一设备,包括:
加密单元,用于保持原始决策森林中决策树的分裂节点所对应的分裂条件不变,使用同态加密算法对原始决策森林中决策树的叶子节点所对应的叶子值进行加密,得到加密决策森林;
发送单元,用于向第二设备发送所述加密决策森林。


5.一种电子设备,包括:
存储器,用于存储计算机指令;
处理器,用于执行所述计算机指令以实现如权利要求1-3中任一项所述的方法步骤。


6.一种数据处理方法,应用于第二设备,包括:
基于加密决策森林,获取与业务数据相匹配的目标叶子节点;所述加密决策森林包括至少一个决策树,所述决策树的分裂节点对应有分裂条件的明文数据,所述决策树的叶子节点对应有叶子值的密文数据,所述密文数据由同态加密算法对叶子值进行加密得到;
向第一设备发送所述目标叶子节点对应的密文数据。


7.如权利要求6所述的方法,所述方法还包括:
对所述目标叶子节点对应的密文数据与噪声数据进行求和处理,得到第一求和结果;
相应地,所述向第一设备发送所述目标叶子节点对应的密文数据,包括:
向第一设备发送所述第一求和结果。


8.如权利要求6所述的方法,所述目标叶子节点的数量为多个;所述方法还包括:
对多个目标叶子节点对应的密文数据进行求和处理,得到第二求和结果;
相应地,所述向第一设备发送所述目标叶子节点对应的密文数据,包括:
向第一设备发送所述第二求和结果。


9.如权利要求8所述的方法,所述方法还包括:
对所述第二求和结果与噪声数据进行求和处理,得到第三求和结果;
相应地,所述向第一设备发送所述第二求和结果,包括:
向第一设备发送所述第三求和结果。


10.一种数据处理装置,应用于...

【专利技术属性】
技术研发人员:李漓春张晋升王华忠
申请(专利权)人:阿里巴巴集团控股有限公司
类型:发明
国别省市:开曼群岛;KY

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1