预测缺失的用户业务属性的方法及装置制造方法及图纸

技术编号:24709336 阅读:66 留言:0更新日期:2020-07-01 00:10
本说明书实施例提供一种预测缺失的用户业务属性的方法,用于基于多个业务方在保护数据隐私的前提下共同训练的业务模型,由多个业务方中的第一方预测针对第一用户的业务数据中缺失的第一业务属性。该方法的一个实施方式包括:针对与第一用户对应的第一业务数据,基于业务模型提取其对应的各个参考特征,单个参考特征根据业务模型针对第一业务数据的业务处理结果对相应业务特征的梯度确定;将各个参考特征输入预先训练的预测模型,得到输出结果,其中,预测模型通过第一方中具有第一业务属性的多条业务数据构造的各个训练样本进行训练;根据输出结果确定第一用户的第一业务属性。该实施方式可以有效预测当前业务方部分缺失的业务属性。

【技术实现步骤摘要】
预测缺失的用户业务属性的方法及装置
本说明书一个或多个实施例涉及计算机
,尤其涉及基于隐私保护,通过计算机预测缺失的用户业务属性的方法和装置。
技术介绍
安全多方计算又称为多方安全计算,即多个业务方共同计算出一个函数的结果,而不泄露这个函数各方的输入数据,计算的结果公开给其中的一方或多方。例如,安全多方计算一个典型的应用是共同训练一个业务模型。在业务模型训练过程中,任何一个参与方无法获知其他方的训练数据,而最终的业务模型可以由各个业务方获取。通常,共同训练业务模型的多个业务方使用的业务数据具有一定的相关性。
技术实现思路
本说明书一个或多个实施例描述了一种预测缺失的用户业务属性的方法及装置,用以解决
技术介绍
提到的一个或多个问题。根据第一方面,提供了一种预测缺失的用户业务属性的方法,用于基于多个业务方在保护数据隐私的前提下共同训练的业务模型,由所述多个业务方中的第一方预测其针对第一用户的业务数据中缺失的第一业务属性,所述业务模型用于对单个用户基于业务数据提取的业务特征进行处理,得到业务处理结果,所述方法包括:针对所述第一业务数据,基于所述业务模型提取其中的各个已知业务属性分别对应的各个参考特征,单个参考特征根据所述业务模型针对所述第一业务数据的业务处理结果对相应业务特征的梯度确定;将各个参考特征输入预先训练的预测模型,得到输出结果,其中,所述预测模型通过所述第一方中具有第一业务属性的多条业务数据构造的各个训练样本进行训练;根据所述输出结果确定所述第一用户的第一业务属性。在一个实施例中,所述第一方中具有第一业务属性的多条业务数据包括第二业务数据,针对所述第二业务数据通过以下方式构造训练样本:根据所述第二业务数据中的第一业务属性,确定第一标签;针对所述第二业务数据中,第一业务属性之外的其他业务属性,提取各个样本参考特征,单个样本参考特征根据所述业务模型针对所述第二业务数据的业务处理结果对相应业务特征的梯度确定;基于各个样本参考特征和所述第一标签,确定与所述第二业务数据对应的训练样本。在一个进一步的实施例中,所述基于各个样本参考特征和所述第一标签,确定与所述第二业务数据对应的训练样本包括:在所述第一标签是对应于所述第二业务数据中的第一业务属性的标签的情况下,各个样本参考特征和所述第一标签,构造与所述第二业务数据对应的正样本;在所述第一标签不是对应于所述第二业务数据中的第一业务属性的标签的情况下,基于各个样本参考特征和所述第一标签,构造与所述第二业务数据对应的负样本。在一个实施例中,所述预测模型为逻辑回归模型或深度神经网络。在一个实施例中,所述输出结果为分别对应于所述第一业务属性的各个属性候选项的各个概率,所述根据所述输出结果确定所述第一业务数据的第一业务属性包括:根据各个概率中最大的至少一个概率对应的各个属性候选项,确定所述第一用户的第一业务属性。在一个实施例中,所述输出结果为所述第一用户的第一业务属性是第一属性候选项的第一概率,所述根据所述输出结果确定所述第一业务数据的第一业务属性包括:基于所述第一概率与预定概率阈值的对比,确定所述第一用户的第一业务属性。根据第二方面,提供了一种预测缺失的用户业务属性的装置,用于基于多个业务方在保护数据隐私的前提下共同训练的业务模型,由所述多个业务方中的第一方预测其针对第一用户的业务数据中缺失的第一业务属性,所述业务模型用于对单个用户基于业务数据提取的业务特征进行处理,得到业务处理结果;所述装置设于所述第一方,包括:提取单元,配置为针对所述第一业务数据,基于所述业务模型提取其中的各个已知业务属性分别对应的各个参考特征,单个参考特征根据所述业务模型针对所述第一业务数据的业务处理结果对相应业务特征的梯度确定;处理单元,配置为将各个参考特征输入预先训练的预测模型,得到输出结果,其中,所述预测模型通过所述第一方中具有第一业务属性的多条业务数据构造的各个训练样本进行训练;确定单元,配置为根据所述输出结果确定所述第一用户的第一业务属性。根据第三方面,提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行第一方面的方法。根据第四方面,提供了一种计算设备,包括存储器和处理器,其特征在于,所述存储器中存储有可执行代码,所述处理器执行所述可执行代码时,实现第一方面的方法。通过本说明书实施例提供的方法和装置,在预测缺失的用户业务属性的过程中,可以通过多方联合训练的业务模型,构建训练样本。其中,训练样本对应的参考特征由业务模型的业务处理结果对用于训练业务模型的业务特征的梯度来确定,由于这种梯度里面包含了丰富的业务特征与业务模型、业务特征对应的业务属性之间的关联信息,因此,可以训练有效的预测模型,来预测各条业务数据中缺失的业务属性。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其它的附图。图1示出本说明书技术构思中预测缺失的用户业务属性的实施架构示意图;图2示出根据一个实施例的预测缺失的用户业务属性的方法流程图;图3示出本说明书实施实施例可能被恶意应用的一个具体的特殊场景中训练业务模型的业务特征分布示意图;图4示出根据一个实施例的预测缺失的用户业务属性的装置的示意性框图。具体实施方式下面结合附图,对本说明书提供的方案进行描述。首先,结合图1示出一个具体实施场景进行说明。如图1所示,在该实施场景中,多个业务方分别拥有自己的业务数据,这些业务方之间可以相互进行数据通信,联合进行安全数据运算,也可以相互独立,并且都可以与安全可信计算平台进行数据交互。在本说明书中,假设各个业务方仅与安全可信计算平台进行数据交互。其中,图1示出的计算平台可以是安全可信的其它方平台,也可以是分布于各个业务方的分布式平台,在此不做限定在业务模型训练场景中,计算平台可以向各个业务方分发业务模型的当前参数值,由各个业务方利用自身业务数据(例如字符、图片、音频、视频、动画等至少一个类型的数据),确定各个模型参数的梯度,或者对各个模型参数的值进行调整,并将处理结果反馈给计算平台,计算平台可以按照各个业务方反馈的模型参数梯度,对模型参数进行调整,或者根据各个业务方反馈的模型参数调整后的值,融合得到一个调整值,作为相应模型参数的当前值。其中,在各个业务方反馈的是各个模型参数的梯度的情况下,可以对各个梯度采用加权平均、取最大值、取最小值等方式进行处理,得到一个对模型参数进行调整的综合梯度。在各个业务方反馈的是调整后的模型参数值的情况下,计算平台可以通过加权平均、回归等方式确定模型参数综合调整后的值。业务模型训练好之后,各个业务方可以通过计算平台获取训练好的业务模型。值得说明的是,图1中示出的业务方(也可以是数据方,即数据拥有方)的数量仅本文档来自技高网...

【技术保护点】
1.一种预测缺失的用户业务属性的方法,用于基于多个业务方在保护数据隐私的前提下共同训练的业务模型,由所述多个业务方中的第一方预测其针对第一用户的第一业务数据中缺失的第一业务属性,所述业务模型用于对单个用户基于业务数据提取的业务特征进行处理,得到业务处理结果;所述方法包括:/n针对所述第一业务数据,基于所述业务模型提取其中的各个已知业务属性分别对应的各个参考特征,单个参考特征根据所述业务模型针对所述第一业务数据的业务处理结果对相应业务特征的梯度确定;/n将各个参考特征输入预先训练的预测模型,得到输出结果,其中,所述预测模型通过所述第一方中具有第一业务属性的多条业务数据构造的各个训练样本进行训练;/n根据所述输出结果确定所述第一用户的第一业务属性。/n

【技术特征摘要】
1.一种预测缺失的用户业务属性的方法,用于基于多个业务方在保护数据隐私的前提下共同训练的业务模型,由所述多个业务方中的第一方预测其针对第一用户的第一业务数据中缺失的第一业务属性,所述业务模型用于对单个用户基于业务数据提取的业务特征进行处理,得到业务处理结果;所述方法包括:
针对所述第一业务数据,基于所述业务模型提取其中的各个已知业务属性分别对应的各个参考特征,单个参考特征根据所述业务模型针对所述第一业务数据的业务处理结果对相应业务特征的梯度确定;
将各个参考特征输入预先训练的预测模型,得到输出结果,其中,所述预测模型通过所述第一方中具有第一业务属性的多条业务数据构造的各个训练样本进行训练;
根据所述输出结果确定所述第一用户的第一业务属性。


2.根据权利要求1所述的方法,其中,所述第一方中具有第一业务属性的多条业务数据包括第二业务数据,针对所述第二业务数据通过以下方式构造训练样本:
根据所述第二业务数据中的第一业务属性,确定第一标签;
针对所述第二业务数据中,第一业务属性之外的其他业务属性,提取各个样本参考特征,单个样本参考特征根据所述业务模型针对所述第二业务数据的业务处理结果对相应业务特征的梯度确定;
基于各个样本参考特征和所述第一标签,确定与所述第二业务数据对应的训练样本。


3.根据权利要求2所述的方法,其中,所述基于各个样本参考特征和所述第一标签,确定与所述第二业务数据对应的训练样本包括:
在所述第一标签是对应于所述第二业务数据中的第一业务属性的标签的情况下,基于各个样本参考特征和所述第一标签,构造与所述第二业务数据对应的正样本;
在所述第一标签不是对应于所述第二业务数据中的第一业务属性的标签的情况下,基于各个样本参考特征和所述第一标签,构造与所述第二业务数据对应的负样本。


4.根据权利要求1所述的方法,其中,所述预测模型为逻辑回归模型或深度神经网络。


5.根据权利要求1所述的方法,其中,所述输出结果为分别对应于所述第一业务属性的各个属性候选项的各个概率,所述根据所述输出结果确定所述第一用户的第一业务属性包括:
根据各个概率中最大的至少一个概率对应的各个属性候选项,确定所述第一用户的第一业务属性。


6.根据权利要求1所述的方法,其中,所述输出结果为对应于所述第一用户的第一业务属性是第一属性候选项的第一概率,所述根据所述输出结果确定所述第一用户的第一业务属性包括:
基于所述第一概率与预定概率阈值的对比,确定所述第一用户的第一业务属性。


7.一种预测缺失的用户业务属性的装置,用于基于多个业务方在保护数据隐私的前提下共同训练的业务模型,由所述多个业务方中的第一方预测其针对第一用户的...

【专利技术属性】
技术研发人员:林建滨
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1