基于用户隐私保护训练指标预测模型的方法及装置制造方法及图纸

技术编号:25948000 阅读:42 留言:0更新日期:2020-10-17 03:40
本说明书实施例提供一种基于用户隐私保护训练指标预测模型的方法及装置,该方法首先在公有云环境下获取第一用户在使用第一产品进行身份验证时对应的多个特征项和相应的验证结果,基于多个特征项形成样本特征,将验证结果作为样本标签,形成训练样本训练预测模型,将训练后的所述预测模型用于部署到私有云环境中,以预测私有云环境中的第二产品对应的所述至少一个验证指标的指标值。该方法在无需私有云环境下的隐私数据出境的前提下,能够检测指定产品的指标是否异常。

【技术实现步骤摘要】
基于用户隐私保护训练指标预测模型的方法及装置
本说明书实施例涉及隐私数据保护
,具体地,涉及基于用户隐私保护训练指标预测模型的方法及装置。
技术介绍
身份验证是实现在线支付等操作的必要环节,支持身份验证的产品的验证流程中往往需要录入或读取用户的隐私数据,例如支持人脸等生物特征识别的产品,需要录入人脸图像等隐私数据,基于eKYC(electronicKnow-Your-Customer)的主动身份核实中,需要用户提交各种证件等身份信息。应监管部门对用户隐私合规的要求,用户隐私数据持有方将相应的产品部署在私有云环境下,例如,企业以及银行等金融机构直接将相关的软件产品部署在自己的服务器和机房中,或部署在公有云环境下的私有租户中。支持身份验证的产品在运行过程中需要进行指标检测,以判断产品体验是否合格,例如是否出现了设备不兼容、交互流程bug、算法问题等异常情况,这些指标检测一般依赖于产品数据的交换,而私有云环境下的隐私数据由于无法出境,使得产品的指标检测存在一定障碍。
技术实现思路
本说明书描述了一种基于用户隐本文档来自技高网...

【技术保护点】
1.一种基于用户隐私保护训练指标预测模型的方法,所述方法在公有云环境下执行,所述方法包括:/n获取第一用户在使用第一产品进行身份验证时对应的多个特征项,其中,所述第一产品部署在公有云环境中,所述多个特征项对应于对身份验证结果有影响的多个因素;/n获取所述第一用户使用所述第一产品进行身份验证的验证结果,所述验证结果包括与至少一个验证指标对应的数据项;/n基于所述多个特征项形成样本特征,将所述验证结果作为样本标签,从而形成训练样本;/n利用多个训练样本训练预测模型,训练后的所述预测模型用于部署到私有云环境中,以预测私有云环境中的第二产品对应的所述至少一个验证指标的指标值。/n

【技术特征摘要】
1.一种基于用户隐私保护训练指标预测模型的方法,所述方法在公有云环境下执行,所述方法包括:
获取第一用户在使用第一产品进行身份验证时对应的多个特征项,其中,所述第一产品部署在公有云环境中,所述多个特征项对应于对身份验证结果有影响的多个因素;
获取所述第一用户使用所述第一产品进行身份验证的验证结果,所述验证结果包括与至少一个验证指标对应的数据项;
基于所述多个特征项形成样本特征,将所述验证结果作为样本标签,从而形成训练样本;
利用多个训练样本训练预测模型,训练后的所述预测模型用于部署到私有云环境中,以预测私有云环境中的第二产品对应的所述至少一个验证指标的指标值。


2.根据权利要求1所述的方法,其中,所述第一产品的验证流程包括人脸验证;所述获取第一用户在使用第一产品进行身份验证时对应的多个特征项,包括:
获取所述第一用户用于人脸验证的人脸图像的第一附加特征,归入所述多个特征项,所述第一附加特征包括以下中的至少一项:人脸背景、人种、配饰、发型、发色。


3.根据权利要求1所述的方法,其中,所述第一产品的验证流程包括证件扫描;所述获取第一用户在使用第一产品进行身份验证时对应的多个特征项,包括:
获取所述第一用户用于证件扫描的证件图像的第二附加特征,归入所述多个特征项,所述第二附加特征包括以下中的至少一项:证件背景、证件类型、证件摆放角度。


4.根据权利要求1-3任一项所述的方法,其中,所述多个特征项还包括身份附加特征,所述身份附加特征包括以下中的至少一项:地址、性别、职业、年龄、身高。


5.根据权利要求1-3任一项所述的方法,其中,所述多个特征项还包括,所述第一用户在使用第一产品进行身份验证时的操作环境特征,所述操作环境特征包括以下中的至少一项:验证所使用的终端设备型号、操作系统及版本、操作系统语言、网络环境、时间。


6.根据权利要求1所述的方法,其中,基于所述多个特征项形成样本特征,包括:
将所述多个特征项中的若干特征项进行特征交叉,形成衍生特征;
将所述多个特征项和/或所述衍生特征作为对应的样本特征。


7.根据权利要求1所述的方法,其中,所述至少一个验证指标包括以下中的至少一项:验证通过率,验证耗时,刷脸成功率,证件扫描成功率、验证准确率。


8.根据权利要求1所述的方法,其中,所述预测模型为逻辑回归LR模型、支持向量机SVM模型、决策树模型、梯度提升迭代决策树GBDT模型、有监督的神经网络模型中的任意一种。


9.一种产品指标预测方法,所述方法在私有云环境下执行,所述方法包括:
获取多个第二用户在使用第二产品进行身份验证时分别对应的多个输入特征,其中,所述第二产品部署在私有云环境中,所述输入特征包括对身份验证结果有影响的多个因素对应的多个特征项;
获取如权利要求1-8任一项方法训练得到的预测模型;
将所述多个第二用户分别对应的多个输入特征分别输入所述预测模型,以预测所述多个第二用户使用所述第二产品进行身份验证的多个验证结果,所述验证结果包括与至少一个验证指标对应的数据项;
基于多个所述验证结果,获得所述第二产品对应的所述至少一个验证指标的指标值。


10.根据权利要求9所述的方法,其中,基于多个所述验证结果,获得所述第二产品对应的所述至少一个验证指标的指标值之后,还包括:
获取所述第二产品对应的所述至少一个验证指标的实际值,所述实际值基于所述多个第二用户使用所述第二产品进行身份验证的实际验证结果获得;
计算所述实际值与所述指标值之间的损失值,如果所述损失值超过预定范围,则判定相应的验证指标存在异常,将对应的用户输入特征判定为异常特征。


11.根据权利要求10所述的方法,其中,将对应的用户输入特征判定为异常特征之后,还包括:
所述异常特征的数目超过预定数目时,针对所述异常特征执行聚类分析,获得至少一个类别的异常特征。


12.一种基于用户隐私保护训练指标预测模型的装置,所述装置在公有云环境下运行,所述装置包括:
第一获取单元,被配置为获取第一用户在使用第一产品进行身份验证时对应的多个特征项,其中,所述第一产...

【专利技术属性】
技术研发人员:颜林
申请(专利权)人:支付宝杭州信息技术有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1