一种应用于金融场景的隐私特征IV值计算方法技术

技术编号:36348521 阅读:87 留言:0更新日期:2023-01-14 18:03
本发明专利技术涉及隐私计算技术领域,具体公开了一种应用于金融场景的隐私特征IV值计算方法,包括如下步骤:步骤S1,首先参与计算的双方生成一组公私钥对,其中,参与双方分别以即第一参与方和第二参与方表示;步骤S2,将第一参与方的公钥公开给第二参与方;步骤S3,第一参与方利用自己的公钥加密各个样本数据的标签值生成各个样本数据的密文标签值,并将样本数据的密文标签值发送给第二参与方;步骤S4,同时针对某一特征,第二参与方基于特征值对多个样本数据进行分组等步骤。本发明专利技术底层基于密码学的安全多方计算框架,安全性可验;同时本发明专利技术对金融场景下隐私计算的各种隐私计算方法如逻辑预测、逻辑回归提供了很好的基础设施。逻辑回归提供了很好的基础设施。逻辑回归提供了很好的基础设施。

【技术实现步骤摘要】
一种应用于金融场景的隐私特征IV值计算方法


[0001]本专利技术涉及隐私计算
,具体是一种应用于金融场景的隐私特征IV值计算方法。

技术介绍

[0002]随着机器学习、联邦学习等新兴技术的不断崛起和发展,传统金融行业也开始逐步接触和探索机器学习的一些常用算法和模型。其中特征IV值(Inform第一参与方tion V第一参与方lue)是机器学习二分类问题中一个比较重要的指标,其主要用来对输入变量进行编码和预测能力的评估。特征变量IV值的大小即表示该变量预测能力的强弱。虽然目前市面上已经有了一些与之相关的一些算法和说明,但这些算法很难直接拿过来用于一些隐私计算的系统或方法上,故在金融场景中落地的难度更是可想而知。
[0003]传统机器学习算法中,特征变量越多越大时,需要计算特征IV进行筛选,IV值越高,表示特征蕴含信息量越大,越适合于机器学习算法的模型训练。而随着数据隐私及安全保护的日重要性日益提升,基于明文数据计算IV值的方法已经难以满足隐私保护要求,当然使用MPC技术可解决当前的隐私安全的问题,但同时MPC技术对通信宽带要求较高本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种应用于金融场景的隐私特征IV值计算方法,其特征在于,包括如下步骤:步骤S1,首先参与计算的双方生成一组公私钥对,其中,参与双方分别以即第一参与方和第二参与方表示;步骤S2,将第一参与方的公钥公开给第二参与方;步骤S3,第一参与方利用自己的公钥加密各个样本数据的标签值生成各个样本数据的密文标签值,并将样本数据的密文标签值发送给第二参与方;步骤S4,同时针对某一特征,第二参与方基于特征值对多个样本数据进行分组,并结合各个样本数据的密文标签值以及第一参与方的公钥计算每个分组的密文WOE值;步骤S5,第二参与方将各分组的密文WOE值进行累加,得到该特征的最终密文WOE值;步骤S6,通过各分组的密文WOE值计算出各个分组的密文特征IV值;步骤S7,第二参与方将计算后的最终密文特征IV值加密后发送给第一参与方;步骤S8,第一参与方利用自己的私钥解密该特征的最终密文特征IV值,得到该特征的明文特征IV值,并将其发送给第二参与方;步骤S9,第二参与方得到该特征的最终IV值后继续在系统中进行特征工程或者逻辑预测的工程构建。2.根据权利要求1所述的一种应用于金融场景的隐私特征IV值计算方法,其特征在于,所述步骤S1,首先为参与计算的双方生成一组公私钥对的详细步骤如下:步骤S1.1,确定参与方,将参与双方分别标记为第一参与方和第二参与方:步骤S1.2,第一参与方和第二参与方生成一组公私钥对。3.根据权利要求1所述的一种应用于金融场景的隐私特征IV值计算方法,其特征在于,所述步骤S3,第一参与方利用自己的公钥加密各个样本数据的标签值生成各个样本数据的密文标签值,并将样本数据的密文标签值发送给第二参与方的详细步骤如下:步骤S3.1,第一参与方利用自己的公钥加密各个样本数据的标签值,从而生成各个样本数据的密文标签值:步骤S3.2,第一参与方将样本数据的密文标签值发送给第二参与方。4.根据权利要求1所述的一种应用于金融场景的隐私特征IV值计算方法,其特征在于,所述步骤S4同时针对某一特征,第二参与方基于特征值对多个样本数据进行分组,并结合各个样本数据的密文标签值以及第一参与方的公钥计算每个分组的密文WOE值,的详细步骤如下:步骤S4.1,首先采集每个bin中的坏样本数量和总坏样本数,并依据上述数据计算出每个bin坏样本百分比;步骤S4.2,接着采集每个bin中的好样本数量和总好样本总数,并依据上述数据计算每个bin好样本百分比:步骤S4.3,最后依据上述计算的每个bin的坏样本百分比和每个bin好样本百分比算出每个bin的WOE值。5.根据权利要求4所述的一种应用于金融场景的隐私特征IV值计算方法,其特征在于,所述步骤S4同时针对某一特征,第二参与方基于特征值对多个样本...

【专利技术属性】
技术研发人员:李维成袁文俊李升林
申请(专利权)人:上海阵方科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1