基于同态加密的信息值计算方法、设备及可读存储介质技术

技术编号:20160925 阅读:38 留言:0更新日期:2019-01-19 00:13
本发明专利技术公开了一种基于同态加密的信息值计算方法、设备及可读存储介质,该方法包括步骤:当第二终端确定与第一终端携带相同数据标识的交集样本数据后,第二终端采用同态加密算法对交集样本数据对应的数据标签进行加密,得到数据标签值;将数据标签值对应的数据标识和数据标签值发送给第一终端,并检测是否接收到第一终端发送的信息数据,其中,信息数据是第一终端根据数据标识和数据标签值所得的;当接收到信息数据后,根据信息数据计算信息数据对应特征变量的信息值。本发明专利技术实现了在第一终端和第二终端不泄露各自数据的情况下,第二终端通过与第一终端联合学习的方法计算第一终端中与其交集样本数据中各个样本数据对应的信息值。

【技术实现步骤摘要】
基于同态加密的信息值计算方法、设备及可读存储介质
本专利技术涉及数据处理
,尤其涉及一种基于同态加密的信息值计算方法、设备及可读存储介质。
技术介绍
在对数据进行统计建模或机器学习之前,需要进行大量的特征工程工作,即需要在大量数据中选取对建模或者机器学习比较重要的数据。因此,计算数据特征的重要性尤为重要。随着科学技术的发展,数据的隐私保护越来越重要。然而很多的建模任务,需要利用多方的数据一起联合学习才能完成建模。因此,如何在多方不泄露各自数据的情况下,通过联合学习的方法计算数据的信息值,是亟待解决的问题,其中,信息值(InformationValue,简称IV)是一种表示数据特征重要性的指标。
技术实现思路
本专利技术的主要目的在于提供一种基于同态加密的信息值计算方法、设备及可读存储介质,旨在解决现有的如何在多方不泄露各自数据的情况下,通过联合学习的方法计算数据的信息值的技术问题。为实现上述目的,本专利技术提供一种基于同态加密的信息值计算方法,所述基于同态加密的信息值计算方法包括步骤:当第二终端确定与第一终端携带相同数据标识的交集样本数据后,所述第二终端采用同态加密算法对所述交集样本数据对应的数据标签进行加密,得到数据标签值;将所述数据标签值对应的数据标识和所述数据标签值发送给第一终端,并检测是否接收到所述第一终端发送的信息数据,其中,所述信息数据是所述第一终端根据所述数据标识和所述数据标签值所得的;当接收到所述信息数据后,根据所述信息数据计算所述信息数据对应特征变量的信息值,其中,每一数据标识至少对应一个特征变量。优选地,所述当接收到所述信息数据后,根据所述信息数据计算所述信息数据对应特征变量的信息值的步骤包括:当接收到所述信息数据后,解密所述信息数据,得到与所述信息数据对应样本数据的负样本个数和正样本个数;根据所述负样本个数和所述正样本个数计算所述信息数据对应特征变量的权重值;通过所述权重值和预设的信息值计算公式计算得到所述信息数据对应特征变量的信息值。优选地,所述当第二终端确定与第一终端携带相同数据标识的交集样本数据后,所述第二终端采用同态加密算法对所述交集样本数据对应的数据标签进行加密,得到数据标签值的步骤之前,还包括:当所述第二终端接收到所述第一终端发送的加密后的第一数据标识后,所述第二终端采用预设公钥对所述第一数据标识进行二次加密,得到第一加密值;将采用所述预设公钥加密后的第二数据标识发送给所述第一终端,并检测是否接收到所述第一终端加密所述第二数据标识后返回的第二加密值;当接收到所述第二加密值后,根据所述第一加密值和所述第二加密值确定与所述第一终端携带相同数据标识的交集样本数据。优选地,所述当接收到所述信息数据后,根据所述信息数据计算所述信息数据对应特征变量的信息值的步骤之后,还包括:当接收到建模指令后,根据所述信息值选取建模所需的特征变量。此外,为实现上述目的,本专利技术还提供一种基于同态加密的信息值计算方法,所述基于同态加密的信息值计算方法包括步骤:当第一终端接收到第二终端发送的数据标签值和与所述数据标签值对应的数据标识后,所述第一终端根据交集样本数据中各个特征值所属类别确定属于同一类别的所述数据标签值;对属于同一类别的所述数据标签值进行求和,得到求和后的所述数据标签值;将求和后的所述数据标签值对应的数据标识,以及求和后的所述数据标签值作为信息数据发送给所述第二终端,以供所述第二终端根据所述信息数据计算与所述信息数据对应特征变量的信息值,其中,每一数据标识至少对应一个特征变量。优选地,所述当第一终端接收到第二终端发送的数据标签值和与所述数据标签值对应的数据标识后,所述第一终端根据交集样本数据中各个特征值所属类别确定属于同一类别的所述数据标签值的步骤之前,还包括:当所述第一终端确定与所述第二终端携带相同数据标识的交集样本数据后,所述第一终端按照预设方式对所述交集样本数据中的特征变量对应的特征值进行分类,以确定所述特征值所属类别;所述当第一终端接收到第二终端发送的数据标签值和与所述数据标签值对应的数据标识后,所述第一终端根据交集样本数据中各个特征值所属类别确定属于同一类别的所述数据标签值的步骤包括:当第一终端接收到第二终端发送的数据标签值和数据标识后,所述第一终端根据所述特征值所属类别确定属于同一类别的所述数据标识,并根据属于同一类别的所述数据标识确定属于同一类别的所述数据标签值。优选地,所述将求和后的所述数据标签值对应的数据标识,以及求和后的所述数据标签值作为信息数据发送给所述第二终端的步骤之前,还包括:将属于同一类别的所述数据标签值对应的数据标识记为目标数据标识;对所述目标数据标识进行编码,得到编码后的所述数据标识;所述将求和后的所述数据标签值对应的数据标识,以及求和后的所述数据标签值作为信息数据发送给所述第二终端的步骤包括:将求和后的所述数据标签值和编码后的所述数据标识作为信息数据发送给所述第二终端,以供所述第二终端根据所述信息数据计算与所述信息数据对应特征变量的信息值。优选地,所述对属于同一类别的所述数据标签值进行求和,得到求和后的所述数据标签值的步骤包括:确定属于同一类别的所述数据标签值中的第一标签值和第二标签值;分别对所述第一标签值和所述第二标签值进行求和,得到求和后的所述数据标签值。此外,为实现上述目的,本专利技术还提供一种基于同态加密的信息值计算设备,所述基于同态加密的信息值计算设备包括存储器、处理器和存储在所述存储器上并可在所述处理器上运行的基于同态加密的信息值计算程序,所述基于同态加密的信息值计算程序被所述处理器执行时实现如上所述的基于同态加密的信息值计算方法的步骤。此外,为实现上述目的,本专利技术还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有基于同态加密的信息值计算程序,所述基于同态加密的信息值计算程序被处理器执行时实现如上所述的基于同态加密的信息值计算方法的步骤。本专利技术通过当第二终端确定与第一终端携带相同数据标识的交集样本数据后,第二终端采用同态加密算法对交集样本数据对应的数据标签进行加密,得到数据标签值;将数据标签值对应的数据标识和数据标签值发送给第一终端,并检测是否接收到第一终端发送的信息数据;当接收到信息数据后,根据信息数据计算信息数据对应特征变量的信息值,其中,每一数据标识至少对应一个特征变量。实现了在第一终端和第二终端不泄露各自数据的情况下,第二终端通过与第一终端联合学习的方法计算第一终端中与其交集样本数据中各个样本数据对应的信息值。附图说明图1是本专利技术实施例方案涉及的硬件运行环境的结构示意图;图2为本专利技术基于同态加密的信息值计算方法第一实施例的流程示意图;图3为本专利技术基于同态加密的信息值计算方法第二实施例的流程示意图;图4为本专利技术基于同态加密的信息值计算方法第三实施例的流程示意图;图5为本专利技术基于同态加密的信息值计算方法第四实施例的流程示意图。本专利技术目的的实现、功能特点及优点将结合实施例,参照附图做进一步说明。具体实施方式应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。如图1所示,图1是本专利技术实施例方案涉及的硬件运行环境的结构示意图。需要说明的是,图1即可为基于同态加密的信息值计算设备的硬件运行环境的结构示意图。本专利技术实施例本文档来自技高网...

【技术保护点】
1.一种基于同态加密的信息值计算方法,其特征在于,所述基于同态加密的信息值计算方法包括以下步骤:当第二终端确定与第一终端携带相同数据标识的交集样本数据后,所述第二终端采用同态加密算法对所述交集样本数据对应的数据标签进行加密,得到数据标签值;将所述数据标签值对应的数据标识和所述数据标签值发送给第一终端,并检测是否接收到所述第一终端发送的信息数据,其中,所述信息数据是所述第一终端根据所述数据标识和所述数据标签值所得的;当接收到所述信息数据后,根据所述信息数据计算所述信息数据对应特征变量的信息值,其中,每一数据标识至少对应一个特征变量。

【技术特征摘要】
1.一种基于同态加密的信息值计算方法,其特征在于,所述基于同态加密的信息值计算方法包括以下步骤:当第二终端确定与第一终端携带相同数据标识的交集样本数据后,所述第二终端采用同态加密算法对所述交集样本数据对应的数据标签进行加密,得到数据标签值;将所述数据标签值对应的数据标识和所述数据标签值发送给第一终端,并检测是否接收到所述第一终端发送的信息数据,其中,所述信息数据是所述第一终端根据所述数据标识和所述数据标签值所得的;当接收到所述信息数据后,根据所述信息数据计算所述信息数据对应特征变量的信息值,其中,每一数据标识至少对应一个特征变量。2.如权利要求1所述的基于同态加密的信息值计算方法,其特征在于,所述当接收到所述信息数据后,根据所述信息数据计算所述信息数据对应特征变量的信息值的步骤包括:当接收到所述信息数据后,解密所述信息数据,得到与所述信息数据对应样本数据的负样本个数和正样本个数;根据所述负样本个数和所述正样本个数计算所述信息数据对应特征变量的权重值;通过所述权重值和预设的信息值计算公式计算得到所述信息数据对应特征变量的信息值。3.如权利要求1所述的基于同态加密的信息值计算方法,其特征在于,所述当第二终端确定与第一终端携带相同数据标识的交集样本数据后,所述第二终端采用同态加密算法对所述交集样本数据对应的数据标签进行加密,得到数据标签值的步骤之前,还包括:当所述第二终端接收到所述第一终端发送的加密后的第一数据标识后,所述第二终端采用预设公钥对所述第一数据标识进行二次加密,得到第一加密值;将采用所述预设公钥加密后的第二数据标识发送给所述第一终端,并检测是否接收到所述第一终端加密所述第二数据标识后返回的第二加密值;当接收到所述第二加密值后,根据所述第一加密值和所述第二加密值确定与所述第一终端携带相同数据标识的交集样本数据。4.如权利要求1至3任一项所述的基于同态加密的信息值计算方法,其特征在于,所述当接收到所述信息数据后,根据所述信息数据计算所述信息数据对应特征变量的信息值的步骤之后,还包括:当接收到建模指令后,根据所述信息值选取建模所需的特征变量。5.一种基于同态加密的信息值计算方法,其特征在于,所述基于同态加密的信息值计算方法包括以下步骤:当第一终端接收到第二终端发送的数据标签值和与所述数据标签值对应的数据标识后,所述第一终端根据交集样本数据中各个特征值所属类别确定属于同一类别的所述数据标签值;对属于同一类别的所述数据标签值进行求和,得到求和后的所述数据标签值;将求和后的所述数据标签值对应的数据标识,以及求和后的所述数据标签值作为信息数据发送给所述第二终端,以供所述第二终端根据所述信息数据计算与所述信息...

【专利技术属性】
技术研发人员:范涛马国强刘洋陈天健杨强
申请(专利权)人:深圳前海微众银行股份有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1