一种信息物理融合系统隐私保护型数据分类方法技术方案

技术编号:12067958 阅读:153 留言:0更新日期:2015-09-18 02:00
本发明专利技术给出一种信息物理融合系统隐私保护型数据分类方法,使用随机决策树和门限加法同态密码解决了信息物理融合系统在分布式数据挖掘过程中的隐私泄漏问题。该方法首先由信息物理融合系统的各单元确定随机决策树的结构;然后对决策树的结点值进行计算,最后用建成的随机决策森林和门限加法同态公钥密码对新的实例进行分类。本发明专利技术利用分布式随机决策树准确地建立分类器,结合门限加法同态密码,能够在提供高效可靠的隐私保护的前提下,进行信息物理融合系统中的数据分类。

【技术实现步骤摘要】

本专利技术提供一种基于随机决策树的信息物理融合系统隐私保护型数据分类方法, 主要在信息物理融合系统进行分类的过程中采用分布式随机决策树和门限加法同态密码 提供高效且可靠的隐私保护,属于信息安全和数据挖掘的交叉技术应用领域。
技术介绍
信息物理融合系统是一个综合计算、网络和物理环境的多维复杂系统,通过 3C (Computation、Communication、Control)技术的有机融合与深度协作,实现大型工程系 统的实时感知、动态控制和信息服务。信息物理融合系统是一个智能的有自主行为的系统, 信息物理融合系统不仅能够从环境中获取数据,进行数据融合,提取有效信息,并且根据系 统规则通过效应器作用于环境,被广泛地应用于人工智能领域。 数据挖掘是一个从大量的数据中通过算法搜索隐藏于其中信息的过程。数据挖掘 最大的优势在于可以把许多分析和解决问题的方法用于大量的问题集。数据挖掘由于其广 阔的适用面和日益增长的市场需求,被应用于交通、医疗、保险、金融、制造等多个领域,已 经成为计算机行业中发展最快的领域之一。但是如果隐私和安全的要求限制了数据的共 享,就必须采用隐私保护型的数据挖掘方法。传统密码学的方法效率过低,很难进行大规模 分析,简单混淆输入输出的方法很难提供可靠的安全性。本专利技术结合随机决策树和门限加 法同态密码技术,进行高效的隐私保护型数据挖掘。 分类是一种重要的数据分析方法。先选出已经分好类的数据作为训练集,在该训 练集上运用数据挖掘分类的技术,建立分类模型;对于没有分类的数据进行分类预测。最初 的数据挖掘分类应用大多都是基于内存基础上所构造的算法。目前数据挖掘方法都要求具 有基于外存以处理大规模数据集合的能力和具有可扩展的能力。 随机决策树是一种决策树的构建方法,具有基于外存以处理大规模数据集合的能 力和具有可扩展的能力。随机树的结构是由完全独立的训练数据建成的,算法可被分为训 练和分类两部分。由于随机分配在建立树过程中的使用,随机决策树在计算速度和安全性 能方面优于其他模型,适合本专利技术的需求。 同态加密是基于数学难题的计算复杂性理论的密码学技术。同态加密对经过同态 加密的数据进行处理得到一个输出,将这一输出进行解密得到的结果与用同一方法处理为 加密的原始数据得到的输出结果是一样的。同态加密主要包括加法同态、乘法同态、混合乘 法同态、减法同态等,本专利技术主要利用加法同态密码的性质进行保密通信。
技术实现思路
技术问题:本专利技术的目的是提供一种信息物理融合系统隐私保护型数据分类方 法,该方法在分类的过程中结合了分布式随机决策树和门限加法同态密码,以解决数据挖 掘中的隐私保护问题。 技术方案:本专利技术所述的基于随机决策树的信息物理融合系统隐私保护型数据分 类方法,用户先在信息物理融合系统中构建多棵随机决策树,再用门限加法同态密码加密 决策树,用加密后的决策森林组成一个全局决策树,对数据进行分类。 本专利技术所述的信息物理融合系统由若干信息物理单元和一个证书管理单元组成, 其中所述的信息物理单元用于独立地收集和处理数据,证书管理单元用于颁发证书。 基于随机决策树的信息物理融合系统隐私保护型数据分类方法包括以下步骤: 步骤1)用户将信息物理融合系统的组成单元划分为多个信息物理单元和一个证 书管理单元,所述的信息物理单元用于独立地收集和处理数据,证书管理单元用于颁发证 书; 步骤2)用户预先将样本格式放置在系统中,所述样本格式包括样本名称、属性名 称和对应的属性值; 步骤3)用户启动每个信息物理单元收集训练样本的数据; 步骤4)每个信息物理单元随机地生成一个决策树的结构,所述的决策树是一种 树型结构的分类器,分类器是一种计算机程序,可自动将数据分到已知类别; 步骤5)每个信息物理单元都将生成的决策树结构共享,形成一个集合; 步骤6)对于集合中的每个决策树结构,每个信息物理单元都以匿名的方式表示 接受或拒绝,如果不能一致接受集合中的任何决策树结构,则需从步骤4)重新开始; 步骤7)根据每个信息物理单元的合作方式,训练决策树的过程分为三种情况,所 述的合作方式指每个信息物理单元对数据和决策树的共享方式: (a)每个信息物理单元都知道所有决策树的结点向量值 步骤a7. 1)每个信息物理单元用自己的数据计算决策树结点向量值,并告知所有 信息物理单元,所述决策树结点向量值是通过决策树算法计算得出的分布概率的组合; 步骤a7. 2)每个信息物理单元累加所有决策树的结点向量值并平均,得到一棵全 局决策树; (b)只有拥有决策树的信息物理单元知道所有决策树的结点向量值 步骤b7. 1)每个信息物理单元用自己的数据计算决策树的结点向量值,只告知拥 有决策树的信息物理单元; 步骤b7. 2)拥有决策树的信息物理单元累加所有决策树的结点向量值并平均,得 到一棵全局的决策树; (C)所有信息物理单元都不知道所有决策树的结点向量值 步骤c7. 1)每个信息物理单元用自己的数据计算决策树的结点向量值; 步骤8)对于一个新实例的分类,针对步骤7)中的三种情况: 步骤8. Ia)每个信息物理单元都持有全局决策树,直接在本地分类; 步骤8. Ib)需要分类的信息物理单元为门限加法同态公钥密码产生一个公私密 钥对,并向证书管理单元申请颁发自己构造的证书,若证书申请不成功,则需要重新进行步 骤8b),所述的门限加法同态公钥密码是一种公钥密码,只有当有达到门限数量的单元同意 解密时,持有私钥的单元才可以解密; 步骤8. Ib2)申请证书成功后,需要分类的信息物理单元向拥有决策树的信息物 理单元发出分类请求; 步骤8. Ib3)拥有决策树的信息物理单元将全局决策树的结点向量值用证书中的 公钥加密后回送给需要分类的信息物理单元; 步骤8. Ib4)需要分类的信息物理单元根据回送的加密值检索分类的实例到达的 所有结点,并将所有加密的结点向量值相乘; 步骤8. Ib5)需要分类的信息物理单元办理门限解密,检索分类结果; 步骤8. Ic)需要分类的信息物理单元为门限加法同态公钥密码产生一个公私密 钥对,并向证书管理单元申请自己构造的证书,若证书申请不成功,则需要重新进行步骤 8. Ic) 步骤8. Ic2)申请证书成功后,需要分类的信息物理单元向所有信息物理单元发 出分类请求; 步骤8. Ic3)每个信息物理单元将自己的决策树结点向量值用证书中的公钥加密 后回送给需要分类的信息物理单元; 步骤8. Ic4)需要分类的信息物理单元根据回送的加密值检索分类的实例到达的 所有结点,并将所有加密的结点向量值相乘; 步骤8. Ic5)需要分类的信息物理单元办理门限解密,检索分类结果。 有益效果:本专利技术使用了数据挖掘中分类算法的随机决策树算法,并结合了门限 加法同态公钥密码以实现信息物理融合系统中的隐私保护,解决了传统混淆输入输出方法 的不稳定性和纯密码学方法不能高效进行的问题。具体来说,本专利技术所述的基于随机决策 树的信息物理融合系统隐私保护型数据分类方法具有如下的有益效果: (1)随机决策树在隐私保护时提供的安全性比传统的混淆输入输出的方法更为可 靠,而计算和通信的代价也远小于纯密码学方法,可以适应大数据需求,并且实现起来也较 为容易。 (2)随机决本文档来自技高网
...

【技术保护点】
一种信息物理融合系统隐私保护型数据分类方法,其特征在于包括以下步骤:步骤1)用户将信息物理融合系统的组成单元划分为多个信息物理单元和一个证书管理单元,所述的信息物理单元用于独立地收集和处理数据,证书管理单元用于颁发证书;步骤2)用户预先将样本格式放置在系统中,所述样本格式包括样本名称、属性名称和对应的属性值;步骤3)用户启动每个信息物理单元收集训练样本的数据;步骤4)每个信息物理单元随机地生成一个决策树的结构,所述的决策树是一种树型结构的分类器,分类器是一种计算机程序,可自动将数据分到已知类别;步骤5)每个信息物理单元都将生成的决策树结构共享,形成一个集合;步骤6)对于集合中的每个决策树结构,每个信息物理单元都以匿名的方式表示接受或拒绝,如果不能一致接受集合中的任何决策树结构,则需从步骤4)重新开始;步骤7)根据每个信息物理单元的合作方式,训练决策树的过程分为三种情况,所述的合作方式指每个信息物理单元对数据和决策树的共享方式:a.每个信息物理单元都知道所有决策树的结点向量值步骤a7.1)每个信息物理单元用自己的数据计算决策树结点向量值,并告知所有信息物理单元,所述决策树结点向量值是通过决策树算法计算得出的分布概率的组合;步骤a7.2)每个信息物理单元累加所有决策树的结点向量值并平均,得到一棵全局决策树;b.只有拥有决策树的信息物理单元知道所有决策树的结点向量值步骤b7.1)每个信息物理单元用自己的数据计算决策树的结点向量值,只告知拥有决策树的信息物理单元;步骤b7.2)拥有决策树的信息物理单元累加所有决策树的结点向量值并平均,得到一棵全局的决策树;c.所有信息物理单元都不知道所有决策树的结点向量值步骤c7.1)每个信息物理单元用自己的数据计算决策树的结点向量值;步骤8)对于一个新实例的分类,针对步骤7)中的三种情况:步骤8.1a)每个信息物理单元都持有全局决策树,直接在本地分类;步骤8.1b)需要分类的信息物理单元为门限加法同态公钥密码产生一个公私密钥对,并向证书管理单元申请颁发自己构造的证书,若证书申请不成功,则需要重新进行步骤8b),所述的门限加法同态公钥密码是一种公钥密码,只有当有达到门限数量的单元同意解密时,持有私钥的单元才可以解密;步骤8.1b2)申请证书成功后,需要分类的信息物理单元向拥有决策树的信息物理单元发出分类请求;步骤8.1b3)拥有决策树的信息物理单元将全局决策树的结点向量值用证书中的公钥加密后回送给需要分类的信息物理单元;步骤8.1b4)需要分类的信息物理单元根据回送的加密值检索分类的实例到达的所有结点,并将所有加密的结点向量值相乘;步骤8.1b5)需要分类的信息物理单元办理门限解密,检索分类结果;步骤8.1c)需要分类的信息物理单元为门限加法同态公钥密码产生一个公私密钥对,并向证书管理单元申请自己构造的证书,若证书申请不成功,则需要重新进行步骤8.1c);步骤8.1c2)申请证书成功后,需要分类的信息物理单元向所有信息物理单元发出分类请求;步骤8.1c3)每个信息物理单元将自己的决策树结点向量值用证书中的公钥加密后回送给需要分类的信息物理单元;步骤8.1c4)需要分类的信息物理单元根据回送的加密值检索分类的实例到达的所有结点,并将所有加密的结点向量值相乘;步骤8.1c5)需要分类的信息物理单元办理门限解密,检索分类结果。...

【技术特征摘要】

【专利技术属性】
技术研发人员:黄继鹏陈志岳文静芮路顾振兴崔鸣浩吴向忠黄本轩
申请(专利权)人:南京邮电大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1