一种信息物理融合系统隐私保护型数据分类方法技术方案

技术编号：12067958 阅读：153 留言：0更新日期：2015-09-18 02:00

本发明专利技术给出一种信息物理融合系统隐私保护型数据分类方法，使用随机决策树和门限加法同态密码解决了信息物理融合系统在分布式数据挖掘过程中的隐私泄漏问题。该方法首先由信息物理融合系统的各单元确定随机决策树的结构；然后对决策树的结点值进行计算，最后用建成的随机决策森林和门限加法同态公钥密码对新的实例进行分类。本发明专利技术利用分布式随机决策树准确地建立分类器，结合门限加法同态密码，能够在提供高效可靠的隐私保护的前提下，进行信息物理融合系统中的数据分类。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术提供一种基于随机决策树的信息物理融合系统隐私保护型数据分类方法，主要在信息物理融合系统进行分类的过程中采用分布式随机决策树和门限加法同态密码提供高效且可靠的隐私保护，属于信息安全和数据挖掘的交叉技术应用领域。
技术介绍
信息物理融合系统是一个综合计算、网络和物理环境的多维复杂系统，通过 3C (Computation、Communication、Control)技术的有机融合与深度协作，实现大型工程系统的实时感知、动态控制和信息服务。信息物理融合系统是一个智能的有自主行为的系统，信息物理融合系统不仅能够从环境中获取数据，进行数据融合，提取有效信息，并且根据系统规则通过效应器作用于环境，被广泛地应用于人工智能领域。数据挖掘是一个从大量的数据中通过算法搜索隐藏于其中信息的过程。数据挖掘最大的优势在于可以把许多分析和解决问题的方法用于大量的问题集。数据挖掘由于其广阔的适用面和日益增长的市场需求，被应用于交通、医疗、保险、金融、制造等多个领域，已经成为计算机行业中发展最快的领域之一。但是如果隐私和安全的要求限制了数据的共享，就必须采用隐私保护型的数据挖掘方法。传统密码学的方法效率过低，很难进行大规模分析，简单混淆输入输出的方法很难提供可靠的安全性。本专利技术结合随机决策树和门限加法同态密码技术，进行高效的隐私保护型数据挖掘。分类是一种重要的数据分析方法。先选出已经分好类的数据作为训练集，在该训练集上运用数据挖掘分类的技术，建立分类模型；对于没有分类的数据进行分类预测。最初的数据挖掘分类应用大多都是基于内存基础上...

【技术保护点】
一种信息物理融合系统隐私保护型数据分类方法，其特征在于包括以下步骤：步骤1)用户将信息物理融合系统的组成单元划分为多个信息物理单元和一个证书管理单元，所述的信息物理单元用于独立地收集和处理数据，证书管理单元用于颁发证书；步骤2)用户预先将样本格式放置在系统中，所述样本格式包括样本名称、属性名称和对应的属性值；步骤3)用户启动每个信息物理单元收集训练样本的数据；步骤4)每个信息物理单元随机地生成一个决策树的结构，所述的决策树是一种树型结构的分类器，分类器是一种计算机程序，可自动将数据分到已知类别；步骤5)每个信息物理单元都将生成的决策树结构共享，形成一个集合；步骤6)对于集合中的每个决策树结构，每个信息物理单元都以匿名的方式表示接受或拒绝，如果不能一致接受集合中的任何决策树结构，则需从步骤4)重新开始；步骤7)根据每个信息物理单元的合作方式，训练决策树的过程分为三种情况，所述的合作方式指每个信息物理单元对数据和决策树的共享方式：a.每个信息物理单元都知道所有决策树的结点向量值步骤a7.1)每个信息物理单元用自己的数据计算决策树结点向量值，并告知所有信息物理单元，所述决策树结点向量值是通过...

【技术特征摘要】

【专利技术属性】
技术研发人员：黄继鹏，陈志，岳文静，芮路，顾振兴，崔鸣浩，吴向忠，黄本轩，
申请(专利权)人：南京邮电大学，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人