【技术实现步骤摘要】
本专利技术属于机器学习和信息保护,尤其涉及一种隐私化随机森林模型的构建方法、装置、设备及存储介质。
技术介绍
1、随机森林的基学习器模型是决策树,决策树的分支节点以及叶子节点均包含存储着训练数据的统计信息,如果在建立决策树模型时获得这些统计信息时不经过任何脱敏操作,那么当这些信息不经意间被攻击者获得后就很可能导致个人隐私的泄露。而使用差分隐私构建决策树可以防止恶意的攻击者通过观察、对比以及分析等一系列合法或者非法的手段窃取训练数据集中的个人隐私信息。使用差分隐私避免决策树导致的隐私泄露问题的关键在于:使决策树在访问训练数据时满足差分隐私。根据决策树不同的位置访问训练数据的方式不同,差分隐私决策树算法(decision tree with differential privacy,简称dpdt算法)实现差分隐私的方式也不一样,具体地,当位于决策树的分支节点时,dpdt算法使用指数机制避免特征划分带来的隐私泄露风险,当位于决策树的叶子节点时,dpdt算法采用拉普拉斯机制避免计数统计引发的隐私泄露风险。然而,dpdt算法在分支节点的创建过程中
...【技术保护点】
1.一种隐私化随机森林模型的构建方法,其特征在于,所述方法包括下述步骤:
2.如权利要求1所述的方法,其特征在于,所述采用预设的决策树隐私化构建策略构建与所述子训练集对应的隐私化决策树模型的步骤,包括:
3.如权利要求2所述的方法,其特征在于,所述基于预设的叶子节点标签查询策略确定所述叶子节点的标签的步骤,包括:
4.如权利要求3所述的方法,其特征在于,所述基于所述标签对应的所述标签效用分数和所述最大标签效用分数,计算所述标签被选为叶子节点标签的标签概率的步骤,包括:
5.如权利要求2所述的方法,其特征在于,所述基于预设
...【技术特征摘要】
1.一种隐私化随机森林模型的构建方法,其特征在于,所述方法包括下述步骤:
2.如权利要求1所述的方法,其特征在于,所述采用预设的决策树隐私化构建策略构建与所述子训练集对应的隐私化决策树模型的步骤,包括:
3.如权利要求2所述的方法,其特征在于,所述基于预设的叶子节点标签查询策略确定所述叶子节点的标签的步骤,包括:
4.如权利要求3所述的方法,其特征在于,所述基于所述标签对应的所述标签效用分数和所述最大标签效用分数,计算所述标签被选为叶子节点标签的标签概率的步骤,包括:
5.如权利要求2所述的方法,其特征在于,所述基于预设的分裂特征查询策略得到所述分支节点的分裂特征的步骤,包括:
【专利技术属性】
技术研发人员:王树兰,邱瑶,王磊,刘宏伟,邹家须,
申请(专利权)人:深圳技术大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。