隐私化随机森林模型的构建方法、装置、设备及存储介质制造方法及图纸

技术编号:42452264 阅读:37 留言:0更新日期:2024-08-21 12:44
本发明专利技术适用机器学习和信息保护技术领域,提供了一种隐私化随机森林模型的构建方法,该方法包括:获取用于构建隐私化随机森林模型的训练用隐私数据集和构建参数,其中,构建参数包括决策树的个数、决策树的最大深度以及隐私预算,基于预设的训练集划分策略,将训练用隐私数据集划分为与决策树的个数对应的若干子训练集,基于决策树的最大深度、隐私预算以及若干子训练集,采用预设的决策树隐私化构建策略构建与子训练集对应的隐私化决策树模型,由若干隐私化决策树模型生成隐私化随机森林模型,从而使得用于创建决策树模型节点的信息都是经过脱敏的,在提高了隐私保护性的同时降低了噪声,提升了模型节点的学习能力以及随机森林模型的性能和精度。

【技术实现步骤摘要】

本专利技术属于机器学习和信息保护,尤其涉及一种隐私化随机森林模型的构建方法、装置、设备及存储介质


技术介绍

1、随机森林的基学习器模型是决策树,决策树的分支节点以及叶子节点均包含存储着训练数据的统计信息,如果在建立决策树模型时获得这些统计信息时不经过任何脱敏操作,那么当这些信息不经意间被攻击者获得后就很可能导致个人隐私的泄露。而使用差分隐私构建决策树可以防止恶意的攻击者通过观察、对比以及分析等一系列合法或者非法的手段窃取训练数据集中的个人隐私信息。使用差分隐私避免决策树导致的隐私泄露问题的关键在于:使决策树在访问训练数据时满足差分隐私。根据决策树不同的位置访问训练数据的方式不同,差分隐私决策树算法(decision tree with differential privacy,简称dpdt算法)实现差分隐私的方式也不一样,具体地,当位于决策树的分支节点时,dpdt算法使用指数机制避免特征划分带来的隐私泄露风险,当位于决策树的叶子节点时,dpdt算法采用拉普拉斯机制避免计数统计引发的隐私泄露风险。然而,dpdt算法在分支节点的创建过程中使用指数机制输出分裂本文档来自技高网...

【技术保护点】

1.一种隐私化随机森林模型的构建方法,其特征在于,所述方法包括下述步骤:

2.如权利要求1所述的方法,其特征在于,所述采用预设的决策树隐私化构建策略构建与所述子训练集对应的隐私化决策树模型的步骤,包括:

3.如权利要求2所述的方法,其特征在于,所述基于预设的叶子节点标签查询策略确定所述叶子节点的标签的步骤,包括:

4.如权利要求3所述的方法,其特征在于,所述基于所述标签对应的所述标签效用分数和所述最大标签效用分数,计算所述标签被选为叶子节点标签的标签概率的步骤,包括:

5.如权利要求2所述的方法,其特征在于,所述基于预设的分裂特征查询策略得...

【技术特征摘要】

1.一种隐私化随机森林模型的构建方法,其特征在于,所述方法包括下述步骤:

2.如权利要求1所述的方法,其特征在于,所述采用预设的决策树隐私化构建策略构建与所述子训练集对应的隐私化决策树模型的步骤,包括:

3.如权利要求2所述的方法,其特征在于,所述基于预设的叶子节点标签查询策略确定所述叶子节点的标签的步骤,包括:

4.如权利要求3所述的方法,其特征在于,所述基于所述标签对应的所述标签效用分数和所述最大标签效用分数,计算所述标签被选为叶子节点标签的标签概率的步骤,包括:

5.如权利要求2所述的方法,其特征在于,所述基于预设的分裂特征查询策略得到所述分支节点的分裂特征的步骤,包括:

【专利技术属性】
技术研发人员:王树兰邱瑶王磊刘宏伟邹家须
申请(专利权)人:深圳技术大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1