当前位置: 首页 > 专利查询>浙江大学专利>正文

基于差分隐私数据生成的多方数据估值分析方法和系统技术方案

技术编号:45533135 阅读:16 留言:0更新日期:2025-06-13 17:33
本发明专利技术公开了一种基于差分隐私数据生成的多方数据估值分析方法和系统,方法包括:在合成数据生成阶段,基于各数据提供方的原始数据利用私有进化生成算法分别生成差分隐私合成数据;在数据估值阶段,基于原始数据与差分隐私合成数据进行包括下游任务精度分析、分布相似度分析和距离差异分析的多维度差异分析并构建多维度差异评分,基于多维度差异评分构建动态惩罚项并应用于各数据提供方的边际贡献值上以构建并动态调整各数据提供方的差分隐私合成数据的估值分析结果。本发明专利技术能够根据估值分析结果实现动态地调整和校正差分隐私合成数据与原始数据的分布差异,从而提升估值结果的精确性和公正性,有效平衡隐私保护与数据估值之间的关系。

【技术实现步骤摘要】

本专利技术属于隐私计算与数据估值,具体涉及一种基于差分隐私数据生成的多方数据估值分析方法和系统


技术介绍

1、随着人工智能与机器学习的快速发展,数据逐渐成为推动科学技术进步的重要资产。高质量数据不仅是提升模型性能的关键,也为数据共享和数据市场的繁荣提供了支撑。近年来,随着多方数据协作和数据市场的兴起,数据估值方法逐渐受到关注。这些方法通过量化用户提供数据对模型性能的贡献,帮助利益相关方实现数据的公平交易和合理利用。

2、现有的数据估值方法通常依赖于对不同数据子集进行模型训练与性能评估,以此来量化每个数据点的贡献。尽管这些数据估值方法在一定程度上促进了数据的合理估值,但在实际应用过程中为恶意行为者提供了利用模型输出进行攻击的机会,进而引发隐私风险,尤其是在涉及多个数据提供方的协作场景中。

3、隐私风险主要包括两类常见的隐私攻击:成员推断攻击和属性推断攻击。成员推断攻击允许攻击者通过分析模型的输出,判断某个数据样本是否属于训练集,进而暴露训练集的成员身份及可能的敏感信息。属性推断攻击则更为严重,攻击者可以通过分析模型输出,揭示目标模型本文档来自技高网...

【技术保护点】

1.一种基于差分隐私数据生成的多方数据估值分析方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于差分隐私数据生成的多方数据估值分析方法,其特征在于,多维度差异评分为下游任务精度分析、分布相似度分析和距离差异分析的多维度差异分析的结果的加权求和,公式表示为:

3.根据权利要求1或2所述的基于差分隐私数据生成的多方数据估值分析方法,其特征在于,基于多维度差异评分构建动态惩罚项,公式表示为:

4.根据权利要求3所述的基于差分隐私数据生成的多方数据估值分析方法,其特征在于,将动态惩罚项应用于各数据提供方的边际贡献值上以构建各数据提供方的差分隐私合成...

【技术特征摘要】

1.一种基于差分隐私数据生成的多方数据估值分析方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于差分隐私数据生成的多方数据估值分析方法,其特征在于,多维度差异评分为下游任务精度分析、分布相似度分析和距离差异分析的多维度差异分析的结果的加权求和,公式表示为:

3.根据权利要求1或2所述的基于差分隐私数据生成的多方数据估值分析方法,其特征在于,基于多维度差异评分构建动态惩罚项,公式表示为:

4.根据权利要求3所述的基于差分隐私数据生成的多方数据估值分析方法,其特征在于,将动态惩罚项应用于各数据提供方的边际贡献值上以构建各数据提供方的差分隐私合成数据的估值分析结果,公式表示为:

5.根据权利要求2所述的基于差分隐私数据生成的多方数据估值分析方法,其特征在于,通过下游任务精度分析计算性能差异比,包括:

6.根据权利要求2所述的基于差分隐私数据生成...

【专利技术属性】
技术研发人员:陈文智薛霄楠魏成坤
申请(专利权)人:浙江大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1