当前位置: 首页 > 专利查询>内蒙古大学专利>正文

一种基于差分隐私算法的主动推荐系统及装置制造方法及图纸

技术编号:21361543 阅读:24 留言:0更新日期:2019-06-15 09:22
本说明书实施例提供了一种基于差分隐私算法的主动推荐系统和装置,通过根据用户输入数据库确定所述用户需求的查询范围;根据所述输入数据库、查询范围选择差分隐私算法数据库,对所述差分隐私算法数据库中的不同差分隐私算法设定不同的隐私预算参数ε;根据设定不同的隐私预算参数ε与不同的差分隐私算法对所述输入数据库进行拟处理数量级的算法误差标准、算法性能标准、隐私保护强度大小标准确定输出结果;根据数据隐私保护程度对所述输出结果进行算法评估获得所述输出结果的趋势图,且根据所述趋势图推荐最优差分隐私算法在web前端显示。达到了大数据环境下促进了数据的发布、共享和分析,提高数据的隐私保护程度和数据的实用性的技术效果。

An Active Recommendation System and Device Based on Differential Privacy Algorithms

The embodiment of this specification provides an active recommendation system and device based on differential privacy algorithm, which determines the query range of the user's needs according to the user's input database, chooses the database of differential privacy algorithm according to the input database and the query range, and sets different privacy budget parameters e for different differential privacy algorithms in the database of the differential privacy algorithm. The output results are determined according to the arithmetic error standard, arithmetic performance standard and privacy protection intensity standard of different privacy budget parameters and different differential privacy algorithms. The output results are evaluated according to the degree of data privacy protection, and the trend diagram of the output results is obtained according to the trend. The graph recommends the optimal differential privacy algorithm to be displayed on the front end of the web. It achieves the technical effect of promoting data publishing, sharing and analysis, improving the degree of data privacy protection and data practicability in the large data environment.

【技术实现步骤摘要】
一种基于差分隐私算法的主动推荐系统及装置
本说明书实施例涉及大数据
,尤其涉及一种基于差分隐私算法的主动推荐系统及装置。
技术介绍
大数据驱动的管理与决策发展核心是不同行业领域之间的数据资源开放,以及消息孤岛的消除。数据开放能够推动经济发展、完善社会治理、提升政府服务和监管能力等。然而,数据开放的同时会直接带来数据治理和共享管理问题。目前,数据资源治理和共享管理已成为大数据驱动的管理与决策研究和应用的关键问题。而在大数据资源治理和共享管理过程中,数据与个人隐私已成为其核心科学问题,若隐私问题没有解决之法,不同行业之间的数据开放变得毫无意义。匿名化、加密、密码学等是解决数据隐私问题的传统机制。这些方法是基于某些特定的攻击假设和背景知识才能够生效,通常集中于单一的小数据,是对隐私的被动保护,进而无法应对大数据的大规模性、高速性与多样性。例如,利用背景知识攻击可以推理出k-匿名之后的敏感数据。此外,大数据的高级分析技术能够揭示传统技术难以展现的关联关系,进而使得传统的隐私保护机制遇到极大的瓶颈与挑战。但上述技术至少存在如下技术问题:现有技术中无法涵盖大数据隐私的真实内涵,不能够定位大数据隐私保护问题,无法实现不同领域中的大数据资源共享的技术问题。
技术实现思路
本说明书实施例提供及一种基于差分隐私算法的主动推荐系统及装置,解决了现有技术中无法涵盖大数据隐私的真实内涵,不能够定位大数据隐私保护问题,无法实现不同领域中的大数据资源共享的技术问题,达到了大数据环境下,对数据的需求促进了数据的发布、共享和分析,能够提高数据的隐私保护程度和数据的实用性,解决数据发布、数据分析带来的隐私威胁,能够防止攻击者拥有任意背景知识下的攻击并提供有力的保护的技术效果。鉴于上述问题,提出了本申请实施例以便提供一种基于差分隐私算法的主动推荐系统及装置。第一方面,本说明书实施例提供一种基于差分隐私算法的主动推荐系统,所述方法包括:根据用户输入数据库确定所述用户需求的查询范围;根据所述输入数据库、查询范围选择差分隐私算法数据库,对所述差分隐私算法数据库中的不同差分隐私算法设定不同的隐私预算参数ε;根据设定不同的隐私预算参数ε与不同的差分隐私算法对所述输入数据库进行拟处理数量级的算法误差标准、算法性能标准、隐私保护强度大小标准确定输出结果;根据数据隐私保护程度对所述输出结果进行算法评估获得所述输出结果的趋势图,且根据所述趋势图推荐最优差分隐私算法在web前端显示。优选地,所述系统还包括:根据所述最优差分隐私算法对所述输入数据库进行处理获得隐私数据;根据所述隐私数据确定所述隐私数据的类型特征;根据直方图发布算法或网格划分发布算法匹配所述隐私数据的类型特征,确定所述隐私数据的隐私保护方式。优选地,所述隐私预算参数ε的取值范围在0.01~ln3。优选地,所述直方图发布算法包括:对所述隐私数据进行分割确定数据单元;在所述数据单元中添加噪音,采用树结构对添加噪音的所述数据单元进行后置处理,获得多维优化直方图。优选地,所述网格划分发布算法包括:对所述隐私数据进行转换处理,且根据预定索引构造规则对所述隐私数据进行划分确定多个索引区域;对所述多个索引区域进行数值标识,且在数值标识的索引区域内加入噪声,获得网格划分图。第二方面,本说明书实施例提供一种基于差分隐私算法的主动推荐装置,所述装置包括:第一确定单元,用于根据用户输入数据库确定所述用户需求的查询范围。第一设定单元,用于根据所述输入数据库、查询范围选择差分隐私算法数据库,对所述差分隐私算法数据库中的不同差分隐私算法设定不同的隐私预算参数ε。第二确定单元,用于根据设定不同的隐私预算参数ε与不同的差分隐私算法对所述输入数据库进行拟处理数量级的算法误差标准、算法性能标准、隐私保护强度大小标准确定输出结果;第一获得单元,用于根据数据隐私保护程度对所述输出结果进行算法评估获得所述输出结果的趋势图,且根据所述趋势图推荐最优差分隐私算法在web前端显示。优选地,所述装置还包括:第二获得单元,用于根据所述最优差分隐私算法对所述输入数据库进行处理获得隐私数据;第三确定单元,用于根据所述隐私数据确定所述隐私数据的类型特征;第四确定单元,用于根据直方图发布算法或网格划分发布算法匹配所述隐私数据的类型特征,确定所述隐私数据的隐私保护方式。优选地,所述隐私预算参数ε的取值范围在0.01~ln3。优选地,所述第四确定单元中的直方图发布算法包括:第五确定单元,用于对所述隐私数据进行分割确定数据单元;第三获得单元,用于在所述数据单元中添加噪音,采用树结构对添加噪音的所述数据单元进行后置处理,获得多维优化直方图。优选地,所述第四确定单元中的网格划分发布算法包括:第六确定单元,用于对所述隐私数据进行转换处理,且根据预定索引构造规则对所述隐私数据进行划分确定多个索引区域;第四获得单元,用于对所述多个索引区域进行数值标识,且在数值标识的索引区域内加入噪声,获得网格划分图。第三方面,本说明书实施例提供一种基于差分隐私算法的主动推荐装置,包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,其特征在于,所述处理器执行上述任一项所述方法的步骤。本申请实施例中的上述一个或多个技术方案,至少具有如下一种或多种技术效果:本说明书实施例提供的一种基于差分隐私算法的主动推荐系统,通过根据用户输入数据库确定所述用户需求的查询范围;根据所述输入数据库、查询范围选择差分隐私算法数据库,对所述差分隐私算法数据库中的不同差分隐私算法设定不同的隐私预算参数ε;根据设定不同的隐私预算参数ε与不同的差分隐私算法对所述输入数据库进行拟处理数量级的算法误差标准、算法性能标准、隐私保护强度大小标准确定输出结果;根据数据隐私保护程度对所述输出结果进行算法评估获得所述输出结果的趋势图,且根据所述趋势图推荐最优差分隐私算法在web前端显示。通过输入数据集、隐私预算参数ε、查询范围并选择差分隐私方法库,以差分隐私算法作为根本处理方法,经过算法评估模块来帮助用户选择适应数据集的隐私保护方法,并将最终的推荐结果在web前端显示出来,解决了现有技术中无法涵盖大数据隐私的真实内涵,不能够定位大数据隐私保护问题,无法实现不同领域中的大数据资源共享的技术问题,达到了大数据环境下,对数据的需求促进了数据的发布、共享和分析,能够提高数据的隐私保护程度和数据的实用性,解决数据发布、数据分析带来的隐私威胁,能够防止攻击者拥有任意背景知识下的攻击并提供有力的保护的技术效果。附图说明图1为本说明书实施例中提供的一种基于差分隐私算法的主动推荐系统流程图;图2为本说明书实施例中提供的一种基于差分隐私算法的主动推荐装置示意图;图3为本说明书实施例中提供的另一种基于差分隐私算法的主动推荐装置示意图。附图标号说明:总线300,接收器301,处理器302,发送器303,存储器304,总线接口306。具体实施方式本专利技术实施例提供了一种基于差分隐私算法的主动推荐系统及装置,用于解决了现有技术中无法涵盖大数据隐私的真实内涵,不能够定位大数据隐私保护问题,无法实现不同领域中的大数据资源共享的技术问题,本专利技术提供的技术方案总体思路如下:在本专利技术实施例的技术方案中,通过根据用户输入数据库确定所述用户需求的本文档来自技高网...

【技术保护点】
1.一种基于差分隐私算法的主动推荐系统,其特征在于,所述系统包括:根据用户输入数据库确定所述用户需求的查询范围;根据所述输入数据库、查询范围选择差分隐私算法数据库,对所述差分隐私算法数据库中的不同差分隐私算法设定不同的隐私预算参数ε;根据设定不同的隐私预算参数ε与不同的差分隐私算法对所述输入数据库进行拟处理数量级的算法误差标准、算法性能标准、隐私保护强度大小标准确定输出结果;根据数据隐私保护程度对所述输出结果进行算法评估获得所述输出结果的趋势图,且根据所述趋势图推荐最优差分隐私算法在web前端显示。

【技术特征摘要】
1.一种基于差分隐私算法的主动推荐系统,其特征在于,所述系统包括:根据用户输入数据库确定所述用户需求的查询范围;根据所述输入数据库、查询范围选择差分隐私算法数据库,对所述差分隐私算法数据库中的不同差分隐私算法设定不同的隐私预算参数ε;根据设定不同的隐私预算参数ε与不同的差分隐私算法对所述输入数据库进行拟处理数量级的算法误差标准、算法性能标准、隐私保护强度大小标准确定输出结果;根据数据隐私保护程度对所述输出结果进行算法评估获得所述输出结果的趋势图,且根据所述趋势图推荐最优差分隐私算法在web前端显示。2.如权利要求1所述的主动推荐系统,其特征在于,所述系统还包括:根据所述最优差分隐私算法对所述输入数据库进行处理获得隐私数据;根据所述隐私数据确定所述隐私数据的类型特征;根据直方图发布算法或网格划分发布算法匹配所述隐私数据的类型特征,确定所述隐私数据的隐私保护方式。3.如权利要求1所述的主动推荐系统,其特征在于,所述隐私预算参数ε的取值范围在0.01~ln3。4.如权利要求1所述的主动推荐系统,其特征在于,所述直方图发布算法包括:对所述隐私数据进行分割确定数据单元;在所述数据单元中添加噪音,采用树结构对添加噪音的所述数据单元进...

【专利技术属性】
技术研发人员:马学彬王钰莹李致远方少剑王昭然
申请(专利权)人:内蒙古大学
类型:发明
国别省市:内蒙古,15

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1