一种MapReduce数据处理框架下的隐私保护方法技术

技术编号：11249963 阅读：88 留言：0更新日期：2015-04-01 23:31

本发明专利技术提供一种MapReduce数据处理框架下的隐私保护方法，属于大数据领域，本发明专利技术执行过程分为以下三步：（1）首先用户根据应用环境的特殊性来定义Mapper函数的最大输出范围MaxRange；（2）根据MaxRange和Mapper计算的结果，判断结果是否在MaxRange范围之内：（3）如果在范围之内，则根据差分隐私保护的公式给Mapper的输出结果增加Laplacian噪声，如果不在范围之内，则从MaxRange中随机选取一个数字作为该Mapper的输出结果。这种方法的好处在于减少了执行差分隐私保护的Mapper的个数，降低了算法运行的时间。同时也避免了因为过高或者过低的Mapper输出值导致的噪声过大问题，在满足差分隐私保护规则的同时也提高了查询的精度。

全部详细技术资料下载

【技术实现步骤摘要】
【专利摘要】本专利技术提供，属于大数据领域，本专利技术执行过程分为以下三步：（1）首先用户根据应用环境的特殊性来定义Mapper函数的最大输出范围MaxRange；（2）根据MaxRange和Mapper计算的结果，判断结果是否在MaxRange范围之内：（3）如果在范围之内，则根据差分隐私保护的公式给Mapper的输出结果增加Laplacian噪声，如果不在范围之内，则从MaxRange中随机选取一个数字作为该Mapper的输出结果。这种方法的好处在于减少了执行差分隐私保护的Mapper的个数，降低了算法运行的时间。同时也避免了因为过高或者过低的Mapper输出值导致的噪声过大问题，在满足差分隐私保护规则的同时也提高了查询的精度。【专利说明】-种MapReduce数据处理框架下的隐私保护方法
本专利技术涉及大数据领域，具体涉及一种MapReduce数据处理框架下的隐私保护方法。利用差分隐私保护策略中添加Laplacian噪声的方法来满足Mapper输出结果的隐私保护和利用强制范围检查来剔除恶意代码。
技术介绍
当今，社会信息化和网络化的发展导致数据爆炸式增长。据统计，仅仅就中国的互联网数据量而言，百度每天访问超过10亿次，保持并索引了超过千亿的网页，每天的社交活跃用户超过5亿，共享图片45亿张，阿里巴巴的日交易额查过200亿，日交易峰值达1亿次。同时，科学计算、医疗卫生、金融、零售业等各行业也有大量数据在不断产生。2012年全球信息总量已经达到2. 7ZB，而到2015年这一数值预计会达到8ZB。海量的数据给...

【技术保护点】
一种MapReduce数据处理框架下的隐私保护方法，其特征在于执行过程分为以下三步：（1）首先用户根据应用环境的特殊性来定义Mapper函数的最大输出范围MaxRange；（2）根据MaxRange和Mapper计算的结果，判断结果是否在MaxRange范围之内：（3）如果在范围之内，则根据差分隐私保护的公式给Mapper的输出结果增加Laplacian噪声，如果不在范围之内，则从MaxRange中随机选取一个数字作为该Mapper的输出结果。

【技术特征摘要】

【专利技术属性】
技术研发人员：苏志远，辛国茂，亓开元，刘伟，曹连超，金洪殿，
申请(专利权)人：浪潮电子信息产业股份有限公司，
类型：发明
国别省市：山东;37

全部详细技术资料下载我是这个专利的主人