一种基于深度学习的大数据隐私保护方法技术

技术编号：29401896 阅读：35 留言：0更新日期：2021-07-23 22:39

本发明专利技术公开了一种大数据领域及计算机领域基于深度学习的大数据隐私保护方法,该方法的具体步骤如下S1通过众包方式采集用户数据；S2将采集的用户数据存入云数据库并进行格式统一；S3利用深度学习算法训练出一个特征提取器；S4对特征提取器设置变量因子λ并调整λ数值得到最优解；S5利用训练好的最优λ特征提取器从原始数据中提取特征；S6数据搜集器模块汇总提取后的数据中间表征。本发明专利技术通过提出来一个可以提供隐私保护的数据特征提取器，保证从数据中提取出的特征尽可能少的包含所需要保护的隐私信息，满足隐私安全性需求；同时保证提取的中间特征尽可能多的保留有效的信息，防止大数据时代用户个人信息被滥用。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于深度学习的大数据隐私保护方法
本专利技术涉及大数据领域以及计算机
，公开了大数据领域一种基于深度学习的大数据隐私保护方法。
技术介绍
一方面随着科技的发展，大数据行业发展空前繁荣，但是近年来，各种信息泄露事件频繁发生，引发广泛社会关注。数据共享的时代背景下，如何在数据收集过程中加强隐私保护，防止个人信息被滥用，俨然已成为重要研究课题。，另一方面，计算机技术的发展，深度学习技术日益成为人工智能行业的主流。但深度学习技术依赖大数据集，既需要通过数据集提取特征来学习训练出高效的模型，也需要大量数据集来检验模型的效果。为了平衡大数据特征提取的有效性和个人隐私泄露之间的矛盾，我们提出了一种基于深度学习的大数据隐私保护方法投入使用，以解决上述问题。
技术实现思路
解决的技术问题针对现有的大数据时代用户信息泄露严重，个人隐私保护难的情况，本专利技术的目的在于提供一种基于深度学习的的大数据隐私保护方法，具备在保证用户个人隐私信息不被泄露的同时兼顾数据集特征提取的有效性等优点，以解决上述
技术介绍
中提出的问题。本专利技术的技术方案如下：一种基于深度学习的大数据隐私保护方法包括应对众包数据采集模块、云数据库存储模块、特征提取器模块、数据搜集器模块。所述众包数据采集模块，通过产业众包平台、个人分包、企业分包等形式搜集企业机构或个人的原始信息数据，其中包括但不限于文本、音频、视频等形式。所述云数据库存储模块，根据上述规则每条收集到原始大数据信息进行规则划分，其划分包括对相似信息...

【技术保护点】
1.一种基于深度学习的大数据隐私保护方法，包括众包数据采集模块、云数据库存储模块、特征提取器模块、数据搜集器模块；/n所述众包数据采集模块，根据现有的用户数据搜集途径通过个人分包、公司分包、机构分包以及各类数据众包平台实现用户数据的搜集工作。/n所述云数据库存储模块，用于将每条收集到大数据信息进行规则划分，其划分包括对相似信息进行格式化统一分存入相应云数据库中。/n

【技术特征摘要】
1.一种基于深度学习的大数据隐私保护方法，包括众包数据采集模块、云数据库存储模块、特征提取器模块、数据搜集器模块；
所述众包数据采集模块，根据现有的用户数据搜集途径通过个人分包、公司分包、机构分包以及各类数据众包平台实现用户数据的搜集工作。
所述云数据库存储模块，用于将每条收集到大数据信息进行规则划分，其划分包括对相似信息进行格式化统一分存入相应云数据库中。

2.所述特征提取器模块运用了深度学习算法，利用互信息Mutualinformation思想，目标转化为最优化问题，目标一最小化提取到的特征和隐私信息的互信息也就是它们的交集尽可能小，目标二最大化原始数据和提取特征、隐私属性的联合分布之间的互信息。

3.所述数据搜集器...

【专利技术属性】
技术研发人员：江耀，刘东升，
申请(专利权)人：浙江工商大学，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人