大数据环境下保护用户隐私的数据管理方法技术

技术编号:17655518 阅读:46 留言:0更新日期:2018-04-08 08:41
本发明专利技术涉及一种大数据环境下保护用户隐私的数据管理方法,包括:明确原始数据库中需要隐藏的用户隐私数据;将需要隐藏的隐私数据用随机数据替换,形成一个隐私保护表,同时建立一个随机数据与隐私数据相对应的隐私对应表;将所述隐私保护表和所述隐私对应表组成的隐私保护数据库替代原始数据库,供大数据分析使用。本发明专利技术在保证大数据的分析操作的同时,为原始数据提供方提供了保留了对自身重要数据的管理权,同时为保护用户隐私提供保障。

【技术实现步骤摘要】
大数据环境下保护用户隐私的数据管理方法
本专利技术涉及数据库管理的
,尤其是指一种大数据环境下保护用户隐私的数据管理方法。
技术介绍
大数据是一种战略资源,在当今社会和经济发展中发挥着越来越重要的作用,优化大数据环境可以为企业等带来巨大的经济效益。随着大数据技术的发展,电力企业迫切希望利用大数据技术挖掘自身电力数据的价值,为指导业务发展提供服务和支撑。近年来,在《网络安全法》发布后,国家把公民个人隐私的保护提高到了法律的高度,公民的个人信息已构成了大数据的一个重要部分,因此对目前大数据业务的开展带来了很大的冲击。由于在大数据应用中,所有用户数据都保存在“大数据平台”中,以供分析比对。这种操作方式使得不同的数据所有者(电力企业的各业务部门)失去了对各自业务数据的“控制”能力,难以贯彻对用户隐私保护的承诺。而大数据平台也很难应对多家数据所有者的数据保护要求。为了克服上述问题,现有中国专利技术专利(CN106254389A)公开了一种大数据安全管理方法及系统,包括:接收用户数据以及隐私设定需求,根据用户数据的来源生成该用户数据相应的用户标识;所述用户数据包括若干个逻辑模块;根据隐私设定需求对相应的逻辑模块进行加密;接收用户端的访问请求,访问请求包括筛选条件;从所有用户数据中筛选出符合筛选条件的用户数据为目标数据;将该目标数据所对应的用户标识匿名为匿名标识;将该匿名标识和目标数据发送至用户端。上述根据用户需求对部分逻辑模块进行加密,将用户隐私数据进行隐藏,并且对发送给用户端的用户标识进行匿名,因此避免了个人信息公开流通,但是这种加密的方式往往会对数据分析造成影响,使大数据分析结果“失真”,从而影响大数据分析的效果。
技术实现思路
为此,本专利技术所要解决的技术问题在于克服现有技术中在保护隐私数据的同时影响大数据分析效果的问题从而提供一种有效保护用户隐私数据且保证大数据分析效果的大数据环境下保护用户隐私的数据管理方法。为解决上述技术问题,本专利技术的一种大数据环境下保护用户隐私的数据管理方法,对涉及用户隐私的数据进行防护处理,包括如下步骤:步骤S1:明确原始数据库中需要隐藏的用户隐私数据;步骤S2:将需要隐藏的隐私数据用随机数据替换,形成一个隐私保护表,同时建立一个随机数据与隐私数据相对应的隐私对应表;步骤S3:将所述隐私保护表和所述隐私对应表组成的隐私保护数据库替代所述原始数据库,供大数据分析使用。在本专利技术的一个实施例中,所述隐私保护表中,将存在隐私数据的相关列的字段类型设置为varchar变长字符类型。在本专利技术的一个实施例中,所述隐私保护数据库中建立随机值表,且所述随机值表中存储系统随机产生的多位字符。在本专利技术的一个实施例中,所述多位字符的位数根据需要自行设定。在本专利技术的一个实施例中,所述随机值表定期更新,用新的随机值替换所述隐私保护表和所述隐私对应表中的随机标识。在本专利技术的一个实施例中,所述隐私数据保护库中替代隐私数据的随机值由系统按照顺序从所述随机值表中选取。在本专利技术的一个实施例中,所述随机值由系统按照顺序从所述随机值表中选取时,在同一数据库中的随机值表中的随机标识循环使用。在本专利技术的一个实施例中,所述隐私保护表允许自由访问,所述隐私对应表只允许业务部门访问。在本专利技术的一个实施例中,所述业务部门对数据分析员提出的查询请求采取以下三种响应方式:拒绝反馈用户隐私数据;反馈用户隐私数据;仅反馈对隐私数据的处理结果。在本专利技术的一个实施例中,所述数据分析人员通过所述原始数据库直接访问各个隐私保护数据库中的公开数据和所述隐私保护表,并在资源池中对数据进行处理。本专利技术的上述技术方案相比现有技术具有以下优点:本专利技术所述的大数据环境下保护用户隐私的数据管理方法,在大数据应用的背景下,利用隐私数据和随机数据与隐私数据相对应的隐私对应表保护用户隐私数据,通过保护所述隐私对应表实现对隐私数据的保护,并为业务数据的所有者保留其对数据的管理权限提供了一种有效的解决方案。在保证大数据分析效果的同时,本专利技术通过将原始数据库中重要用户的隐私数据转化为无意义的随机数据标识实现对用户隐私的保护,其中无意义的随机数据标识可隐藏用户隐私;通过将随机数据标识进行动态更新,防止用户隐私被通过推理的方式泄露。在原始数据库中统一保存各业务部门数据,为众多数据分析人员提供基础数据的环境下,通过所述隐私保护表和隐私对应表的设计允许数据的所有者随意指定需要保护的隐私数据。同时,还允许业务部门以表格为单位细粒度的划分隐私数据的读取权限。通过随机数据标识的设计和定期重新生成随机值表及隐私数据库的机制,防止被数据分析人员通过分析比对,猜测被随机数据替代隐私数据的风险。附图说明为了使本专利技术的内容更容易被清楚的理解,下面根据本专利技术的具体实施例并结合附图,对本专利技术作进一步详细的说明,其中图1是本专利技术大数据环境下保护用户隐私的数据管理方法流程图;图2是本专利技术大数据平台中隐私保护数据库的管理。具体实施方式如图1所示,本实施例提供一种大数据环境下保护用户隐私的数据管理方法,对涉及用户隐私的数据进行防护处理,包括如下步骤:步骤S1:明确原始数据库中需要隐藏的用户隐私数据;步骤S2:将需要隐藏的隐私数据用随机数据替换,形成一个隐私保护表,同时建立一个随机数据与隐私数据相对应的隐私对应表;步骤S3:将所述隐私保护表和所述隐私对应表组成的隐私保护数据库替代所述原始数据库,供大数据分析使用。本实施例所述大数据环境下保护用户隐私的数据管理方法,对涉及用户隐私的数据进行防护处理,包括如下步骤:所述步骤S1中,明确原始数据库中需要隐藏的用户隐私数据,允许数据的所有者随意指定需要保护的隐私数据;所述步骤S2中,将需要隐藏的隐私数据用随机数据替换,形成一个隐私保护表,由于用户的隐私数据转化为无意义的随机数据标识,实现了隐藏用户的隐私,同时建立一个随机数据与隐私数据相对应的隐私对应表,以方便后期查询,从而实现了对用户隐私的保护;所述步骤S3中,将所述隐私保护表和所述隐私对应表组成的隐私保护数据库替代所述原始数据库,供大数据分析使用,保证了大数据的分析操作,为原始数据提供方提供了保留了对自身重要数据的管理权,并且为保护用户隐私提供了保障。下面以原始数据库中的一个原表格Table1为例详细介绍如何形成隐私保护表以及建立隐私对应表:先将原表格Table1的数据复制到隐私保护表Table1`中,再将需要隐藏的隐私数据用随机值进行替换(表中加粗标记部分),具体地,若原表格Table1中的V21、V22、V23、V24、V32、V42、V44这七组数据需要隐藏,对应在隐私保护表中,这七组数据对应的位置分别替换为S1、S2、S3、S4、S5、S6、S7,同时新建一个随机数据标识与真实隐私数据的隐私对应表Table1s,即:所述S1对应V21、所述S2对应V22、所述S3对应V23、所述S4对应V24、所述S5对应V32、所述S6对应V42、所述S7对应V44,从而方便后期查询,如下表所示:每个存在需要保护隐私数据的表格都进行上述处理,使新生成的隐私保护表Table1`和所述隐私对应表Table1s组成新的数据库:隐私保护数据库,并把新的隐私保护数据库提交给所述原始数据库中,以供大数据分析。在所述隐私保护数据库中本文档来自技高网
...
大数据环境下保护用户隐私的数据管理方法

【技术保护点】
一种大数据环境下保护用户隐私的数据管理方法,对涉及用户隐私的数据进行防护处理,其特征在于,包括如下步骤:步骤S1:明确原始数据库中需要隐藏的用户隐私数据;步骤S2:将需要隐藏的隐私数据用随机数据替换,形成一个隐私保护表,同时建立一个随机数据与隐私数据相对应的隐私对应表;步骤S3:将所述隐私保护表和所述隐私对应表组成的隐私保护数据库替代所述原始数据库,供大数据分析使用。

【技术特征摘要】
1.一种大数据环境下保护用户隐私的数据管理方法,对涉及用户隐私的数据进行防护处理,其特征在于,包括如下步骤:步骤S1:明确原始数据库中需要隐藏的用户隐私数据;步骤S2:将需要隐藏的隐私数据用随机数据替换,形成一个隐私保护表,同时建立一个随机数据与隐私数据相对应的隐私对应表;步骤S3:将所述隐私保护表和所述隐私对应表组成的隐私保护数据库替代所述原始数据库,供大数据分析使用。2.根据权利要求1所述大数据环境下保护用户隐私的数据管理方法,其特征在于:所述隐私保护表中,将存在隐私数据的相关列的字段类型设置为varchar变长字符类型。3.根据权利要求2所述大数据环境下保护用户隐私的数据管理方法,其特征在于:所述隐私保护数据库中建立随机值表,且所述随机值表中存储系统随机产生的多位字符。4.根据权利要求3所述大数据环境下保护用户隐私的数据管理方法,其特征在于:所述多位字符的位数根据需要自行设定。5.根据权利要求3所述大数据环境下保护用户隐私的数据管理方法,其特征在于:所述随机值表定期更新,用新的随机...

【专利技术属性】
技术研发人员:范永朱朝阳周亮王晓蓉王新迎
申请(专利权)人:中国电力科学研究院有限公司国网江苏省电力公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1