The invention discloses a storage method and system of large data structure based on data desensitization. The method includes the following steps: (1) capturing different user data in a large data platform through a sensitive information scanning engine mechanism, and dividing the captured data into public data and user private data; and (2) encrypting the user private data through a user terminal; The formed key is stored in the user terminal; Firstly, the public data is encrypted after data desensitization through the cloud server side, the generated key and encryption and decryption rules are stored in the user terminal, and the encrypted ciphertext is stored in the cloud server side. The invention realizes that the powerful storage capacity of the cloud platform can be utilized and the burden of the cloud server can be reduced. The user's private data is stored in the client by encryption method, which greatly reduces the risk of user's private data leakage.
【技术实现步骤摘要】
一种基于数据脱敏的大数据构造存储方法及系统
本专利技术涉及大数据处理
,特别是涉及一种基于数据脱敏的大数据构造存储方法。
技术介绍
随着信息技术与互联网技展和普及与互联网技术的发展和普及,云计算数据存储的安全性问题已引起学术界和商业界的广泛关注,如何确保数据存储的安全成为关注的焦点,信息的安全问题日益突出。现在,主流的关于数据的安全存储基本上是围绕着数据保密存储,安全审计,密文访问控制等三个领域展开,现在主流的安全存储技术主要包括同态加密技术、基于VMM保护技术,其中,同态加密技术关注的是数据处理安全,同态加密提供了一种对加密数据进行处理的功能,也就是说,其他人可以对加密数据进行处理,但是处理过程不会泄露任何原始内容,同时,拥有密钥的用户对处理过的数据进行解密后,得到的正好是处理后的结果;基于VMM保护技术的显著特点是将云端的操作系统和分布式文件系统进行了隔离,数据加解密由虚拟机监控系统来完成,实现了操作系统和用户数据的隔离。清华大学薛矛在其发表在计算机学报的期刊“一种云存储环境下的安全存储系统”中提出了一种新的安全云存储系统架构,基于这套架构,文中设计并实 ...
【技术保护点】
1.一种基于数据脱敏的大数据构造存储方法,包括如下步骤:步骤S1,通过敏感信息扫描引擎机制,抓取大数据平台中的不同用户数据,并将抓取的数据分为公有数据和用户私有数据;步骤S2,将所述用户私有数据通过用户终端进行加密,并将形成的密钥存储于所述用户终端;步骤S3,对所述公有数据通过云服务器端进行数据脱敏后进行加密,将产生的密钥和加解密规则存储于用户终端,将加密后的密文存储于云服务器端。
【技术特征摘要】
1.一种基于数据脱敏的大数据构造存储方法,包括如下步骤:步骤S1,通过敏感信息扫描引擎机制,抓取大数据平台中的不同用户数据,并将抓取的数据分为公有数据和用户私有数据;步骤S2,将所述用户私有数据通过用户终端进行加密,并将形成的密钥存储于所述用户终端;步骤S3,对所述公有数据通过云服务器端进行数据脱敏后进行加密,将产生的密钥和加解密规则存储于用户终端,将加密后的密文存储于云服务器端。2.如权利要求1所述的一种基于数据脱敏的大数据构造存储方法,其特征在于:于步骤S1中,执行数据库表结构解析、对抓取的数据格式进行解析分析,获取文本内容并发现其中的敏感数据及其位置信息,将抓取的数据分为公有数据和用户私有数据。3.如权利要求1所述的一种基于数据脱敏的大数据构造存储方法,其特征在于:于步骤S2中,使用对称加密机制对用户私有数据进行加密保存于所述用户终端上,并将产生的密钥也保存于所述用户终端上。4.如权利要求1所述的一种基于数据脱敏的大数据构造存储方法,其特征在于,步骤S3进一步包括:步骤S300,将所述公有数据进行脱敏处理,得到标识数据;步骤S301,将脱敏处理后的标识数据通过加解密规则进行加密,将生成的密钥存储于用户终端,加密后的密文存储于云服务器端,同时将加解密规则也存储于用户终端。5.如权利要求4所述的一种基于数据脱敏的大数据构造存储方法,其特征在于:于步骤S300中,利用极值归一化方法对所述公有数据进行脱敏处理。6.如权利要求5所述的一种基于数据脱敏的大数据构造存储方...
【专利技术属性】
技术研发人员:王国军,文玺,苏命峰,邢萧飞,
申请(专利权)人:广州大学,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。