一种个人信息拆分脱敏存储与重构方法及系统技术方案

技术编号:36558916 阅读:11 留言:0更新日期:2023-02-04 17:13
本发明专利技术涉及数据安全存储技术领域,具体地说,涉及一种个人信息拆分脱敏存储与重构方法及系统,将用户个人信息进行拆分、脱敏并存储在分布式存储系统中;分布式存储系统将对脱敏后的个人信息进行加密索引构建,密文数据分片,数据备份操作;当终端用户通过加密索引检索时,存储系统将在不知道索引关键字的情况下,对分片数据进行分片重组,并返回数据;当服务方获取到加密关键字与个人信息关系后,服务方将采用倒排索引方式重构索引模块,以提升后续检索性能;在用户获取到密文存储数据后,用户本地对文件进行解密回复明文数据。本发明专利技术能较佳地对个人信息拆分脱敏存储与重构。较佳地对个人信息拆分脱敏存储与重构。较佳地对个人信息拆分脱敏存储与重构。

【技术实现步骤摘要】
一种个人信息拆分脱敏存储与重构方法及系统


[0001]本专利技术涉及数据安全存储
,具体地说,涉及一种个人信息拆分脱敏存储与重构方法及系统。

技术介绍

[0002]随着计算机科学与技术的不断发展,信息系统在各行各业中扮演了更加重要的角色。近年来,国家在不断增设各类信息系统的基础上,信息系统的安全性、高可用性也成为了系统的关键部分。利用信息化的方式收集用户数据,管理用户数据已经是政府管理以及人们日常生活中必不可少的一部分。然而,过去的系统往往是单一服务的架构,系统的主要重心更加偏向于功能性,以业务流程为其侧重点。并且由于不同的系统的安全性能不统一,往往导致被保护的数据不能有效的在各个系统中流转,其所能提供的服务范围是有限的,收到了区域性、法律等诸多客观因素的制约。此类系统目前已经远远不能满足政府日常管理数据以及人们日常生活的基本需求。与此同时,人们对于个人隐私数据的安全防范意识逐渐提高,个人信息的存储安全与人们的生活息息相关。因此,亟需一种安全的数据存储方案在应用底层,在保护用户数据不泄漏个人隐私数据的前提下,提供安全、可靠、高可用的服务。
[0003]当前存储服务存在以下问题:
[0004]1、数据明文存储:当前诸多系统仍以明文形式对数据进行存储,仅关注基础服务并忽视了用户隐私的保护。这种方式存在极大的安全隐患,一旦发生数据泄漏,用户隐私将得不到保证,危害用户的切身利益。
[0005]2、数据归属权不属于用户:由于普通用户不具备个人数据存储能力,所以数据往往存储在不同系统当中。一旦用户数据进行上传,用户即丧失了其个人信息的所有权,由于信息没有进行有效的保护,系统可以对数据进行任意的查询、分析、使用等危害用户隐私的行为。
[0006]3、数据服务不能有效的抽象:当前系统拥有各自独立的存储服务,各个系统间形成数据孤岛,使得数据无法有效、安全地流转。而日常生活中,很多数据可以进行统一的存储,服务于多个信息系统以提高数据的使用效率并降低数据在各个系统中的冗余。
[0007]4、服务性能无法保证:由于存储系统不能够统一使用,被各个信息系统私有,因此服务质量良莠不齐。
[0008]总体来说,当前存储系统已经不能够满足数据安全、高效存储的基本需求,亟需具备标准化、统一、安全的存储系统服务,以解决上述问题。

技术实现思路

[0009]本专利技术的内容是提供一种个人信息拆分脱敏存储与重构方法及系统,其能够克服现有技术的某种或某些缺陷。
[0010]根据本专利技术的一种个人信息拆分脱敏存储与重构方法,其包括以下步骤:
[0011]1)初始化阶段:
[0012]本地生成密钥key1以及搜索历史X;
[0013]2)上传数据:
[0014]2.1)用户在本地对个人数据进行加密并提取后续用于检索数据的关键字w
i
,生成与关键字同数量的随机数s
i
同时生成空列表x;使用key1加密关键字w
i
,如果关键字w
i
存在于搜索历史X,将key1(w
i
)添加至x;如果不存在使用HMAC 算法计算密文数据索引c
i
=HMAC
key1(wi)
(s
i
)||s
i

[0015]2.2)将密文数据与密文数据索引以及x上传至存储服务器;
[0016]2.3)服务器将密文索引存储在索引服务器对其进行管理,构建密文索引,密文文件与存储分片的映射关系;服务器将文件进行分片后分布式的存储在不同的存储服务器单元,并对分片数据生成默克尔根用于后续数据完整性校验;所有数据均保证具有存储副本,以保证数据的可用性;
[0017]3)数据检索:
[0018]3.1)当用户检索相关数据时,用户使用加密后的索引,即key1(w
i
);并更新本地搜索历史X;
[0019]3.2)发送key1(w
i
)至服务器;
[0020]3.3)服务器请求索引服务器;
[0021]3.4)索引服务器将通过密文索引进行检索服务,首先检索倒排索引,如果不能匹配文件,再检索正排索引;找到密文文件名后,返回给基础服务器;并更新倒排索引;
[0022]3.5)本地检索文件名与分片数据存储信息的映射关系,发送通知至存储服务器;
[0023]3.6)存储服务器收到通知后,与用户进行通信发送各个数据分片;
[0024]3.7)用户在本地重组密文数据并验证默克尔根以校验数据完整性,并对数据进行解密获取明文数据。
[0025]作为优选,步骤2中,数据拆分存储的方法为:将不同模态数据进行加密脱敏后,采用数据分片策略对脱敏数据进行分割;数据拆分将分为两个部分,每个文件doc将会被拆分成m个分片piece;每个piece是最小的文件共享单位,系统会对每个piece进行完整性校验,确保doc可以被正确恢复;即个人隐私数据将被拆分为如下格式:{"doc_1":[{"piece_1":["location_1",..., "location_n"]},...{"piece_n":["location_1"..."locatio_n"]}]};同时需要索引服务器对文件分片piece的存储位置进行维护;
[0026]当存储行为发生时,用户将数据脱敏后上传到服务器端;服务端将文件分为n个分片piece,每个piece将至少存储在三个存储节点当中;同时,服务端对n个piece生成merkle root用于后续完整性校验;在piece发送至存储节点时,每个piece将分割为block分别进行发送,并通过生成当前n个block的merkle root,用于后续piece的完整性校验;当所有piece都已经合理分配到存储节点后,用户单次的存储流程已经完成。
[0027]作为优选,步骤3中,分片数据重构的方法为:当用户检索后需要恢复数据时,所有分片piece的存储节点位置与用户进行数据交互;存储节点将各个分片piece以block的形式返回给客户端;当客户端收到一个piece的所有分片后,校验当前分片的完整性;当客户端收到所有的piece后,校验当前数据的完整性。
[0028]作为优选,步骤3中,在用户上传个人信息时,用户将提供与信息匹配的关键字w
i
用于后续检索;为保证用户数据在网络传输中的安全与服务端的隐私,用于数据匹配的关键字也将加密,以防止任何第三方窃取用户隐私;在用户上传数据时,用户需要维护一个额外的加密关键字的密钥key以及搜索历史X,此时用户将加密与该文件相关的关键字并将其上传至服务器;
[0029]当用户进行检索时,用户本地生成key(w1);服务端将会匹配归属该用户的所有文件的加密关键字进行匹配;
[0030]同时,对于已经检索过的key(w1),服务端将为其建立倒排索引,当后续再次使用key(w1)进行检索时,服务端将先本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种个人信息拆分脱敏存储与重构方法,其特征在于:包括以下步骤:1)初始化阶段:本地生成密钥key1以及搜索历史X;2)上传数据:2.1)用户在本地对个人数据进行加密并提取后续用于检索数据的关键字w
i
,生成与关键字同数量的随机数s
i
同时生成空列表x;使用key1加密关键字w
i
,如果关键字w
i
存在于搜索历史X,将key1(w
i
)添加至x;如果不存在使用HMAC算法计算密文数据索引c
i
=HMAC
key1(wi)
(s
i
)||s
i
;2.2)将密文数据与密文数据索引以及x上传至存储服务器;2.3)服务器将密文索引存储在索引服务器对其进行管理,构建密文索引,密文文件与存储分片的映射关系;服务器将文件进行分片后分布式的存储在不同的存储服务器单元,并对分片数据生成默克尔根用于后续数据完整性校验;所有数据均保证具有存储副本,以保证数据的可用性;3)数据检索:3.1)当用户检索相关数据时,用户使用加密后的索引,即key1(w
i
);并更新本地搜索历史X;3.2)发送key1(w
i
)至服务器;3.3)服务器请求索引服务器;3.4)索引服务器将通过密文索引进行检索服务,首先检索倒排索引,如果不能匹配文件,再检索正排索引;找到密文文件名后,返回给基础服务器;并更新倒排索引;3.5)本地检索文件名与分片数据存储信息的映射关系,发送通知至存储服务器;3.6)存储服务器收到通知后,与用户进行通信发送各个数据分片;3.7)用户在本地重组密文数据并验证默克尔根以校验数据完整性,并对数据进行解密获取明文数据。2.根据权利要求1所述的一种个人信息拆分脱敏存储与重构方法,其特征在于:步骤2中,数据拆分存储的方法为:将不同模态数据进行加密脱敏后,采用数据分片策略对脱敏数据进行分割;数据拆分将分为两个部分,每个文件doc将会被拆分成m个分片piece;每个piece是最小的文件共享单位,系统会对每个piece进行完整性校验,确保doc可以被正确恢复;...

【专利技术属性】
技术研发人员:吴宇李睿
申请(专利权)人:东莞理工学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1