一种基于结构化数据的脱敏方法、装置与系统制造方法及图纸

技术编号:26377020 阅读:34 留言:0更新日期:2020-11-19 23:45
本发明专利技术公开一种基于结构化数据的脱敏方法、装置与系统,所述方法包括:接收结构化数据,对所述结构化数据进行拆分,生成拆分数据;对拆分数据进行匿名化处理或去标识化处理,生成匿名化拆分数据或去标识化处理数据;组合匿名化拆分数据或去标识化处理数据,生成匿名化数据或去标识化数据。本发明专利技术可对大规模的结构化数据进行脱敏处理,为进一步拓展数据应用,增强数据分析效果提供数据保护方面的有效支持。对于结构化数据脱敏技术,本发明专利技术采用匿名化、去标识化方式对结构化数据进行脱敏,可对结构化数据中敏感字段进行脱敏处理,脱敏的标准为不可对应识别个体信息。脱敏后的数据保证数据的独立性和可区分性。去标识化的数据能够数据恢复。

【技术实现步骤摘要】
一种基于结构化数据的脱敏方法、装置与系统
本专利技术属于文本处理领域,特别涉及一种基于结构化数据的脱敏方法、装置与系统。
技术介绍
随着计算机互联网的技术发展,数据脱敏技术显得越来越重要。科技在不断的发展,信息技术的更新,在信息网络逐渐国际化、开放化和个人化情况下实现了信息共享。网络技术的发展,也让政府和人民越来越依赖网络,但在享用网络资源的同时,也会存在计算机病毒的传播,黑客的入侵,导致数据信息不安全情况的发生,个人隐私无法得到保障。这就要求我们在共享网络资源的同时加强对信息安全的关注。最初的信息加密脱敏技术主要应用于军事、外交等重要领域。但随着计算机技术和电子商务的快速发展,因为在竞争激烈的信息时代,信息不仅给我们带来很大的方便,同样,信息也可以用来对他们构成威胁、造成破坏。目前采用的是以人员管理为主要方式进行数据保护,简单的哈希、假名等方式难于对结构化数据进行有效的脱敏处理。亟待研究面向结构化数据的专用脱敏技术,在保证信息安全业务正常开展的同时,最大程度的对原始结构化数据进行脱敏、脱密、匿名化和去标识化处理,并建立相关的脱敏处理流本文档来自技高网...

【技术保护点】
1.一种基于结构化数据的脱敏方法,其特征在于,/n所述方法包括:/n接收结构化数据,对所述结构化数据进行拆分,生成拆分数据;/n对拆分数据进行匿名化处理或去标识化处理,生成匿名化拆分数据或去标识化处理数据;/n组合匿名化拆分数据或去标识化处理数据,生成匿名化数据或去标识化数据。/n

【技术特征摘要】
1.一种基于结构化数据的脱敏方法,其特征在于,
所述方法包括:
接收结构化数据,对所述结构化数据进行拆分,生成拆分数据;
对拆分数据进行匿名化处理或去标识化处理,生成匿名化拆分数据或去标识化处理数据;
组合匿名化拆分数据或去标识化处理数据,生成匿名化数据或去标识化数据。


2.根据权利要求1所述的脱敏方法,其特征在于,所述接收结构化数据包括:
基于文件模式接收结构化数据、基于数据库方式接收结构化数据、基于消息队列方式接收结构化数据。


3.根据权利要求1所述的脱敏方法,其特征在于,所述结构化数据包括数字类型数据、时间类型数据和字符串类型数据。


4.根据权利要求1所述的脱敏方法,其特征在于,
所述去标识化处理包括:设置去标识化策略并记录;
依照去标识化策略对若干拆分数据进行去标识化处理,生成若干去标识化拆分数据;
所述去标识化拆分数据可以还原,所述还原为去标识化处理逆操作。


5.根据权利要求4所述的脱敏方法,其特征在于,
所述去标识化策略包括:
对数据部分内容进行标识处理;
所述数据部分内容包括:对全部数据、从数据前端开始获取N位字符、从后端开始获取N位字符或从中间开始获取N位字符;
所述标识处理包括:加密处理;
所述加密处理包括:使用UUID生成加密密钥;
使用异或算法加密、使用SM2算法加密或使用SM4算法加密。


6.根据权利要求1所述的脱敏方法,其特征在于,
所述方法还包括对匿名化数据或去标识化数据存储,所述存储包括:以文件方式存储、以数据库方式存储和以消息队列方式存储中的一种或多种;
所述对匿名化数据或去标识化数据存储还包括对存储匿名化策略或存储去标识化策略。


7.一种基于结构化数据的脱敏装置,其特征在于,
所述装置包括:
接收单元,用于接收结构化数据,对所述...

【专利技术属性】
技术研发人员:王佩李扬曦王中华刘科栋刘志会史建文
申请(专利权)人:国家计算机网络与信息安全管理中心天津市国瑞数码安全系统股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1