基于具有生命周期的容器的大数据分级脱敏方法和系统技术方案

技术编号:24289906 阅读:51 留言:0更新日期:2020-05-26 20:09
本发明专利技术提供一种基于具有生命周期的容器的大数据分级脱敏方法和系统。所述方法和系统通过对敏感数据进行分级,并通过创建具有生命周期的容器,在所述容器中对不同等级的敏感数据建立不同的分级脱敏模型来实现对数据脱敏的生命周期管理。所述方法和系统通过具有生命周期的容器技术,降低了系统资源消耗及数据传输服务运维工作成本,提高了数据处理与传输的效率,通过建立分级脱敏模型针对不同级别不同层次的敏感数据脱敏使用不同的加密算法,在不改变原数据特征的前提下大大降低了敏感数据被窃取与破解风险,解决了大数据平台在数据安全方面的缺陷,提升了大数据平台的安全性,有效降低了大数据信息泄露风险。

Hierarchical desensitization method and system of big data based on container with life cycle

【技术实现步骤摘要】
基于具有生命周期的容器的大数据分级脱敏方法和系统
本专利技术涉及数据加密
,尤其涉及一种基于具有生命周期的容器的大数据分级脱敏方法和系统。
技术介绍
随着大数据技术的迅猛发展,大量敏感信息积累在企业的信息系统中。企业的正常生产经营极度依赖于信息系统的数据安全保障,一旦信息系统内数据保护不当,导致企业的经营信息、重要人员信息、客户信息、核心产品技术信息等商业机密泄露或被窃取,将造成企业生产经营方面的重大风险与隐患。尤其是企业信息系统中大量涉及企业上下游客户资料、供应链交易明细信息等敏感数据信息,已成为追逐政治或经济利益的网络犯罪集团及个人关注和攻击的主要目标。敏感数据在其生命周期的各个环节,也即数据的产生、存储、应用、交换等环节中均存在被泄露和攻击的风险。因此,加强对企业信息系统中数据的保护力度是有效维护企业自身权益,确保企业保值、增值的必要前提和重要途径。一方面,传统的脱敏技术方法多以静态脱敏为主,设计流程固定,工具能力有限,专用性较强,配置规则复杂,维护困难,而且现有计算机硬件以及破解软件的算法越来越先进,传统的脱敏算法本文档来自技高网...

【技术保护点】
1.一种基于具有生命周期的容器的大数据分级脱敏方法,其特征在于,所述方法包括:/n对预先生成的预脱敏数据进行数据清理生成敏感数据,并识别所述敏感数据以确定敏感数据的第一类型,以及对所述敏感数据进行分级,确定敏感等级;/n对每个敏感等级的第一类型的敏感数据,按照数据使用对象和数据内容价值的不同进行分类,确定每个敏感等级的第一类型的敏感数据的第二类型;/n创建具有生命周期的容器,并基于虚拟出的网络层,向所述容器分配网络地址,根据所述容器的端口信息和向所述容器分配的网络地址,确定并存储所述容器的端口与网络地址的映射关系;/n基于所述容器的端口与网络地址的映射关系,将已经确定等级的敏感数据存储至所述具...

【技术特征摘要】
1.一种基于具有生命周期的容器的大数据分级脱敏方法,其特征在于,所述方法包括:
对预先生成的预脱敏数据进行数据清理生成敏感数据,并识别所述敏感数据以确定敏感数据的第一类型,以及对所述敏感数据进行分级,确定敏感等级;
对每个敏感等级的第一类型的敏感数据,按照数据使用对象和数据内容价值的不同进行分类,确定每个敏感等级的第一类型的敏感数据的第二类型;
创建具有生命周期的容器,并基于虚拟出的网络层,向所述容器分配网络地址,根据所述容器的端口信息和向所述容器分配的网络地址,确定并存储所述容器的端口与网络地址的映射关系;
基于所述容器的端口与网络地址的映射关系,将已经确定等级的敏感数据存储至所述具有生命周期的容器;
根据具有生命周期的容器中存储的敏感数据的第二类型分别配置脱敏算法后建立各自对应的数据脱敏模型;
根据建立的数据脱敏模型对对应第二类型的敏感数据进行脱敏,并将脱敏后的数据存储在具有生命周期的容器中;
响应指定对象发送的数据获取请求,将存储在所述容器中的脱敏后数据传输至所述指定对象,其中,当容器中的数据的存储时长达到预定时长,和/或在将存储至所述容器中的数据传输至所述指定对象之后,则容器的生命周期结束,销毁容器,并删除容器中存储的数据。


2.根据权利要求1所述的方法,其特征在于,所述方法在之前还包括生成预脱敏数据,所述生成预脱敏数据包括:
通过大数据抽取工具提取业务系统中分布的、异构数据源中的源数据,其中,所述源数据包括结构化数据及非结构化数据;
将所述源数据经过清洗、转化、整合、结构化操作后生成预脱敏数据,并传输至大数据存储系统中的脱敏数据库。


3.根据权利要求1所述的方法,其特征在于,对预先生成的预脱敏数据进行数据清理生成敏感数据,并识别所述敏感数据以确定敏感数据的第一类型,以及对所述敏感数据进行分级,确定敏感等级包括:
对所述预先生成的预脱敏数据进行数据清理,消除所述预脱敏数据中的重复值、缺失值和异常值后生成敏感数据;
对所述敏感数据按照数据属性的不同进行划分,确定敏感数据的第一类型;
根据敏感数据的机密性、完整性和可用性评估其安全价值,确定其敏感等级。


4.根据权利要求3所述的方法,其特征在于,所述根据敏感数据的机密性、完整性和可用性评估其安全价值,确定其敏感等级包括:
对敏感数据按照预先设定的每个安全价值评分项的分值区间进行评分,其中,所述安全价值评分项包括敏感数据是否能直接识别出特定的企业对象,与企业对象的实际经营活动状态是否密切相关,通过该数据信息是否能获得其他关联信息,使用该数据信息可能对企业造成潜在经济损失与带来潜在信息威胁的程度;
将所述敏感数据每个安全价值评分项的评分进行求和,确定所述敏感数据的安全价值评分;
根据敏感等级与安全价值评分的对应关系,确定所述敏感数据的敏感等级。


5.根据权利要求1所述的方法,其特征在于,基于所述容器的端口与网络地址的映射关系,将已经确定等级的敏感数据存储至所述具有生命周期的容器包括:
对接收的敏感数据报文的协议字段进行解析,确定敏感数据报文的目的网络地址;
基于网络地址与容器端口的映射关系,确定敏感数据报文的目的网络地址对应的容器端口;
根据敏感数据报文的目的网络地址对应的容器端口,将敏感数据分发至具有生命周期的容器的相应存储位置。


6.根据权利要求1所述的方法,其特征在于,根据具有生命周期的容器中存储的敏感数据的第二类型分别配置脱敏算法后建立各自对应的数据脱敏模型包括:
根据具有生命周期的容器中存储的敏感数据的第二类型分别配置脱敏算法,其中,所述脱敏算法是不可逆的,并且是自动化、可重复的;
基于每种第二类型的敏感数据配置的脱敏算法建立数据脱敏模型,其中,所述数据脱敏模型满足脱敏后的数据具有原数据的特征,且数据的完整性尽可能予以保留,对所有具有关联性及可能生成敏感数据的非敏感字段同样进行脱敏处理,以及可对脱敏后的数据标记敏感等级。


7.一种基于具有生命周期的容器的大数...

【专利技术属性】
技术研发人员:顾津潘竞旭任钦正孙少平鲁龙宋颖陈晓敏
申请(专利权)人:航天信息股份有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1