The invention discloses a method and device for desensitization processing of big government data. The data entity of big government data is serialized into an XML serialized object, and each field node is obtained by reading the XML serialized object. The sensitive data of each field node is desensitized sequentially by preset data desensitization rules, which has strong compatibility and can be conveniently crossed. The system and cross-platform test run can support the direct desensitization of sensitive data in existing databases without changing the existing database storage rules. It can realize data desensitization across systems and between different platforms, and guarantee the privacy, information security and reliability of enterprises and citizens.
【技术实现步骤摘要】
一种政务大数据脱敏处理方法及装置
本公开涉及大数据信息安全领域,具体涉及一种政务大数据脱敏处理方法及装置。
技术介绍
政务大数据广泛分布在教育、企业管理、社保、民政、安全等多个方向的领域,政务大数据的数量大,且多源异构、隐私性与机密性强、附加价值高,因为数据的受众广泛、互联网环境复杂混乱,所以企业及公民的隐私信息外泄和被爬虫软件抓取、泄露的风险很大,而且与泄露的隐私相关的隐私信息很容易导致泄露,数据的安全稳定性难以控制。政务大数据脱敏是指对政务大数据中某些敏感信息(如:统一社会信用代码、企业名称、用户名称、身份证号码、电话号码、邮箱号、银行卡号、IP地址、联系地址)通过脱敏规则进行数据的变形,实现敏感隐私数据的可靠保护。这样,就可以在开发、测试和其它非生产环境以及外包环境中安全地使用脱敏后的真实数据集。这样,就可以在开发、测试和其它非生产环境以及外包环境中安全地使用脱敏后的数据,现有的方法中均无法实现跨系统、在不同的平台间的数据脱敏。
技术实现思路
为解决上述问题,本公开提供一种政务大数据脱敏处理方法及装置,将政务大数据的数据实体进行序列化转化为XML序列化对象,能够实现跨系统、在不同的平台间的数据脱敏、保障企业及公民的隐私信息安全。为了实现上述目的,根据本公开的一方面,提供一种政务大数据脱敏处理方法,所述方法包括以下步骤:步骤1,读取政务大数据的数据实体;步骤2,将政务大数据的数据实体进行序列化转化为XML序列化对象;步骤3,遍历读取XML序列化对象得到各个字段节点;步骤4,通过预置的数据脱敏规则将各个字段节点的敏感数据依次进行数据脱敏。进一步地,在步骤1中 ...
【技术保护点】
1.一种政务大数据脱敏处理方法,其特征在于,所述方法包括以下步骤:步骤1,读取政务大数据的数据实体;步骤2,将政务大数据的数据实体进行序列化转化为XML序列化对象;步骤3,遍历读取XML序列化对象得到各个字段节点;步骤4,通过预置的数据脱敏规则将各个字段节点的敏感数据依次进行数据脱敏。
【技术特征摘要】
1.一种政务大数据脱敏处理方法,其特征在于,所述方法包括以下步骤:步骤1,读取政务大数据的数据实体;步骤2,将政务大数据的数据实体进行序列化转化为XML序列化对象;步骤3,遍历读取XML序列化对象得到各个字段节点;步骤4,通过预置的数据脱敏规则将各个字段节点的敏感数据依次进行数据脱敏。2.根据权利要求1所述的一种政务大数据脱敏处理方法,其特征在于,在步骤1中,所述政务大数据的数据实体至少包括统一社会信用代码、企业名称、用户名称、身份证号码、电话号码、邮箱号、银行卡号、IP地址、联系地址。3.根据权利要求1所述的一种政务大数据脱敏处理方法,其特征在于,在步骤2中,将政务大数据的数据实体进行序列化转化为XML序列化对象包括以下子步骤,步骤2.1,根据政务大数据的数据实体统一社会信用代码或身份证号码创建XML文件的根节点对象,并将该根节点对象插入XML文件的文档对象中,其中,如果政务大数据为企业信息则以统一社会信用代码作为XML文件的根节点对象,如果政务大数据为自然人信息则以身份证号码作为XML文件的根节点对象;步骤2.2,判断政务大数据的数据实体中是否还有下一行数据,如果存在下一行数据,转至步骤2.3,如果不存在下一行数据,转至步骤2.7;步骤2.3,获得政务大数据的数据实体中的数据实体名,设为T,创建以T为元素名的父节点对象,所述数据实体名为统一社会信用代码、企业名称、用户名称、身份证号码、电话号码、邮箱号、银行卡号、IP地址、联系地址;步骤2.4,判断政务大数据的数据实体中是否还有下一个数据实体名,如果存在下一个数据实体名,设为第x个数据实体名,从政务大数据的数据实体中取出存在下一个数据实体名的行中第x个数据值,定义为y,转至步骤2.5继续执行;如果不存在下一个数据实体名,将父节点对象插入根节点对象中,并将y存储到数组A中,转至步骤2.2继续执行,所述数组A,即数组A[i][j]为20行20列的数组,i、j范围为0~19;步骤2.5,创建以数据实体名为元素名的子节点对象;并将数据实体名与数组A中第一...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。