一种XML文档脱敏的方法及装置制造方法及图纸

技术编号:22532231 阅读:62 留言:0更新日期:2019-11-13 09:26
本发明专利技术公开了一种XML文档脱敏的方法及装置,涉及计算机技术领域,其方法包括:XML文档脱敏装置解析待脱敏XML文档,得到XML文档树结构;所述XML文档脱敏装置根据预存的脱敏策略对所述XML文档树结构中包含敏感数据的数据节点分别进行数据脱敏处理,得到多个数据节点的脱敏数据片段;所述XML文档脱敏装置对所述多个数据节点的脱敏数据片段进行重组处理,得到脱敏后的XML文档。本发明专利技术通过灵活设置脱敏策略,有效保护XML中的敏感数据,适用于实时或者离线的XML数据脱敏场景。

A method and device for desensitizing XML documents

The invention discloses a method and device for desensitizing XML document, which relates to the field of computer technology. The method includes: the XML document desensitization device parses the XML document to be desensitized to obtain an XML document tree structure; the XML document desensitization device performs data desensitization processing on the data nodes containing sensitive data in the XML document tree structure according to the pre stored desensitization strategy to obtain a plurality of numbers According to the desensitized data segment of the node, the XML document desensitization device reorganizes the desensitized data segments of the multiple data nodes to obtain the desensitized XML document. The invention can effectively protect sensitive data in XML by flexibly setting desensitization strategy, and is suitable for real-time or offline XML data desensitization scenarios.

【技术实现步骤摘要】
一种XML文档脱敏的方法及装置
本专利技术涉及计算机
,特别涉及一种XML(ExtensibleMarkupLanguage,可扩展标记语言)文档脱敏的方法及装置。
技术介绍
XML一种类似于HTML(HyperTextMarkupLanguage,超文本标记语言)的语言,XML格式统一,跨平台和语言,早已成为业界公认的数据交换标准。XML文档是一种树结构,它从“根”开始,然后扩展到“枝叶”。节点树中的节点彼此之间都有等级关系,可以在不了解树的确切结构且不了解其中包含的数据类型的情况下,对其进行遍历。以下面的XML片段为例:<bookstore><bookcategory="历史"><titlelang="cn">上下五千年</title><author>张三</author><year>2017</year><price>99.99</price></book></bookstore>在上面的XML生成的树片段如图1所示,<title>元素是<book>元素的第一个子节点,而<price>元素是<book>元素的最后一个子节点。<book>元素是<title>、<author>、<year>以及<price>元素的父节点。随着移动互联网的快速发展,网络中的信息量呈现出爆炸型增长。然而由于网络应用程序本身的缺陷加上管理上的疏忽,越来越多的敏感信息暴露于数据交换过程中。比如XML中保存了比如家庭住址、电话号码、身份证号、工作单位等等,会严重暴露用户的隐私。目前,在现有技术中,针对XML中的敏感数据脱敏技术问题,业界尚未提出有效的解决方案。
技术实现思路
根据本专利技术实施例提供的方案解决的技术问题是无法保护XML中敏感数据。根据本专利技术实施例提供的一种XML文档脱敏的方法,包括:XML文档脱敏装置解析待脱敏XML文档,得到XML文档树结构;所述XML文档脱敏装置根据预存的脱敏策略对所述XML文档树结构中包含敏感数据的数据节点分别进行数据脱敏处理,得到多个数据节点的脱敏数据片段;所述XML文档脱敏装置对所述多个数据节点的脱敏数据片段进行重组处理,得到脱敏后的XML文档。优选地,还包括所述XML文档脱敏装置生成并保存所述待脱敏的XML文档的脱敏策略包括:所述XML文档脱敏装置解析待脱敏XML文档,得到XML文档树结构;所述XML文档脱敏装置通过对XML文档树结构中的每个数据节点进行数据分析,得到所述XML文档树结构中含有敏感数据的数据节点集;所述XML文档脱敏装置对所述含有敏感数据的数据节点集中的每个数据节点设置脱敏算法,生成所述待脱敏XML文档的脱敏策略,并将所述脱敏策略保存至脱敏数据库中。优选地,所述XML文档脱敏装置对所述含有敏感数据的数据节点集中的每个数据节点设置脱敏算法包括:所述XML文档脱敏装置获取每个数据节点的数据类型;所述XML文档脱敏装置根据数据类型与脱敏算法的对应关系,为每个数据节点设置脱敏算法。优选地,所述XML文档脱敏装置根据预存的脱敏策略对所述XML文档树结构中包含敏感数据的数据节点分别进行数据脱敏处理,得到多个数据节点的脱敏数据片段包括:所述XML文档脱敏装置通过依次对所述XML文档树结构中的每个数据节点进行数据分析;若所述数据节点包含敏感数据,则所述XML文档脱敏装置根据预存的脱敏策略对所述数据节点进行数据脱敏处理,得到所述数据节点的脱敏数据片段。优选地,所述XML文档脱敏装置根据预存的脱敏策略对所述数据节点进行数据脱敏处理,得到所述数据节点的脱敏数据片段包括:所述XML文档脱敏装置根据待脱敏XML文档,从脱敏数据库中读取所述待脱敏XML文档相对应的脱敏策略;所述XML文档脱敏装置根据所述数据节点,从所述脱敏策略中查找所述数据节点的脱敏算法;所述XML文档脱敏装置根据所述脱敏算法对所述数据节点进行数据脱敏处理,得到所述数据节点的脱敏数据片段。根据本专利技术实施例提供的一种XML文档脱敏的装置,包括:解析模块,用于解析待脱敏XML文档,得到XML文档树结构;数据脱敏模块,用于根据预存的脱敏策略对所述XML文档树结构中包含敏感数据的数据节点分别进行数据脱敏处理,得到多个数据节点的脱敏数据片段;重组模块,用于对所述多个数据节点的脱敏数据片段进行重组处理,得到脱敏后的XML文档。优选地,还包括生成脱敏策略模块,具体用于解析待脱敏XML文档,得到XML文档树结构,并通过对XML文档树结构中的每个数据节点进行数据分析,得到所述XML文档树结构中含有敏感数据的数据节点集,以及对所述含有敏感数据的数据节点集中的每个数据节点设置脱敏算法,生成所述待脱敏XML文档的脱敏策略,并将所述脱敏策略保存至脱敏数据库中。优选地,所述数据脱敏模块包括:判断单元,用于通过依次对所述XML文档树结构中的每个数据节点进行数据分析;数据脱敏单元,用于在所述数据节点包含敏感数据时,根据预存的脱敏策略对所述数据节点进行数据脱敏处理,得到所述数据节点的脱敏数据片段。根据本专利技术实施例提供的一种XML文档脱敏的设备,所述设备包括:处理器,以及与所述处理器耦接的存储器;所述存储器上存储有可在所述处理器上运行的XML文档脱敏的程序,所述XML文档脱敏的程序被所述处理器执行时实现根据本专利技术实施例提供的XML文档脱敏的方法的步骤。根据本专利技术实施例提供的一种计算机存储介质,存储有XML文档脱敏的程序,所述XML文档脱敏的程序被处理器执行时实现根据本专利技术实施例提供的XML文档脱敏的方法的步骤。根据本专利技术实施例提供的方案,与现有方法相比,能够灵活设置脱敏策略,有效保护XML中的敏感数据,适用于实时或者离线的XML数据脱敏场景。附图说明图1是现有技术提供的XML文档树结构示意图;图2是本专利技术实施例提供的一种XML文档脱敏的方法流程图;图3是本专利技术实施例提供的一种XML文档脱敏的装置示意图;图4是本专利技术实施例提供的XML文档脱敏装置的示意图;图5是本专利技术实施例提供的实施例1的XML文档脱敏流程图;图6是本专利技术实施例提供的实施例1脱敏策略设置示意图;图7是本专利技术实施例提供的实施例2的XML脱敏流程图;图8是本专利技术实施例提供的实施例3的XML脱敏流程图;图9是本专利技术实施例提供的实施例4的XML脱敏流程图。具体实施方式以下结合附图对本专利技术的优选实施例进行详细说明,应当理解,以下所说明的优选实施例仅用于说明和解释本专利技术,并不用于限定本专利技术。图2是本专利技术实施例提供的一种XML文档脱敏的方法流程图,如图2所示,包括:步骤S201:XML文档脱敏装置解析待脱敏XML文档,得到XML文档树结构;步骤S202:所述XML文档脱敏装置根据预存的脱敏策略对所述XML文档树结构中包含敏感数据的数据节点分别进行数据脱敏处理,得到多个数据节点的脱敏数据片段;步骤S203:所述XML文档脱敏装置对所述多个数据节点的脱敏数据片段进行重组处理,得到脱敏后的XML文档。本专利技术实施例还包括所述XML文档脱敏装置生成并保存所述待脱敏的本文档来自技高网
...

【技术保护点】
1.一种XML文档脱敏的方法,包括:XML文档脱敏装置解析待脱敏XML文档,得到XML文档树结构;所述XML文档脱敏装置根据预存的脱敏策略对所述XML文档树结构中包含敏感数据的数据节点分别进行数据脱敏处理,得到多个数据节点的脱敏数据片段;所述XML文档脱敏装置对所述多个数据节点的脱敏数据片段进行重组处理,得到脱敏后的XML文档;其中,所述XML是指可扩展标记语言。

【技术特征摘要】
1.一种XML文档脱敏的方法,包括:XML文档脱敏装置解析待脱敏XML文档,得到XML文档树结构;所述XML文档脱敏装置根据预存的脱敏策略对所述XML文档树结构中包含敏感数据的数据节点分别进行数据脱敏处理,得到多个数据节点的脱敏数据片段;所述XML文档脱敏装置对所述多个数据节点的脱敏数据片段进行重组处理,得到脱敏后的XML文档;其中,所述XML是指可扩展标记语言。2.根据权利要求1所述的方法,还包括所述XML文档脱敏装置生成并保存所述待脱敏的XML文档的脱敏策略,包括:所述XML文档脱敏装置解析待脱敏XML文档,得到XML文档树结构;所述XML文档脱敏装置通过对XML文档树结构中的每个数据节点进行数据分析,得到所述XML文档树结构中含有敏感数据的数据节点集;所述XML文档脱敏装置对所述含有敏感数据的数据节点集中的每个数据节点设置脱敏算法,生成所述待脱敏XML文档的脱敏策略,并将所述脱敏策略保存至脱敏数据库中。3.根据权利要求2所述的方法,所述XML文档脱敏装置对所述含有敏感数据的数据节点集中的每个数据节点设置脱敏算法包括:所述XML文档脱敏装置获取每个数据节点的数据类型;所述XML文档脱敏装置根据数据类型与脱敏算法的对应关系,为每个数据节点设置脱敏算法。4.根据权利要求1所述的方法,所述XML文档脱敏装置根据预存的脱敏策略对所述XML文档树结构中包含敏感数据的数据节点分别进行数据脱敏处理,得到多个数据节点的脱敏数据片段包括:所述XML文档脱敏装置通过依次对所述XML文档树结构中的每个数据节点进行数据分析;若所述数据节点包含敏感数据,则所述XML文档脱敏装置根据预存的脱敏策略对所述数据节点进行数据脱敏处理,得到所述数据节点的脱敏数据片段。5.根据权利要求4所述的方法,所述XML文档脱敏装置根据预存的脱敏策略对所述数据节点进行数据脱敏处理,得到所述数据节点的脱敏数据片段包括:所述XML文档脱敏装置根据待脱敏XML文档,从脱敏数据库中读取所述待脱敏XML文档相对应的脱敏策略;所述XML文档脱敏装置根据所述数据节点,从所述脱敏策略中查找所述数据节点的脱敏算法;所述XML文档脱敏装置根据所述脱敏算法对所述数据节点进行数据脱敏处理,得到所述数据节点的脱敏...

【专利技术属性】
技术研发人员:牛家浩张强
申请(专利权)人:中兴通讯股份有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1