一种数据管理方法和装置制造方法及图纸

技术编号:26762636 阅读:14 留言:0更新日期:2020-12-18 23:14
本发明专利技术公开了一种数据管理方法和装置,涉及计算机技术领域。该方法的一具体实施方式包括:获取非结构化数据,其中,非结构化数据包括至少一层嵌套关系以及嵌套关系对应的父数据对象和子数据对象;分别为父数据对象和子数据对象生成对应的包括特征信息的结构图;根据嵌套关系,构建父数据对象对应的结构图和子数据对象对应的结构图之间的逻辑关系;基于结构图和逻辑关系,对非结构化数据进行管理。该实施方式有效地提高了非结构化数据管理效率。

【技术实现步骤摘要】
一种数据管理方法和装置
本专利技术涉及计算机
,尤其涉及一种数据管理方法和装置。
技术介绍
在这个互联网数据多样化的时代,有效管理数据是使用数据的基础。比如,将非结构化的数据进行结构化管理,以使这些数据能够更好地在信息搜索、数据安全维护等场景中发挥比较好地作用。目前,主要通过数据库关系表将非结构化数据进行结构化管理,即根据数据库关系表的配置或者结构,将非结构化数据对应填充到相应地关系表中,以得到结构化的数据。在实现本专利技术过程中,专利技术人发现现有技术中至少存在如下问题:由于需要为非结构化数据配置关系表或者为非结构化数据查找相应的关系表,现有的这种对非结构化数据进行结构化管理的方式,操作比较复杂,降低了数据管理效率。
技术实现思路
有鉴于此,本专利技术实施例提供一种数据管理方法和装置,能够基于非结构化数据本身得到包括特征信息的结构图以及父数据对象对应的结构图和子数据对象的结构图之间的逻辑关系,实现对非结构化数据进行更加直观的结构化管理,通过这种结构图和逻辑关系是基于非结构化数据本身得到的,而无需为非结构化数据构建或查找关系复杂的关系表,有效地提高了非结构化数据管理效率。为实现上述目的,根据本专利技术实施例的一个方面,提供了一种数据管理方法,包括:获取非结构化数据,其中,所述非结构化数据包括至少一层嵌套关系以及所述嵌套关系对应的父数据对象和子数据对象;分别为所述父数据对象和所述子数据对象生成对应的包括特征信息的结构图;根据所述嵌套关系,构建所述父数据对象对应的结构图和所述子数据对象对应的结构图之间的逻辑关系;基于所述结构图和所述逻辑关系,对所述非结构化数据进行管理。可选地,分别为所述父数据对象和所述子数据对象生成对应的包括特征信息的结构图,包括:当所述父数据对象或所述子数据对象作为当前数据对象时,为所述当前数据对象生成对应的容器节点;解析所述当前数据对象包括的特征信息,并为所述特征信息构建对应的信息节点;构建所述信息节点与所述容器节点之间的连接关系,得到所述包括特征信息的结构图。可选地,分别为所述父数据对象和所述子数据对象生成对应的包括特征信息的结构图,包括:为所述当前数据对象生成对应的容器节点以及与所述容器节点存在连接关系的多个信息节点,其中,每一个所述信息节点对应一种信息类别;根据所述信息节点对应的信息类别,利用所述当前数据对象包括的特征信息填充所述信息节点,得到所述包括特征信息的结构图。可选地,所述多个信息节点,包括:格式信息节点、类型信息节点、文件基本属性信息节点、文件元信息节点、文本内容信息节点、原始内容信息节点、文档属性信息节点、标签信息节点中的任意多个。可选地,基于所述结构图和所述逻辑关系,对所述非结构化数据进行管理,包括:基于所述容器节点、所述信息节点、所述连接关系以及所述逻辑关系,为所述非结构化数据生成对应的内容解析树;根据所述内容解析树,对所述非结构化数据进行管理。可选地,对所述非结构化数据进行管理,包括:为所述内容解析树匹配对应的安全策略;根据所述内容解析树匹配出的安全策略,对所述非结构化数据进行安全处理。可选地,针对所述嵌套关系为多层的情况,非第一层嵌套关系中的父数据对象为对应的上一层嵌套关系的子数据对象。可选地,根据多层所述嵌套关系,采用递归方式执行分别为所述父数据对象和所述子数据对象生成对应的包括特征信息的结构图的步骤。可选地,数据管理方法,进一步包括:根据预设深度,确定所述递归方式的停止位置。可选地,数据管理方法,进一步包括:为所述当前数据对象确定对应的基本属性,并在所述当前数据对象对应的容器节点存储所述基本属性,其中,所述基本属性包括:所述容器节点在所述内容解析树中的深度以及对应的索引位置。可选地,数据管理方法,进一步包括:在接收到对目标数据对象的查询请求时,根据所述目标数据对象对应的基本属性,从所述内容解析树中,查找所述目标数据对象对应的目标容器节点;提供与所述目标容器节点具有连接关系的信息节点包括的特征信息。第二方面,本专利技术实施例提供一种数据管理装置,包括:获取单元、数据处理单元以及数据管理单元,其中,所述获取单元,用于获取非结构化数据,其中,所述非结构化数据包括至少一层嵌套关系以及所述嵌套关系对应的父数据对象和子数据对象;所述数据处理单元,用于分别为所述获取单元获取到的所述父数据对象和所述子数据对象生成对应的包括特征信息的结构图;根据所述嵌套关系,构建所述父数据对象对应的结构图和所述子数据对象对应的结构图之间的逻辑关系;所述数据管理单元,用于基于所述数据处理单元得到的所述结构图和所述逻辑关系,对所述非结构化数据进行管理。上述专利技术中的一个实施例具有如下优点或有益效果:由于为获取的非结构化数据包括的父数据对象和子数据对象分别生成对应的包括特征信息的结构图,即通过包括特征信息的结构图实现对数据对象(父数据对象或子数据对象)的结构化,并根据父数据对象与子数据对象之间的嵌套关系(一般为子数据对象嵌套于父数据对象中),为结构图之间构建逻辑关系,即能够基于非结构化数据本身得到包括特征信息的结构图以及父数据对象对应的结构图和子数据对象的结构图之间的逻辑关系,实现对非结构化数据进行更加直观的结构化管理,通过这种结构图和逻辑关系是基于非结构化数据本身得到的,而无需为非结构化数据构建或查找关系复杂的关系表,有效地提高了非结构化数据管理效率。上述的非惯用的可选方式所具有的进一步效果将在下文中结合具体实施方式加以说明。附图说明附图用于更好地理解本专利技术,不构成对本专利技术的不当限定。其中:图1是根据本专利技术实施例的数据管理方法的主要流程的示意图;图2是根据本专利技术实施例的非结构化数据对应的内容解析树的示意图;图3是根据本专利技术实施例的生成结构图的主要流程的示意图;图4是根据本专利技术另一实施例的生成结构图的主要流程的示意图;图5是根据本专利技术实施例的管理非结构化数据方法的主要流程的示意图;图6是根据本专利技术实施例的递归方式的主要流程的示意图;图7是根据本专利技术另一实施例的基于内容解析树查询数据的主要流程的示意图;图8是根据本专利技术实施例的数据管理装置的主要单元的示意图;图9是本专利技术实施例可以应用于其中的示例性系统架构图;图10是适于用来实现本专利技术实施例的终端设备或服务器的计算机系统的结构示意图。具体实施方式以下结合附图对本专利技术的示范性实施例做出说明,其中包括本专利技术实施例的各种细节以助于理解,应当将它们认为仅仅是示范性的。因此,本领域普通技术人员应当认识到,可以对这里描述的实施例做出各种改变和修改,而不会背离本专利技术的范围和精神。同样,为了清楚和简明,以下的描述中省略了对公知功能和结构的描述。图本文档来自技高网...

【技术保护点】
1.一种数据管理方法,其特征在于,包括:/n获取非结构化数据,其中,所述非结构化数据包括至少一层嵌套关系以及所述嵌套关系对应的父数据对象和子数据对象;/n分别为所述父数据对象和所述子数据对象生成对应的包括特征信息的结构图;/n根据所述嵌套关系,构建所述父数据对象对应的结构图和所述子数据对象对应的结构图之间的逻辑关系;/n基于所述结构图和所述逻辑关系,对所述非结构化数据进行管理。/n

【技术特征摘要】
1.一种数据管理方法,其特征在于,包括:
获取非结构化数据,其中,所述非结构化数据包括至少一层嵌套关系以及所述嵌套关系对应的父数据对象和子数据对象;
分别为所述父数据对象和所述子数据对象生成对应的包括特征信息的结构图;
根据所述嵌套关系,构建所述父数据对象对应的结构图和所述子数据对象对应的结构图之间的逻辑关系;
基于所述结构图和所述逻辑关系,对所述非结构化数据进行管理。


2.根据权利要求1所述的数据管理方法,其特征在于,分别为所述父数据对象和所述子数据对象生成对应的包括特征信息的结构图,包括:
当所述父数据对象或所述子数据对象作为当前数据对象时,
为所述当前数据对象生成对应的容器节点;
解析所述当前数据对象包括的特征信息,并为所述特征信息构建对应的信息节点;
构建所述信息节点与所述容器节点之间的连接关系,得到所述包括特征信息的结构图。


3.根据权利要求1所述的数据管理方法,其特征在于,分别为所述父数据对象和所述子数据对象生成对应的包括特征信息的结构图,包括:
当所述父数据对象或所述子数据对象作为当前数据对象时,
为所述当前数据对象生成对应的容器节点以及与所述容器节点存在连接关系的多个信息节点,其中,每一个所述信息节点对应一种信息类别;
根据所述信息节点对应的信息类别,利用所述当前数据对象包括的特征信息填充所述信息节点,得到所述包括特征信息的结构图。


4.根据权利要求3所述的数据管理方法,其特征在于,
所述多个信息节点,包括:格式信息节点、类型信息节点、文件基本属性信息节点、文件元信息节点、文本内容信息节点、原始内容信息节点、文档属性信息节点、标签信息节点中的任意多个。


5.根据权利要求1至4任一所述的数据管理方法,其特征在于,基于所述结构图和所述逻辑关系,对所述非结构化数据进行管理,包括:
基于所述容器节点、所述信息节点、所述连接关系以及所述逻辑关系,为所述非结构化数据生成对应的内容解析树;
根据所述内容解析树,对所述非结构化数据进行管理。


6.根据权利要求5所述的数据管理方法,其特征在于,对所述非结构化数据进行管理,包括:
为所述内容解析树匹配对应的安全策略;
根据所述内容解析树匹配出的安全策略,对所述非结构化数据进行安全...

【专利技术属性】
技术研发人员:李仕毅徐旭军张树民
申请(专利权)人:北京天空卫士网络安全技术有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1