当前位置: 首页 > 专利查询>清华大学专利>正文

基于标识符技术的层次化结构数据的存储、解析方法及系统技术方案

技术编号:18894472 阅读:39 留言:0更新日期:2018-09-08 10:57
本发明专利技术提供了一种基于标识符技术的层次化结构数据的存储、解析方法及系统,所述的存储方法包括:从层次化结构数据的根节点开始,对于每一个层级的每一个节点,采用对应的两个控制字符对当前节点以及当前节点下的所有子节点的属性数据进行打包描述,对每一个节点均采用相同的方法进行递归打包描述,直到所有的叶子节点均打包描述完毕,形成所有节点的存储结构。对于所述存储结构中的每一个节点本身的属性数据,采用标识符技术,将所述属性数据按照顺序存储或者按照多字段数据表结构进行存储。本发明专利技术通过扩展现有的标识符表示方法,在自动识别标签中实现层次化结构数据的存储,实现层次化结构数据的灵活、高效存储。

Storage and parsing method and system of hierarchical structure data based on identifier Technology

The invention provides a storage, parsing method and system of hierarchical data based on identifier technology. The storage method includes: starting from the root node of hierarchical data, for each node of each hierarchy, two corresponding control characters are used to the current node and the place under the current node. The attribute data with sub-nodes are described by packaging, and each node is described by the same method of recursive packaging until all leaf nodes are packaged and described, forming the storage structure of all nodes. For the attribute data of each node in the storage structure, the attribute data is stored sequentially or in the multi-field data table structure by the identifier technology. By extending the existing identifier representation method, the invention realizes the storage of hierarchical structure data in the automatic identification tag, and realizes the flexible and efficient storage of hierarchical structure data.

【技术实现步骤摘要】
基于标识符技术的层次化结构数据的存储、解析方法及系统
本专利技术涉及数据存储
,更具体地,涉及一种基于标识符技术的层次化结构数据的存储、解析方法及系统。
技术介绍
在二维条码、射频识别等自动识别标签的各类应用中,由于标签存储空间有限,因而在有限的标签存储空间中存储尽可能多的结构化数据变得尤其重要。层次化结构数据是具有树状结构特点的一种结构化数据集合,如物流领域中一个集装箱内可以存放多个运输托盘,其中每个运输托盘上可存放多个运输包装箱,每个运输包装箱中又可能包装一个或者多个单件物品,这种结构特点的运输数据物资明细数据就是一种层次化结构的数据集合,这些层次化结构数据通常需要在集装箱运输标签中进行描述。目前可对层次化结构数据进行描述的方法有电子数据交换EDI(ElectronicDataInterchange)和可扩展标识语言XML(extensibleMarkupLanguage)等方法,由于这些方法存储额外的附加格式信息所占字节数太多,表达效率很低,适合在网络空间中存储和交换数据,并不适合在存储空间有限的二维条码、射频识别等自动识别标签中来存储层次化结构的数据。当前在自动识别标签介质中存储数据的常用方法,主要有固定模板结构、TLV结构和标识符结构等三类。固定模板结构如GS1组织提出的GlobalEPC编码以及用户自定义方式等方式,其中EPC编码数据格式定义了64位、96位、128位等固定结构模板的数据编码格式,该编码方式不具有扩展性,不能够存储层次化的结构数据。TLV结构是标准ISO/IEC8825-1-2008提出的一种在智能卡中存储数据的方法,主要是采用“Tag-Length-Value”三元组来描述基础元数据的标签ID、数据长度和元数据对应数值,多个三元组直接顺序组合来存储,该方法并没有提供存储层次化结构数据的方法和机制。标识符技术存储方法是一种非常灵活的数据存储方法,它可以动态组合元数据及其数值的存储方式,主流方式分别是ISO/IEC15418-2009以及中国标准GB/T16986-2009规定的应用标识符和美国ANSIMH10.8.3规定的数据标识符,标识符方法主要是采用“ID-Value”结构的二元组来描述基础元数据的标识符ID号及其对应的数值,ID号可关联上位机信息系统定义的元数据字典中的某个元数据。该方法可通过多个二元组顺序组合来存储多个元数据及其数值,二元组之间采用特定分隔符进行分隔。但目前该方法并没有给出对于层次化结构数据的存储方法,如果需要存储结构化数据,只能够采取将层次化结构数据还原成表格记录数据进行存储,这样会大量重复存储一些相同数据和相关标识符,造成了自动识别标签中数据存储效率的降低。
技术实现思路
本专利技术提供一种克服上述问题或者至少部分地解决上述问题的一种基于标识符技术的层次化结构数据的存储、解析方法及系统。根据本专利技术的第一个方面,提供了一种基于标识符技术的层次化结构数据的存储方法,包括:从层次化结构数据的根节点开始,对于每一个层级的每一个节点,采用对应的两个控制字符对当前节点以及当前节点下的所有子节点的属性数据进行打包描述,对每一个节点均采用相同的方法进行递归打包描述,直到所有的叶子节点均打包描述完毕,形成所有节点的存储结构;对于所述存储结构中的每一个节点本身的属性数据,将所述属性数据采用标识符技术进行存储。在上述技术方案的基础上,本专利技术还可以作如下改进。进一步的,每一个节点包括至少一个属性数据,每一个属性数据包括唯一识别标识符字段和所述标识符字段对应的数值,所述对于所述存储结构中的每一个节点本身的属性数据,将所述属性数据采用标识符技术进行存储具体包括:采用“标识符+对应数值”二元组格式的顺序表示方法对每一个节点本身的属性数据进行存储;或者,采用变长字段记录数据表方法对每一个节点本身的属性数据进行存储;或者,采用定长字段记录数据表方法对每一个节点本身的属性数据进行存储。进一步的,所述采用“标识符+对应数值”二元组格式的顺序表示方法对每一个节点本身的属性数据进行存储具体包括:当节点具有多个属性数据时,将与所述多个属性数据一一对应的多个二元组顺序连接,每相邻两个二元组之间采用第一分隔符进行分隔,其中,每一个属性数据均采用二元组格式进行表示。进一步的,所述采用变长字段记录数据表方法对每一个节点本身的属性数据进行存储具体包括:定义数据表变长表头,所述数据表变长表头的起始行包括多个标识符字段,每一个节点的每一个属性数据均具有对应的标识符字段,其中,每相邻两个标识符字段之间采用第一分隔符进行分隔,在最后一个标识符字段后依次加上第二分隔符和第一分隔符进行标识,表征所述数据表变长表头定义结束;在所述数据表变长表头定义后,顺序存储数据表中的多条数据记录,每一条数据记录由多个标识符字段对应数值依次顺序连接构成,其中,每一个所述数值与数据表变长表头中定义的每一个标识符字段一一对应,每相邻两个数值之间采用第一分隔符进行分隔,每相邻两条数据记录之间采用第二分隔符进行分隔。进一步的,所述采用定长字段记录数据表方法对每一个节点本身的属性数据进行存储具体包括:定义数据表定长表头,所述数据表定长表头的起始行包括多个标识符字段,每一个节点的每一个属性数据均具有对应的标识符字段,其中,每相邻两个标识符字段之间采用第一分隔符进行分隔,在最后一个标识符字段后依次加上两个第二分隔符进行标识,表征所述数据表定长表头定义结束;在所述数据表定长表头定义后,顺序存储数据表中的多条数据记录,其中,每一条数据记录直接由多个标识符字段对应数值依次顺序连接构成,其中,每一个所述数值与数据表变长表头中定义的每一个标识符字段一一对应。根据本专利技术的第二个方面,提供了一种基于标识符技术的层次化结构数据的存储方法,包括:逐行取出存储文件中的字符串,对对应的两个控制字符之间的属性数据字符串建构对应的节点,从叶节点到根节点依次进行递归构建,形成层次化数据结构;对构建出的所述层次化数据结构的每一个节点的属性数据进行解析,最终得到层次化结构数据。进一步的,每一个节点包括至少一个属性数据,每一个属性数据包括唯一识别标识符和与所述标识符字段对应的数值。进一步的,当所述层次化结构数据中的每一个节点的属性数据采用二元组格式的顺序表示方法进行存储时,所述对构建出的所述层次化结构的每一个节点的属性数据进行解析具体包括:对每一个节点的属性数据,以二元组之间的第一分隔符作为标志位进行分割,顺序分割出每一个二元组并进行解析,得到每一个二元组的标识符字段和所述标识符字段对应的数值。进一步的,当所述层次化结构数据中的每一个节点的属性数据采用变长字段记录数据表方法进行存储或者采用定长字段记录数据表方法进行存储时,所述对构建出的所述层次化结构的每一个节点的属性数据进行解析具体包括:数据表表头解析步骤,当识读到第一个第二分隔符时,根据所述第二分隔符之后的分隔符类型确定所述存储文件为变长字段记录数据表方法存储或者定长字段记录数据表方法存储,以及以第一个第二分隔符之前的每一个第一分隔符为标志位进行分割,解析出每一个标识符字段;数据表数据集部分解析步骤,当所述存储文件为变长字段记录数据表方法存储时,对于数据集部分的每一个第二分隔符为标志位解析出每一条数据记录,对于每一本文档来自技高网
...

【技术保护点】
1.一种基于标识符技术的层次化结构数据的存储方法,其特征在于,包括:从层次化结构数据的根节点开始,对于每一个层级的每一个节点,采用对应的两个控制字符对当前节点以及当前节点下的所有子节点的属性数据进行打包描述,对每一个节点均采用相同的方法进行递归打包描述,直到所有的叶子节点均打包描述完毕,形成所有节点的存储结构;对于所述存储结构中的每一个节点本身的属性数据,将所述属性数据采用标识符技术进行存储。

【技术特征摘要】
1.一种基于标识符技术的层次化结构数据的存储方法,其特征在于,包括:从层次化结构数据的根节点开始,对于每一个层级的每一个节点,采用对应的两个控制字符对当前节点以及当前节点下的所有子节点的属性数据进行打包描述,对每一个节点均采用相同的方法进行递归打包描述,直到所有的叶子节点均打包描述完毕,形成所有节点的存储结构;对于所述存储结构中的每一个节点本身的属性数据,将所述属性数据采用标识符技术进行存储。2.根据权利要求1所述的存储方法,其特征在于,每一个节点包括至少一个属性数据,每一个属性数据包括唯一识别标识符字段和所述标识符字段对应的数值,所述对于所述存储结构中的每一个节点本身的属性数据,将所述属性数据采用标识符技术进行存储具体包括:采用“标识符+对应数值”二元组格式的顺序表示方法对每一个节点本身的属性数据进行存储;或者,采用变长字段记录数据表方法对每一个节点本身的属性数据进行存储;或者,采用定长字段记录数据表方法对每一个节点本身的属性数据进行存储。3.根据权利要求2所述的存储方法,其特征在于,所述采用“标识符+对应数值”二元组格式的顺序表示方法对每一个节点本身的属性数据进行存储具体包括:当节点具有多个属性数据时,将与所述多个属性数据一一对应的多个“标识符+对应数值”二元组顺序连接,每相邻两个二元组之间采用第一分隔符进行分隔,其中,每一个属性数据均采用二元组格式进行表示。4.根据权利要求2所述的存储方法,其特征在于,所述采用变长字段记录数据表方法对每一个节点本身的属性数据进行存储具体包括:定义数据表变长表头,所述数据表变长表头的起始行包括多个标识符字段,每一个节点的每一个属性数据均具有对应的标识符字段,其中,每相邻两个标识符字段之间采用第一分隔符进行分隔,在最后一个标识符字段后依次加上第二分隔符和第一分隔符进行标识,表征所述数据表变长表头定义结束;在所述数据表变长表头定义后,顺序存储数据表中的多条数据记录,每一条数据记录由多个标识符字段对应数值依次顺序连接构成,其中,每一个所述数值与数据表变长表头中定义的每一个标识符字段一一对应,每相邻两个数值之间采用第一分隔符进行分隔,每相邻两条数据记录之间采用第二分隔符进行分隔。5.根据权利要求2所述的存储方法,其特征在于,所述采用定长字段记录数据表方法对每一个节点本身的属性数据进行存储具体包括:定义数据表定长表头,所述数据表定长表头的起始行包括多个标识符字段,每一个节点的每一个属性数据均具有对应的标识符字段,其中,每相邻两个标识符字段之间采用第一分隔符进行分隔,在最后一个标识符字段后依次加上两个第二分隔符进行标识,表征所述数据表定长表头定义结束;在所述数据表定长表头定义后,顺序存储数据表中的多条数据记录,其中,每一条数据记录直接由多个标识符字段对应的数值依次顺序连接构成,其中,每一个所述数值与数据表变长表头中定...

【专利技术属性】
技术研发人员:罗五明王继良曹志超刘云浩
申请(专利权)人:清华大学
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1