一种非结构化数据解析方法技术

技术编号:17467529 阅读:68 留言:0更新日期:2018-03-15 05:03
本发明专利技术公开了一种非结构化数据解析方法。所述非结构化数据解析方法包括:步骤1:读取非结构化数据格式配置文件,定义三级索引指针,分别为消息块索引指针、信号量索引指针和数据域索引指针;步骤3:自第一个数据条目开始,遍历非结构化数据中的所有条目,通过消息块索引指针、信号量索引指针以及数据域索引指针的配合,将非结构化数据中的各个条目解析成结构化数据格式列表,所述结构化数据格式列表中各个消息块信息依次排列。本申请的非结构化数据解析方法对顺序约束型的非结构化数据格式进行解析,利用配置信息中的冗余数据和配置条目间的约束规则,能够高效地解析配置文件中的数据格式定义条目,并完整地创建对应的结构化数据格式描述信息。

【技术实现步骤摘要】
一种非结构化数据解析方法
本专利技术涉及机载数据应用
,特别是涉及一种非结构化数据解析方法。
技术介绍
非结构化数据格式配置文件采用部分冗余数据和配置间的约束规则来描述复杂的结构化数据信息,避免应用软件对复杂的结构化数据配置信息进行解析处理,降低应用软件的复杂度。如何高效地利用冗余数据和配置间的约束规则,并能够完整地还原对应的结构化数据格式描述信息,是解析和应用非结构化数据格式配置文件的关键技术。因此,希望有一种技术方案来克服或至少减轻现有技术的至少一个上述缺陷。
技术实现思路
本专利技术的目的在于提供一种非结构化数据解析方法来克服或至少减轻现有技术的至少一个上述缺陷。为实现上述目的,本专利技术提供一种非结构化数据解析方法,所述非结构化数据存储在非结构化数据格式配置文件中,所述非结构化数据包括多个条目,每个条目包括一个消息块信息、一个信号量信息以及一个数据域信息;所述非结构化数据包括一个或者多个消息块信息;每个消息块包括一个或多个信号量信息;每个信号量信息包括一个或多个数据域信息;所述非结构化数据解析方法包括如下步骤:步骤1:读取非结构化数据格式配置文件,定义三级索引指针,分别为消息块索引指针、信号量索引指针和数据域索引指针,将消息块索引指针、信号量索引指针以及数据域索引指针均指向非结构化数据格式配置文件内的第一个数据条目,其中,所述消息块索引指针指向所述消息块信息;信号量索引指针指向所述信号量信息;数据域索引指针指向所述数据域信息;步骤2:构建消息块缓存区、信号量缓存区以及数据域缓存区;步骤3:自所述第一个数据条目开始,遍历所述非结构化数据中的所有条目,通过消息块索引指针、信号量索引指针以及数据域索引指针的配合,将所述非结构化数据中的各个条目解析成结构化数据格式列表,所述结构化数据格式列表中各个消息块信息依次排列,且每个消息块内依次排列有属于该消息块信息的信号量信息;每个信号量信息内依次排列有属于该信号量信息的数据域信息。优选地,所述数据域信息包括:配置信息,位域偏移量、位域长度、是否有分辨率、数据域分辨率、应用数据类型。优选地,所述步骤3具体为:步骤31:数据域指针自所述第一个数据条目开始,获取同一信号量信息内的数据域信息并暂存在所述数据域缓存区;直至所述数据域指针将同一信号量信息内的所有数据域信息均缓存至所述数据域缓存区;步骤32:将同一信号量信息内的所有数据域信息缓存至信号量缓存区,并清空所述数据域缓存区;步骤33:当所述数据域指针完成属于同一信号量信息内的数据域信息搜索后,所述信号量索引指针指向所述非结构化数据内的另一个信号量信息,并重复所述步骤31至步骤32,直至所述信号量索引指针完成同一个消息块信息内的所述信号量信息;步骤34:将同一消息块信息内的所有信号量信息缓存至信号块缓存区,并清空所述信号量缓存区;步骤35:当所述信号量指针完成属于同一消息块信息内的信号量信息搜索后,所述消息块信息指向所述非结构化数据内的另一个消息块信息,并重复所述步骤33至34,直至遍历所述消息块信息;步骤36:生成所述结构化数据格式列表。优选地,所述步骤31中的获取同一信号量信息内的数据域信息并暂存在所述数据域缓存区具体为:判断每个数据条目中的数据域信息,并判断该数据域信息内的标识是否与所述消息块索引指针所指向的消息块信息的标识一致且与所述信号量索引指针所指向的信号量信息的标识一致,若是,则认为该数据条目中的数据域信息属于同一信号量信息。本申请的非结构化数据解析方法对顺序约束型的非结构化数据格式进行解析,利用配置信息中的冗余数据和配置条目间的约束规则,能够高效地解析配置文件中的数据格式定义条目,并完整地创建对应的结构化数据格式描述信息。附图说明图1是本申请一实施例的非结构化数据解析方法的流程示意图。图2是图1所示的非结构化数据解析方法中非结构化数据示意图。图3是图1所示的非结构化数据解析方法中获得的结构化数据格式列表的示意图。具体实施方式为使本专利技术实施的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行更加详细的描述。在附图中,自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。下面通过参考附图描述的实施例是示例性的,旨在用于解释本专利技术,而不能理解为对本专利技术的限制。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。下面结合附图对本专利技术的实施例进行详细说明。在本专利技术的描述中,需要理解的是,术语“中心”、“纵向”、“横向”、“前”、“后”、“左”、“右”、“竖直”、“水平”、“顶”、“底”“内”、“外”等指示的方位或位置关系为基于附图所示的方位或位置关系,仅是为了便于描述本专利技术和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本专利技术保护范围的限制。图1是本申请一实施例的非结构化数据解析方法的流程示意图。图2是图1所示的非结构化数据解析方法中非结构化数据示意图。如图1所示的非结构化数据解析方法,所述非结构化数据存储在非结构化数据格式配置文件中,所述非结构化数据包括多个条目,每个条目包括一个消息块信息、一个信号量信息以及一个数据域信息;所述非结构化数据包括一个或者多个消息块信息;每个消息块包括一个或多个信号量信息;每个信号量信息包括一个或多个数据域信息;其特征在于,所述非结构化数据解析方法包括如下步骤:步骤一:读取非结构化数据格式配置文件,定义三级索引指针,分别为消息块索引指针、信号量索引指针和数据域索引指针,将消息块索引指针、信号量索引指针以及数据域索引指针均指向非结构化数据格式配置文件内的第一个数据条目,其中,所述消息块索引指针指向所述消息块信息;信号量索引指针指向所述信号量信息;数据域索引指针指向所述数据域信息;步骤2:构建消息块缓存区、信号量缓存区以及数据域缓存区;步骤3:自第一个数据条目开始,遍历非结构化数据中的所有条目,通过消息块索引指针、信号量索引指针以及数据域索引指针的配合,将非结构化数据中的各个条目解析成结构化数据格式列表,结构化数据格式列表中各个消息块信息依次排列,且每个消息块内依次排列有属于该消息块信息的信号量信息;每个信号量信息内依次排列有属于该信号量信息的数据域信息。本申请的非结构化数据解析方法对顺序约束型的非结构化数据格式进行解析,利用配置信息中的冗余数据和配置条目间的约束规则,能够高效地解析配置文件中的数据格式定义条目,并完整地创建对应的结构化数据格式描述信息。在本实施例中,所述数据域信息包括:配置信息,位域偏移量、位域长度、是否有分辨率、数据域分辨率、应用数据类型等。在本实施例中,步骤3具体为:步骤31:数据域指针自所述第一个数据条目开始,获取同一信号量信息内的数据域信息并暂存在所述数据域缓存区;直至所述数据域指针将同一信号量信息内的所有数据域信息均缓存至所述数据域缓存区;步骤32:将同一信号量信息内的所有数据域信息缓存至信号量缓存区,并清空所述数据域缓存区;步骤33:当数据域指针完成属于同一信号量信息内的数据域信息搜索后,所述信号量索引指针指向所述非本文档来自技高网...
一种非结构化数据解析方法

【技术保护点】
一种非结构化数据解析方法,所述非结构化数据存储在非结构化数据格式配置文件中,所述非结构化数据包括多个条目,每个条目包括一个消息块信息、一个信号量信息以及一个数据域信息;所述非结构化数据包括一个或者多个消息块信息;每个消息块包括一个或多个信号量信息;每个信号量信息包括一个或多个数据域信息;其特征在于,所述非结构化数据解析方法包括如下步骤:步骤1:读取非结构化数据格式配置文件,定义三级索引指针,分别为消息块索引指针、信号量索引指针和数据域索引指针,将消息块索引指针、信号量索引指针以及数据域索引指针均指向非结构化数据格式配置文件内的第一个数据条目,其中,所述消息块索引指针指向所述消息块信息;信号量索引指针指向所述信号量信息;数据域索引指针指向所述数据域信息;步骤2:构建消息块缓存区、信号量缓存区以及数据域缓存区;步骤3:自所述第一个数据条目开始,遍历所述非结构化数据中的所有条目,通过消息块索引指针、信号量索引指针以及数据域索引指针的配合,将所述非结构化数据中的各个条目解析成结构化数据格式列表,所述结构化数据格式列表中各个消息块信息依次排列,且每个消息块内依次排列有属于该消息块信息的信号量信息;每个信号量信息内依次排列有属于该信号量信息的数据域信息。...

【技术特征摘要】
1.一种非结构化数据解析方法,所述非结构化数据存储在非结构化数据格式配置文件中,所述非结构化数据包括多个条目,每个条目包括一个消息块信息、一个信号量信息以及一个数据域信息;所述非结构化数据包括一个或者多个消息块信息;每个消息块包括一个或多个信号量信息;每个信号量信息包括一个或多个数据域信息;其特征在于,所述非结构化数据解析方法包括如下步骤:步骤1:读取非结构化数据格式配置文件,定义三级索引指针,分别为消息块索引指针、信号量索引指针和数据域索引指针,将消息块索引指针、信号量索引指针以及数据域索引指针均指向非结构化数据格式配置文件内的第一个数据条目,其中,所述消息块索引指针指向所述消息块信息;信号量索引指针指向所述信号量信息;数据域索引指针指向所述数据域信息;步骤2:构建消息块缓存区、信号量缓存区以及数据域缓存区;步骤3:自所述第一个数据条目开始,遍历所述非结构化数据中的所有条目,通过消息块索引指针、信号量索引指针以及数据域索引指针的配合,将所述非结构化数据中的各个条目解析成结构化数据格式列表,所述结构化数据格式列表中各个消息块信息依次排列,且每个消息块内依次排列有属于该消息块信息的信号量信息;每个信号量信息内依次排列有属于该信号量信息的数据域信息。2.如权利要求1所述的非结构化数据解析方法,其特征在于,所述数据域信息包括:配置信息,位域偏移量、位域长度、是否有分辨率、数据域分辨率、应用数据类型。3....

【专利技术属性】
技术研发人员:付强沈瑞娜李鹤枫
申请(专利权)人:中国航空工业集团公司西安飞机设计研究所
类型:发明
国别省市:陕西,61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1