当前位置: 首页 > 专利查询>清华大学专利>正文

一种多变量时空数据的范围查询方法及系统技术方案

技术编号:7809441 阅读:187 留言:0更新日期:2012-09-27 08:23
本发明专利技术提出一种多变量时空数据的范围查询方法及系统,其中,方法包括:载入并打开netCDF格式的多变量时空数据文件;读取多变量时空数据文件中各个多变量的格点数据并根据多变量的空间范围对格点数据进行预处理;获取多变量时空数据文件中的变量数据,对变量建立基于四叉树的层次化索引结构,其中层次化索引用于查找时使用;用户定义查询范围区域;根据查询范围,载入元数据信息及层次化索引结构;以及根据变量的层次化索引结构,通过对层次化索引结构的节点进行递归查找完成实时范围查询。本发明专利技术通过对多变量时空数据进行四叉树结构层次化,减少了查找时的时间复杂度,提高了查询的速度与查询方法的易用性。

【技术实现步骤摘要】

本专利技术涉及科学数据可视化分析诊断领域,尤其涉及ー种多变量时空数据的范围查询方法及系统
技术介绍
随着计算机技术的飞速发展,数值模拟得到了飞速提高,地球系统模式模拟系统就是基于数值模拟的。地球系统模式具有较多的输出变量类型及庞大的数据规模,且其数据一般以netCDF格式存储,必须借助可视化分析工具载入分析,因此对其数据进行统计及查找有一定的麻烦。 目前的技术中可视化方法主要是通过图形图像来展示数据范围和数据精度,而查找信息主要是通过对所有数据进行遍历查找。因此存在以下几个方面的问题(I)能展示的数据范围和数据精度有一定的范围,无法十分精准;(2)统计查询时对数据进行遍历查找耗费较多时间及资源。
技术实现思路
本专利技术g在至少解决上述技术问题之一。为此,本专利技术的ー个目的在于提出一种多变量时空数据的范围查询方法。本专利技术的另一目的在于提出一种多变量时空数据的范围查询系统。为了实现上述目的,根据本专利技术的第一方面实施例的多变量时空数据的范围查询方法,包括以下步骤载入并打开netCDF格式的多变量时空数据文件;读取所述多变量时空数据文件中各个多变量的格点数据并根据所述多变量的空间范围对所述格点数据进行预处理;获取所述多变量时空数据文件中的变量数据,对所述变量建立基于四叉树的层次化索引结构,其中所述层次化索引用于查找时使用;用户定义查询范围区域;根据所述查询范围,载入所述元数据信息及所述层次化索引结构;以及根据所述变量的所述层次化索引结构,通过对所述层次化索引结构的节点进行递归查找完成实时范围查询。根据本专利技术实施例的多变量时空数据的范围查询方法,通过将多变量时空数据进行属性层次化,通过层次化索引结构的查询索引,避免了蛮力查询,降低了查询的时间复杂度,提高了方法的易用性。为了实现上述目的,根据本专利技术的第二方面实施例的多变量时空数据的范围查询系统,包括数据处理模块,用于载入netCDF格式文件读取所述文件中各个变量的数据并对所述数据进行预处理,并对所述变量建立层次化索引结构;以及可视化查询模块,用于根据用户输入查询范围,完成实时范围查询。根据本专利技术实施例的多变量时空数据的范围查询系统,对数据进行了预处理,通过建立层次化索引结构来降低统计查询的事件负责度,提高了系统的易用性。本专利技术附加的方面和优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。附图说明本专利技术上述的和/或附加的方面和优点从下面结合附图对实施例的描述中将变得明显和容易理解,其中,图I是根据本专利技术ー个实施例的多变量时空数据的范围查询方法的流程图;图2是根据本专利技术ー个实施例的多变量时空数据的范围查询方法的流程图;以及图3是根据本专利技术ー个实施例的多变量时空数据的范围查询系统的结构图。具体实施例方式下面详细描述本专利技术的实施例,所述实施例的示例在附图中示出,其中自始至终相同或类似的标号表示相同或类似的元件或具有相同或类似功能的元件。下面通过參考附 图描述的实施例是示例性的,仅用于解释本专利技术,而不能解释为对本专利技术的限制。在本专利技术的描述中,需要理解的是,术语“第一”、“第二”等仅用于描述目的,而不能理解为指示或暗示相对重要性。在本专利技术的描述中,需要说明的是,除非另有明确的规定和限定,术语“相连”、“连接”应做广义理解,例如,可以是固定连接,也可以是可拆卸连接,或一体地连接;可以是机械连接,也可以是电连接;可以是直接相连,也可以通过中间媒介间接相连。对于本领域的普通技术人员而言,可以具体情况理解上述术语在本专利技术中的具体含义。此外,在本专利技术的描述中,除非另有说明,“多个”的含义是两个或两个以上。參照下面的描述和附图,将清楚本专利技术的实施例的这些和其他方面。在这些描述和附图中,具体公开了本专利技术的实施例中的ー些特定实施方式,来表示实施本专利技术的实施例的原理的ー些方式,但是应当理解,本专利技术的实施例的范围不受此限制。相反,本专利技术的实施例包括落入所附加权利要求书的精神和内涵范围内的所有变化、修改和等同物。在流程图中表示或在此以其他方式描述的逻辑和/或步骤,例如,可以被认为是用于实现逻辑功能的可执行指令的定序列表,可以具体实现在任何计算机可读介质中,以供指令执行系统、装置或设备(如基于计算机的系统、包括处理器的系统或其他可以从指令执行系统、装置或设备取指令并执行指令的系统)使用,或结合这些指令执行系统、装置或设备而使用。就本说明书而言,“计算机可读介质”可以是任何可以包含、存储、通信、传播或传输程序以供指令执行系统、装置或设备或结合这些指令执行系统、装置或设备而使用的装置。下面參考说明书附图描述根据本专利技术实施例的多变量时空数据的范围查询方法一种多变量时空数据的范围查询方法,包括以下步骤载入并打开net⑶F格式的多变量时空数据文件;读取多变量时空数据文件中各个多变量的格点数据并根据多变量的空间范围对格点数据进行预处理;获取多变量时空数据文件中的变量数据,对变量建立基于四叉树的层次化索引结构,其中层次化索引用于查找时使用;用户定义查询范围区域;根据查询范围,载入元数据信息及层次化索引结构;以及根据变量的层次化索引结构,通过对层次化索引结构的节点进行递归查找完成实时范围查询。图I为本专利技术一个实施例的多变量时空数据的范围查询方法的流程图。如图I所示,根据本专利技术实施例的多变量时空数据的范围查询方法包括下述步骤。SlOl :载入并打开net⑶F格式的多变量时空数据文件;具体地,将以net⑶F格式存储的多变量时空数据载入,并打开该net⑶F格式的文件。S102 :读取多变量时空数据文件中各个多变量的格点数据并根据多变量的空间范围对格点数据进行预处理;具体地,根据打开的多变量时空数据文件中所包含的变量,读取其中各种变量包含的格点数据,其中格点数据为ニ维平面经纬网格数据,并对该数据进行预处理。S103 :获取多变量时空数据文件中的变量数据,对变量建立基于四叉树的层次化索引结构,其中层次化索引用于查找时使用;具体地,首先生成变量的元数据信息;再通过对变量的数据基于四叉树结构进行 递归划分,并记录每个四叉树的节点信息,以生成层次化索引结构及层次化索引数据文件。更具体地,首先根据多变量时空数据的经纬度,时间等信息组织起来,生成元数据信息,然后基于四叉树结构对数据进行递归划分,直到最小的元素,形成层次化索引结构,同时在划分时记录每个四叉树节点的信息,进行节点统计信息的计算,并将元数据信息、索引节点与数据记录结合起来生成层次化索引数据文件。S104 :用户定义查询范围区域。具体地,用户通过鼠标拖动在可视窗口中选取想要查询的范围。S105 :根据查询范围,载入元数据信息及层次化索引结构具体地,根据用户选取的查询范围,以及界面中层次化索引数据的路径和查询时间范围等属性信息,载入用户选择范围内的多个变量的层次化索引文件。S106:根据变量的层次化索引结构,通过对层次化索引结构的节点进行递归查找完成实时范围查询。具体地,从层次化索引根节点开始查找,判断当前节点是否在查找范围内;如果当前节点在查找范围内则返回当前结点的预处理数据;如果当前节点为空节点则递归查找当前节点的子节点;以及将查找到的预处理数据返回给用户。更具体地,根据载入的多个变量的层次化索引结构,从根节点开始查找,根据跟节点本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种多变量时空数据的范围查询方法,其特征在于,包括以下步骤 载入并打开netCDF格式的多变量时空数据文件; 读取所述多变量时空数据文件中各个多变量的格点数据并根据所述多变量的空间范围对所述格点数据进行预处理; 获取所述多变量时空数据文件中的变量数据,对所述变量建立基于四叉树的层次化索引结构,其中所述层次化索引用于查找时使用; 用户定义查询范围区域; 根据所述查询范围,载入所述元数据信息及所述层次化索引结构;以及根据所述变量的所述层次化索引结构,通过对所述层次化索引结构的节点进行递归查找完成实时范围查询。2.根据权利要求I所述的多变量时空数据的范围查询方法,其特征在于,所述获取所述文件中的变量的数据,对所述变量建立层次化索引结构进一歩包括 生成所述变量的元数据信息; 通过对所述变量的数据基于四叉树结构进行递归划分,并记录每个所述四叉树的节点信息,以生成所述层次化索引结构及层次化索引数据文件。3.根据权利要求2所述的多变量时空数据的范围查询方法,其特征在干,所述获取所述文件中的变量的数据,对所述变量建立层次化索引结构还包括 根据计算公式I=iEili不计算所述节点的平均值,对所述节点的覆盖的数据进行预先统计。4.根据权利要求2所述的多变量时空数据的范围查询方法,其特征在于,所述元数据包含了所述数据的经纬度、时间以及其他与该数据相关的信息,主要用于读入索引和显示相关文件信息。5.根据权利要求I所述的多变量时空数据的范围查询方法,其特征在于,还包括,将所述查询的结果显示给用户。6...

【专利技术属性】
技术研发人员:邓俊辉袁国栋张伟
申请(专利权)人:清华大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1