当前位置: 首页 > 专利查询>山东大学专利>正文

基于线段KD树的支持大规模时序数据交互方法及系统技术方案

技术编号:30428203 阅读:50 留言:0更新日期:2021-10-24 17:16
本发明专利技术提供了一种基于线段KD树的支持大规模时序数据交互方法,将每个时间序列分割为多个线段,并计算每个线段对应的斜率;为分割后的所有线段建立在三维空间的KD树索引结构;计算每个KD树节点中的空间跨度信息;对于交互目标区域,查询KD树索引结构中经过所选区域内的所有线段信息,进行交互式查询。本发明专利技术效地解决了当前大规模数据分析中存在的查询困难问题,易于用户观察。易于用户观察。易于用户观察。

【技术实现步骤摘要】
基于线段KD树的支持大规模时序数据交互方法及系统


[0001]本专利技术属于数据可视化
,具体涉及一种基于线段KD树的支持大规模时序数据交互方法及系统。

技术介绍

[0002]本部分的陈述仅仅是提供了与本专利技术相关的
技术介绍
信息,不必然构成在先技术。
[0003]目前,越来越多时序数据被收集、存储和分析,并在许多领域中都有所涉及,例如金融、健康、城市信息学等。为了深入了解这些时序数据,分析人员通常需要进行探索、比较和关联多个实体产生的数据。这些数据的数量从几十到几百万不等。因此,当下对能够扩展到大规模时序数据交互式探索的分析系统有很大的需求。
[0004]已有的探索方法有很多,下面分两个方面进行简单总结:
[0005]基于原始线段的探索分析方法。这种方法通过在屏幕空间以折线的方式绘制出所有的时序数据,为用户提供相应的数据视图与交互环境。但这种方法导致的问题是当数据量增大时,将不可避免地产生过度绘制的问题。这一问题会严重影响用户对数据的分析与认知,例如不能从视图中获得有效的整体分布信息等。
[0006]基于密度图的探索分析方法。这种方法通过在屏幕空间以密度图的形式绘制出所有的时序数据。虽然这种方法能够有效地为用户提供对整体数据分布的洞见,但是用户不能从中得知某一条或多条线的详细走势信息。因此,这一方法也会影响用户对数据的分析与认知工作。

技术实现思路

[0007]本专利技术为了解决上述问题,提出了一种基于线段KD树的支持大规模时序数据交互方法及系统,本专利技术可以实现适用于大规模时序数据的交互式分析工作。
[0008]根据一些实施例,本专利技术采用如下技术方案:
[0009]一种基于线段KD树的支持大规模时序数据交互方法,包括以下步骤:
[0010]将每个时间序列分割为多个线段,并计算每个线段对应的斜率;
[0011]为分割后的所有线段建立在三维空间的KD树索引结构;
[0012]计算每个KD树节点中的空间跨度信息;
[0013]对于交互目标区域,查询KD树索引结构中经过所选区域内的所有线段信息,进行交互式查询。
[0014]作为可选择的实施方式,将每个时间序列分割为多个线段的具体过程包括:对时间数据,初始化一条折线段,只包含时序数据的首尾端点,对于一条折线段,通过递归的方式不断向当前折线中添加距离最远的点,直至所有未插入的点与当前折线的距离都小于一个设定的阈值。
[0015]作为可选择的实施方式,为分割后的所有线段建立在三维空间的KD树索引结构的
具体过程包括:对每个线段计算对应的斜率,将线段提升为时间



斜率这三维空间中的线段,基于提升维度后的线段,递归地查找空间的三个维度划分平面,并选取遍历节点代价最低的划分平面作为当前节点的划分平面,将穿过划分平面的线进行进一步的切割,确保每个线段都不会与划分平面相交。
[0016]作为可选择的实施方式,为分割后的所有线段建立在三维空间的KD树索引结构后,计算每个KD树节点中的空间跨度信息;并在每个叶节点中存储对应所包含线段的端点、斜率与曲率信息。
[0017]作为可选择的实施方式,对于交互目标区域,查询KD树索引结构中经过所选区域内的所有线段信息的具体过程包括:对于交互产生的选区范围,查询KD树中经过所选区域内的所有线段信息;通过利用时序数据连续变化的特性,构造若干虚拟查询选区,查询经过虚拟查询选区中的所有线段信息;从经过所选区域的线集合中将经过任一虚拟查询选区的线剔除,得到最终的交互式查询结果。
[0018]作为可选择的实施方式,进行交互式查询时,利用索引密度反馈当前的交互查询结果,所述索引密度计算过程包括:
[0019]对于每个屏幕空间中的像素,构造设定半径范围内的查询;
[0020]在KD树中进行半径近邻查询操作;
[0021]对查询到的结果进行聚合计算,得到最终的密度值。
[0022]作为可选择的实施方式,进行交互式查询后,反馈当前的交互查询结果是,选取具有代表性的线段进行显示,具体过程包括:
[0023]对于每个时序数据线段,根据所经过的密度区域计算出每条线的权值;
[0024]计算两两线段之间的空间差异情况;
[0025]基于用户给定的参数,从所有时序数据中选出要求参数数量的具有代表性的线进行显示。
[0026]一种基于线段KD树的支持大规模时序数据交互系统,包括:
[0027]分割模块,被配置为将每个时间序列分割为多个线段,并计算每个线段对应的斜率;
[0028]KD树索引结构构建模块,被配置为为分割后的所有线段建立在三维空间的KD树索引结构;
[0029]计算模块,被配置为计算每个KD树节点中的空间跨度信息;
[0030]查询模块,被配置为对于交互目标区域,查询KD树索引结构中经过所选区域内的所有线段信息,进行交互式查询。
[0031]一种电子设备,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成上述方法中的步骤。
[0032]一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成上述方法中的步骤。
[0033]与现有技术相比,本专利技术的有益效果为:
[0034]1、本专利技术针对大规模时序数据提出了一种高效的数据索引结构。通过利用基于线段的KD树对数据进行索引,有效地解决了当前大规模数据分析中存在的查询困难问题;
[0035]2、本专利技术提供了一种高效的基于索引的密度计算方式。通过利用这一方法,能够
更加实时地向用户反馈当前的交互查询结果,从而更易于用户进行进一步的数据分析工作;
[0036]3、本专利技术提供了一种启发式的具有代表性的线的选取方式。这一方法通过一种启发式的算法,从所有时序数据中选出具有代表性的几条线展现给用户,从而解决了用户无法同时得知全局以及局部的走势信息的缺陷。
[0037]为使本专利技术的上述目的、特征和优点能更明显易懂,下文特举较佳实施例,并配合所附附图,作详细说明如下。
附图说明
[0038]构成本专利技术的一部分的说明书附图用来提供对本专利技术的进一步理解,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。
[0039]图1为本专利技术中索引构建过程的流程框架图;
[0040]图2为本专利技术中利用索引结构的交互式查询的方法图示;
[0041]图3为本专利技术中启发式查找具有代表性的线的结果图示。
具体实施方式:
[0042]下面结合附图与实施例对本专利技术作进一步说明。
[0043]应该指出,以下详细说明都是例示性的,旨在对本专利技术提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本专利技术所属
的普通技术人员通常理解的相同含义。
[0044]需要注意的是,这里所使用的术语仅是为了描述具本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于线段KD树的支持大规模时序数据交互方法,其特征是:包括以下步骤:将每个时间序列分割为多个线段,并计算每个线段对应的斜率;为分割后的所有线段建立在三维空间的KD树索引结构;计算每个KD树节点中的空间跨度信息;对于交互目标区域,查询KD树索引结构中经过所选区域内的所有线段信息,进行交互式查询。2.如权利要求1所述的一种基于线段KD树的支持大规模时序数据交互方法,其特征是:将每个时间序列分割为多个线段的具体过程包括:对时间数据,初始化一条折线段,只包含时序数据的首尾端点,对于一条折线段,通过递归的方式不断向当前折线中添加距离最远的点,直至所有未插入的点与当前折线的距离都小于一个设定的阈值。3.如权利要求1所述的一种基于线段KD树的支持大规模时序数据交互方法,其特征是:为分割后的所有线段建立在三维空间的KD树索引结构的具体过程包括:对每个线段计算对应的斜率,将线段提升为时间



斜率这三维空间中的线段,基于提升维度后的线段,递归地查找空间的三个维度划分平面,并选取遍历节点代价最低的划分平面作为当前节点的划分平面,将穿过划分平面的线进行进一步的切割,确保每个线段都不会与划分平面相交。4.如权利要求1所述的一种基于线段KD树的支持大规模时序数据交互方法,其特征是:为分割后的所有线段建立在三维空间的KD树索引结构后,计算每个KD树节点中的空间跨度信息;并在每个叶节点中存储对应所包含线段的端点、斜率与曲率信息。5.如权利要求1所述的一种基于线段KD树的支持大规模时序数据交互方法,其特征是:对于交互目标区域,查询KD树索引结构中经过所选区域内的所有线段信息的具体过程包括:对于交互产生的选区范围,查询KD树中经过所选区域内的所有线段信息;通过利用时序数据连续变化的特性,构造若干虚拟查询选区,查询经过虚拟查询选区...

【专利技术属性】
技术研发人员:汪云海赵跃张烜
申请(专利权)人:山东大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1