利用适当的度量聚合生成多事实数据集的数据可视化制造技术

技术编号:33769250 阅读:29 留言:0更新日期:2022-06-12 14:21
计算机接收指定数据源、视觉变量和来自数据源的数据字段的视觉规范。每个视觉变量与数据字段(例如,维度和/或度量)或过滤器相关联。计算机获得将数据源编码为相关逻辑表的树的数据模型。每个逻辑表包括逻辑字段,每个逻辑字段对应于数据字段或对应于跨越逻辑表的计算。计算机为维度和过滤器生成维度子查询。计算机还为每个度量生成按维度分组的聚合度量子查询。计算机通过将维度子查询联接到聚合度量子查询中的每一个来形成最终查询。计算机随后执行最终查询并根据最终查询的结果显示数据可视化。据可视化。据可视化。

【技术实现步骤摘要】
【国外来华专利技术】利用适当的度量聚合生成多事实数据集的数据可视化


[0001]公开的实施方式总体上涉及数据可视化,且更具体地说涉及使用数据集的对象模型来进行数据集的交互式可视分析。
[0002]背景
[0003]数据可视化应用使用户能够在视觉上理解数据集,包括分布、趋势、离群值、和对做出业务决策重要的其他因素。一些数据元素是基于来自选定数据集的数据来计算出的。例如,数据可视化经常使用总和来聚合数据。一些数据可视化应用使用户能够指定可用于聚合计算的“细节级别”(LOD)。然而,为数据可视化指定单个细节级别是不足以建立某些计算的。
[0004]一些数据可视化应用提供用户界面,其使用户能够通过选择数据字段并将它们放置在特定的用户界面区域内以间接地定义数据可视化来从数据源建立可视化。请参见例如2003年6月2日提交的标题为“Computer Systems and Methods for the Query and Visualization of Multidimensional Databases”的序列号为10/453,834的美国专利申请(现在为第7,0本文档来自技高网...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种生成数据可视化的方法,包括:在具有显示器、一个或更多个处理器和存储器的计算机处执行下列操作,所述存储器存储被配置为由所述一个或更多个处理器执行的一个或更多个程序:接收视觉规范,所述视觉规范指定数据源、多个视觉变量和来自所述数据源的多个数据字段,其中,所述视觉变量中的每一个与(i)所述数据字段中相应的一个或更多个数据字段或者(ii)一个或更多个过滤器相关联,并且所述数据字段中的每一个被识别为维度或度量;获得将所述数据源编码为逻辑表的树的数据模型,每个逻辑表具有其自己的物理表示并包括相应的一个或更多个逻辑字段,每个逻辑字段对应于数据字段或者对应于跨越一个或更多个逻辑表的计算,其中,所述树的每条边连接相关的两个逻辑表;基于为所述维度和所述过滤器提供所述数据字段的逻辑表来生成维度子查询;基于为相应度量和所述过滤器提供所述数据字段的逻辑表,为每个度量生成按所述维度分组的聚合度量子查询;通过使用所述维度将所述维度子查询联接到所述聚合度量子查询中的每一个来形成最终查询;对所述数据源执行所述最终查询,以检索包含对于所述数据字段的数据值的不同有序组合的元组;以及根据所述元组中的数据字段并根据所述数据字段中的每一个所关联到的视觉变量,建立并显示数据可视化。2.根据权利要求1所述的方法,其中,生成每个聚合度量子查询包括:计算所述逻辑表的树的度量子树,其中,所述度量子树是为相应度量提供所述数据字段所需的最小子树;计算所述逻辑表的树的维度

过滤器子树,其中,所述维度

过滤器子树是为所述维度和所述过滤器提供所有物理输入所需的最小子树;根据所述维度

过滤器子树不与所述度量子树共享任何逻辑表的确定,将来自所述度量子树的相邻逻辑表添加到所述维度

过滤器子树;编译所述度量子树以获得度量联接树,并且编译所述维度

过滤器子树以获得维度

过滤器联接树;在所述度量联接树和所述维度

过滤器联接树上对计算和过滤器进行分层,以分别获得更新的度量子树和更新的维度

过滤器子树;通过应用分组操作来对所述更新的维度

过滤器子树去重,以获得去重的维度

过滤器子树,所述分组操作使用所述维度和链接字段,所述链接字段包括(i)来自所述逻辑表之间的关系的键和(ii)与所述度量子树共享的计算的数据字段;和将所述去重的维度

过滤器子树与所述更新的度量子树进行组合,以获得所述聚合度量子查询。3.根据权利要求2所述的方法,其中,编译所述度量子树包括内联接所述度量子树中的逻辑表,以获得所述度量联接树。4.根据权利要求2所述的方法,其中,计算所述维度

过滤器子树包括内联接在所述维度

过滤器子树中与所述度量子树共享的逻辑表,并且左联接在所述维度

过滤器子树中不
与所述度量子树共享的逻辑表,以获得所述维度

过滤器联接树。5.根据权利要求2所述的方法,其中,将所述去重的维度

过滤器子树与所述更新的度量子树进行组合包括:确定所述去重的维度

过滤器子树是否包含过滤器;根据所述去重的维度

过滤器子树包含过滤器的确定,将所述更新的度量子树与所述去重的维度

过滤器子树进行内联接;以及根据所述去重的维度

过滤器子树不包含过滤器的确定,将所述更新的度量子树与所述去重的维度

过滤器子树进行左外联接。6.根据权利要求2所述的方法,还包括:根据所述键指示所述第一逻辑表和所述第二逻辑表之间的多对一关系的确定,在所述度量子树中包括所述第一表和所述第二表,从而避免了在对所述第一逻辑表和所述第二逻辑表的去重操作中的分组。7.根据权利要求2所述的方法,还包括:根据所述维度

过滤器子树仅沿着多对一链接和一对一链接对所述度量子树进行联接的确定,用所述去重的维度

过滤器子树替代由所述度量子树和所述维度

过滤器子树共享的表。8.根据权利要求1所述的方法,其中,生成所述维度子查询包括内联接所述逻辑表的树中的第一一个或更多个逻辑表,其中,所述第一一个或更多个逻辑表中的每个逻辑表提供用于维度或过滤器的数据字段。9.根据权利要求1所述的方法,其中,形成所述最终查询包括:使用外联接在所述维度上联接所述维度子查询和所述聚合度量子查询,并且在每个外联接之后应用COALESCE。10.根据权利要求1所述的方法,其中,形成所述最终查询包括:根据所述可视化不具有维度的确定,在所述聚合度量子查询之间执行全外联接。11.一种用于生成数据可视化的计算机系统,包括:一个或更多个处理器;以及存储器;其中,所述存储器存储被配置为由所述一个或更多个处理器执行的一个或更多个程序,并且所述一个或更多个程序包括用于执行下列操作的指令:接收视觉规范,所述视觉规范指定数据源、多个视觉变量和来自所述数据源的多个数据字段,其中,所述视觉变量中的每一个与(i)所述数据字段中相应的一个或更多个数据字段或者(ii)一个或更多个过滤器相关联,并且所述数据字段中的每一个被识别为维度或度量;获得将所述数据源编码为逻辑表的树的数据模型,每个逻辑表具有其自己的物理表示并包括相应的一个或更多个逻辑字段,每个逻辑字段对应于数据字段或者对应于跨越一个或更多个逻辑表的计算,其中...

【专利技术属性】
技术研发人员:克里斯蒂安
申请(专利权)人:塔谱软件公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1