基于初始数据可视化确定替代性数据可视化的方法和系统技术方案

技术编号:9838782 阅读:153 留言:0更新日期:2014-04-02 02:17
根据本发明专利技术的一个实施例,一种计算机实现的方法包括基于数据集合的所选择的第一可视化的规范和包括有关数据集合的信息的参数生成数据集合的替代性可视化。

【技术实现步骤摘要】
基于初始数据可视化确定替代性数据可视化的方法和系统
本专利技术的实施例涉及数据可视化,更具体地说,涉及基于选择的初始数据可视化的规范确定替代性(alternative)数据可视化。
技术介绍
选择合适的方式来可视化数据涉及结合数据知识和数据可视化技术知识。然而,专注于特定领域的企业用户通常缺乏数据可视化技术的专业知识。研究已经显示,在用户选择的数据视觉表示与其在可用的可视化列表中的位置之间的高度的相关性。换句话说,人们往往简单地选择最容易得到的可视化,而它可能不会导致数据的最佳可视化。
技术实现思路
根据本专利技术的一个实施例,一种计算机实现的方法包括基于数据集合的所选择的第一可视化的规范和包括有关该数据集合的信息的参数生成该数据集合的替代性可视化。本专利技术的实施例还包括一种用于以与上述本质相同的方式可视化数据的系统和计算机程序产品。附图说明一般情况下,各附图中类似的参考标号用来指代类似的部件。图1是本专利技术的实施例使用的示例性计算环境的示意图。图2是示例根据本专利技术实施例的分析数据的基础可视化以生成数据的替代性可视化的方式的流程图。图3是示例根据本专利技术实施例的图2中的流程图的视觉目标和统计关系发现的方式的流程图。图4是示例根据本专利技术实施例的图2中的流程图的可视化推荐的方式的流程图。图5是示例根据本专利技术实施例的图4中的流程图的规则执行的方式的流程图。图6是示例性初始数据可视化的图。图7A-7B示出了根据本专利技术实施例的为图6中的初始数据可视化推荐的示例性替代性可视化。具体实施方式可视化通常是指来自数据集合的数据的视觉表示。来自数据集合的变量通常映射到视觉表示的一组分量。分量的示例包括位置(例如,图的X、Y、Z坐标)、美感(例如,颜色、大小、标记、形状等)和分面(faceting)(例如,图表的行、列、外部行(outerrow),外部列(outercolumn)等)。在关系模型中,示例性数据集合可以包括其中每个记录(即,每行数据)都由一组列描述的数据表格,其中每一列是数据变量(也称为字段)。本专利技术实施例基于用户选择的初始数据可视化为用户提供推荐的替代性数据可视化。本专利技术实施例分析用户的初始可视化、数据集合和元数据的规范。本实施例还为用户提供一组新的、描述数据额外的方面的候选可视化,或者提供更好的数据视觉表示。例如,如果用户最初选择变量X和Y的散点图(scatterplot),并且在X和Y之间存在高度的相关性,那么本专利技术实施例可以为用户提供显示叠加在原始散点图上的统计平滑结果的候选可视化。同样地,如果数据包含额外的类别的信息,那么候选可视化可以包括通过颜色、阴影或标记形状标识每个(X,Y)对的类别的散点图(带有图例)。这组候选可视化可以包括与原始的不同类型的可视化。例如,用户可能最初为分层数据选择条形图,得到显示分层结构的树形图。同样,最初选择条形图代表金融时间序列的用户可能会得到线图;最初选择簇状条形图(clusteredbarchart)的用户可能会得到点图(dotplot)或平板化(paneled)条形图;最初选择数据包含美国各州名称的条形图可能会得到地图。替代性可视化的具体推荐依赖于情境(例如,业务领域、数据和定制规则)和用户的初始可视化。用于本专利技术实施例的示例性环境在图1中示出。具体地说,该环境包括一个或多个服务器系统10和一个或多个客户端或终端用户系统14。服务器系统10和客户端系统14可以彼此远离,并通过网络12进行通信。该网络可以通过任何数量的任何合适的通信媒介(例如,广域网(WAN)、局域网(LAN)、互联网、内联网等)来实现。替代性地,服务器系统10和客户端系统14可以相对于彼此是本地的,并通过任何合适的本地通信媒介(例如,局域网(LAN)、硬连线、无线链路、内联网等)进行通信。客户端系统14使用户能够针对各种应用与服务器系统10进行交互。服务器系统包括基于用户选择的初始数据可视化提供替代性数据可视化的可视化模块16。可视化模块通过客户端系统14从用户那里接收初始可视化选择。该可视化模块进一步接收可以存储在数据库系统18中的数据集合和其他输入(例如,元数据和规则集合)或其他源。该数据库系统可以通过任何常规的或其他的数据库或存储单元实现,可以相对于服务器系统10和客户端系统14是本地的,或远离这两者,并可以通过任何合适的通信媒介(例如,局域网(LAN)、广域网(WAN)、互联网、硬连线、无线链路、内联网等)进行通信。客户端系统14可以展示图形用户(例如,GUI等)或其他界面(例如,命令行提示、菜单屏幕等),以从用户请求期望数据的可视化的初始选择以及有关所期望数据的其他信息和分析,并可以显示初始可视化和一组推荐的替代性可视化,以及包括其他生成的图表和任何其他类型的分析结果的报告。服务器系统10和客户端系统14可以通过优选配备显示器或监视器、基础组件(base)(例如,包括处理器、存储器和/或内部或外部通信设备(例如,调制解调器,网卡等))、可选的输入设备(例如,键盘、鼠标或其他输入设备)和任何可商业获得和/或定制的软件(例如,服务器/通信软件、可视化模块、浏览器/接口软件等等)的任何常规的或其他的计算机系统实现。另外,可视化模块16可以包括执行下面描述的各种功能的一个或多个模块或单元,并可以通过任何数量的软件和/或硬件模块或单元的任意组合实现。可替换地,一个或多个客户端系统14可以在作为独立单元工作时分析数据。在独立工作模式中,客户端系统存储数据或可以访问数据,并包括分析数据并基于用户选择的初始数据可视化提供推荐的替代性数据可视化的可视化模块16。图2示出了根据本专利技术实施例的根据初始数据可视化确定替代性数据可视化的方式(例如,通过可视化模块16和服务器系统10和/或客户端系统14)。具体地说,可视化模块16接收作为输入的初始可视化规范210(描述用户选择的可视化并识别源数据集合)、数据集合230、业务元数据220和一组用于确定替代性可视化的启发式规则260。可视化模块以多级操作,包括视觉目标和统计关系发现级240和可视化推荐级270。发现级240分析规范210、数据集合230和业务元数据220,以辨识与有关数据可视化的用户目标相关的信息,并寻找数据集合中多个变量之间的统计关系。结果以丰富的元数据250的形式传递给可视化推荐级270。可视化推荐级270接收丰富的元数据250、规范210和启发式规则260,并应用启发式规则生成改进的可视化的替代性可视化候选290。可视化推荐级的输出是一组替代性可视化候选290。每一个最终的可视化候选都与陈述候选理由的说明相关联。图3示出了根据本专利技术实施例的发现级240编译信息用于可视化推荐级270的方式(例如,通过可视化模块16和服务器系统10和/或客户端系统14)。具体地说,可视化分析310检查初始可视化规范210的语义结构以发现有关数据可视化的用户的目标以及数据到可视化分量的现有映射。规范对初始可视化进行了充分描述,包括诸如变量位置、变量美感表示(如颜色、大小、形状或标记)、元素(如条形、线或点)、分面和/或预先计算的统计值的信息。这些信息反映了用户的意图。例如,被选择用位置表示的字段可能是对用户来说非常重要的字段,使用条形元素可能表示对总结而不是趋势的偏好。另本文档来自技高网...
基于初始数据可视化确定替代性数据可视化的方法和系统

【技术保护点】
一种计算机实现的方法,包括:基于数据集合的所选择的第一可视化的规范和包括有关数据集合的信息的参数,生成数据集合的替代性可视化。

【技术特征摘要】
2012.09.11 US 13/610,1981.一种计算机实现的用于提供替代性可视化的方法,包括:分析数据集合的所选择的第一可视化的规范,以确定关于数据可视化目标的信息,其中,所述规范描述所选择的第一可视化;对所述数据集合执行统计分析,以确定在所述数据集合中的两个或多个变量之间的统计关系和统计关系的强度,其中,所述执行统计分析包括:响应于第一变量与可视化分量的映射,建立多变量模型,以预测第一变量对所述数据集合中的其他变量的依赖性;以及基于所述多变量模型,确定第一变量与第二变量的关系;以及基于数据集合的所选择的第一可视化的规范和包括关于数据可视化目标的信息以及所确定的统计关系和强度的参数,生成数据集合的替代性可视化。2.根据权利要求1所述的方法,其中所述参数还包括所述数据集合的元数据。3.根据权利要求1所述的方法,其中所述参数还包括数据集合的两个或更多变量之间的统计关系。4.根据权利要求1所述的方法,还包括生成替代性可视化的说明。5.根据权利要求1所述的方法,其中第一可视化的规范包括一组可视化分量,以及通过应用预定义的启发式规则以创建该组可视化分量的修改实例来生成替代性可视化的规范。6.根据权利要求1所述的方法,还包括:通过将启发式规则应用于第一可视化的规范,生成多个新的可视化的规范;将分数分配给每一个新的可视化;以及基于分数产生该新的可视化的子集。7...

【专利技术属性】
技术研发人员:SD吉布森DJ罗普GJ威尔斯
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1