准备和整理用于后续分析的数据的用户界面制造技术

技术编号:21958963 阅读:29 留言:0更新日期:2019-08-24 22:16
一种计算机系统显示包括流程窗格、工具窗格、配置文件窗格、和数据窗格的用户界面。流程窗格显示识别数据源、操作、和输出数据集的节点/链路流程图。工具窗格包括使用户能够将数据源添加到流程图的数据源选择器,并包括使用户能够将节点插入到流程图中以用于执行特定的转换操作的操作调色板。配置文件窗格显示对应于流程图中的选定节点的方案,包括关于数据字段的信息和关于数据字段的数据值的统计信息,并使用户能够通过与各个数据元素交互来修改流程图。数据窗格显示对应于流程图中的选定节点的数据行,并使用户能够通过与各个数据值交互来修改流程图。

User interface for preparing and collating data for subsequent analysis

【技术实现步骤摘要】
【国外来华专利技术】准备和整理用于后续分析的数据的用户界面
所公开的实现方式通常涉及数据可视化,且更具体地涉及准备和整理用于由数据可视化应用进行使用的数据的系统、方法和用户界面。背景数据可视化应用使用户能够在视觉上理解数据集,包括分布、趋势、异常值、和对做出业务决策很重要的其他因素。一些数据集是非常大的或复杂的,且包括许多数据字段。可以使用各种工具来帮助理解和分析数据,包括具有多个数据可视化的仪表板。然而,数据经常需要被操纵或改动以将其置于可以容易被数据可视化应用使用的格式中。有时各种ETL(提取/转换/加载)工具被用来构建可用的数据源。当今在ETL和数据准备空间中有两种占优势的模型。数据流程风格系统使用户聚焦于在整个系统中的数据的操作和流程上,这帮助提供在工作的整体结构上的清楚,并使用户控制那些步骤变得更容易。然而,这些系统通常对向用户显示其实际数据工作做得很差,这使用户实际上理解对他们的数据做什么或者需要做什么变得很难。这些系统也可能遭受节点的激增。当每个小操作在图中得到其自己的节点时,甚至中等复杂的流程也可能变成节点和边的令人混乱的老鼠窝(aconfusingrat’snest)。另一方面,波特轮风格系统给用户显现对其实际数据的非常具体的电子表格风格界面,并允许用户通过直接的动作来对其数据造型。当用户实际上在这些系统中创造数据流程时,该流程通常被阻塞,使用户理解和控制他们的工作的整体结构变得很难。概述所公开的实现方式具有提供数据流程风格系统和波特轮风格系统的益处的特征,并且更进一步使用户构建数据流程变得更容易。所公开的数据准备应用描述数据流程,但是使节点塌缩到更大的组内,这些组更好地表示用户希望采取的高级动作。这些节点的设计利用在每个步骤由统计数据和相关可视化指导的对实际数据的直接动作。根据一些实现方式,计算机系统准备用于分析的数据。计算机系统包括一个或更多个处理器、存储器、以及存储在存储器中的一个或更多个程序。程序被配置为由一个或更多个处理器执行。程序显示数据准备应用的用户界面。用户界面包括数据流程窗格、工具窗格、配置文件窗格、和数据窗格。数据流程窗格显示标识数据源、操作、和输出数据集的节点/链路流程图。工具窗格包括使用户能够将数据源添加到流程图的数据源选择器,包括使用户能够将节点插入到流程图中用于执行特定的转换操作的操作调色板以及用户可以合并到流程图中的其他流程图的调色板。配置文件窗格显示对应于流程图中的选定节点的方案,包括关于数据字段的信息和关于数据字段的数据值的统计信息,并使用户能够通过与各个数据元素交互来修改流程图。数据窗格显示对应于流程图中的选定节点的数据行,并使用户能够通过与各个数据值交互来修改流程图。在一些实现方式中,关于在配置文件窗格中显示的数据字段的信息包括第一数据字段的数据范围。在一些实现方式中,响应于对在配置文件窗格中的第一数据字段的第一数据范围的第一用户动作,将数据过滤到第一数据范围的新节点被添加到流程图。在一些实现方式中,配置文件窗格使用户能够将第一数据字段的数据范围映射到指定值,从而将执行用户指定的映射的新节点添加到流程图。在一些实现方式中,响应于与在数据窗格中的第一数据值的第一用户交互,将数据过滤到第一数据值的节点被添加到流程图。在一些实现方式中,响应于对在数据窗格中的第一数据字段的第一数据值的用户修改,对第一数据字段的数据值等于第一数据值的每行数据执行修改的新节点被添加到流程图。在一些实现方式中,响应于对在数据窗格中的第一数据字段的第一用户动作,将第一数据字段分成两个或更多个单独的数据字段的节点被添加到流程图。在一些实现方式中,响应于在数据流程窗格中的将第一节点拖动到工具窗格的第一用户动作,新操作被添加到操作调色板,该新操作对应于第一节点。在一些实现方式中,配置文件窗格和数据窗格被配置为当在数据流程窗格中做出选择时异步地更新。在一些实现方式中,关于在配置文件窗格中显示的数据字段的信息包括显示数据字段的数据值的分布的一个或更多个直方图。根据一些实现方式,过程转换数据。该过程在具有显示器、一个或更多个处理器、和存储器的计算设备处被执行,该存储器存储被配置为由一个或更多个处理器执行的一个或更多个程序。该过程显示包括数据流程窗格和数据窗格的用户界面。该过程接收第一用户输入以在数据流程窗格中构建节点/链路数据转换流程图。流程图中的每个节点指定从相应数据源检索数据的相应操作,指定转换数据的相应操作,或者指定创建相应输出数据集的相应操作。流程图包括具有从第一数据源检索数据的一个或更多个数据源节点和一个或更多个转换操作节点的子树。该过程接收第二用户输入以至少执行子树。根据第二用户输入和对在子树中的节点被配置为命令式地执行的确定,该过程根据由子树中的链路所指定的那样顺序地执行子树中的节点的操作,从而从第一数据源检索数据,转换所检索的数据,形成第一中间数据集,并在数据窗格中显示第一中间数据集。该过程接收第三用户输入以配置子树中的节点来命令式地执行,并且接收第四用户输入以至少执行子树。根据第四用户输入和对子树中的节点被配置为命令式地执行的确定,该过程构造在逻辑上等同于由子树中的节点指定的操作的数据库查询,将数据库查询传输到第一数据源以根据数据库查询从第一数据源检索第二中间数据集,并且在数据窗格中显示第二中间数据集。根据一些实现方式,该过程包括存储第一中间数据集和第二中间数据集。在一些实例中,子树是整个流程图。根据一些实现方式,转换操作节点之一指定过滤由一个节点接收的数据行的过滤转换操作,顺序地执行子树中的节点的操作包括在计算机系统处执行过滤转换操作以过滤掉接收到的数据行,以及根据数据库查询从第一数据源检索第二中间数据集包括在托管第一数据源的远程服务器处应用过滤操作。根据一些实现方式,转换操作节点之一指定联接来自第一数据源的两组数据的联接转换操作,顺序地执行子树中的节点的操作包括执行联接转换操作以在计算机系统处组合两组数据,以及根据数据库查询从第一数据源检索第二中间数据集包括在托管第一数据源的远程服务器处应用联接操作。根据一些实现方式,数据库查询是用SQL编写的。根据一些实现方式,流程图包括未被包括在子树中的部分,该部分被配置为命令式地执行,第四用户输入指定整个流程图的执行,以及执行流程图包括根据由该部分中的链路指定的那样顺序地执行该部分中的节点的操作,从而访问第二中间数据集,转换第二中间数据集,并且形成最终数据集。根据一些实现方式,过程重构流程图。该过程在具有显示器、一个或更多个处理器、和存储器的计算机系统处被执行,该存储器存储被配置为由一个或更多个处理器执行的一个或更多个程序。该过程包括显示用户界面,该用户界面包括多个窗格,包括数据流程窗格和调色板窗格。数据流程窗格包括具有多个现有节点的流程图,每个节点指定从相应数据源检索数据的相应操作,指定转换数据的相应操作,或指定创建相应输出数据集的相应操作。此外,调色板窗格包括多个流程元素模板。该过程还包括接收第一用户输入以从流程图中选择现有节点或者从调色板窗格选择流程元素模板,并且响应于第一用户输入:(i)显示表示用于放置在流程图中的新节点的可移动图标,其中新节点指定对应于选定现有节点或选定流程元素模板的数据流程操作,以及(ii)根据在新本文档来自技高网...

【技术保护点】
1.一种用于准备用于后续分析的数据的计算机系统,包括:一个或更多个处理器;存储器;以及一个或更多个程序,其被存储在所述存储器中并被配置为由所述一个或更多个处理器执行,所述一个或更多个程序包括指令,所述指令用于:显示包括数据流程窗格、工具窗格、配置文件窗格、和数据窗格的用户界面,其中:所述数据流程窗格显示识别数据源、操作、和输出数据集的节点/链路流程图;所述工具窗格包括使用户能够将数据源添加到所述流程图的数据源选择器,包括使用户能够将节点插入到所述流程图中以用于执行特定的转换操作的操作调色板、以及用户能够并入到所述流程图中的其他流程图的调色板;所述配置文件窗格显示对应于所述流程图中的选定节点的方案,包括关于数据字段的信息和关于所述数据字段的数据值的统计信息,并使用户能够通过与各个数据元素交互来修改所述流程图;以及所述数据窗格显示对应于所述流程图中的选定节点的数据行,并使用户能够通过与各个数据值交互来修改所述流程图。

【技术特征摘要】
【国外来华专利技术】2016.11.07 US 15/345,391;2017.09.14 US 15/705,1741.一种用于准备用于后续分析的数据的计算机系统,包括:一个或更多个处理器;存储器;以及一个或更多个程序,其被存储在所述存储器中并被配置为由所述一个或更多个处理器执行,所述一个或更多个程序包括指令,所述指令用于:显示包括数据流程窗格、工具窗格、配置文件窗格、和数据窗格的用户界面,其中:所述数据流程窗格显示识别数据源、操作、和输出数据集的节点/链路流程图;所述工具窗格包括使用户能够将数据源添加到所述流程图的数据源选择器,包括使用户能够将节点插入到所述流程图中以用于执行特定的转换操作的操作调色板、以及用户能够并入到所述流程图中的其他流程图的调色板;所述配置文件窗格显示对应于所述流程图中的选定节点的方案,包括关于数据字段的信息和关于所述数据字段的数据值的统计信息,并使用户能够通过与各个数据元素交互来修改所述流程图;以及所述数据窗格显示对应于所述流程图中的选定节点的数据行,并使用户能够通过与各个数据值交互来修改所述流程图。2.根据权利要求1所述的计算机系统,其中,关于在所述配置文件窗格中显示的数据字段的所述信息包括第一数据字段的数据范围。3.根据权利要求2所述的计算机系统,其中,响应于对在所述配置文件窗格中的所述第一数据字段的第一数据范围的第一用户动作,将数据过滤到所述第一数据范围的新节点被添加到所述流程图。4.根据权利要求2所述的计算机系统,其中,所述配置文件窗格使用户能够将所述第一数据字段的所述数据范围映射到指定值,从而将执行用户所指定的映射的新节点添加到所述流程图。5.根据权利要求1所述的计算机系统,其中,响应于与在所述数据窗格中的第一数据值的第一用户交互,将所述数据过滤到所述第一数据值的节点被添加到所述流程图。6.根据权利要求1所述的计算机系统,其中,响应于对在所述数据窗格中的第一数据字段的第一数据值的用户修改,对所述第一数据字段的数据值等于所述第一数据值的每行数据执行所述修改的新节点被添加到所述流程图。7.根据权利要求1所述的计算机系统,其中,响应于对在所述数据窗格中的第一数据字段的第一用户动作,将所述第一数据字段分成两个或更多个单独的数据字段的节点被添加到所述流程图。8.根据权利要求1所述的计算机系统,其中,响应于在所述数据流程窗格中的将第一节点拖动到所述工具窗格的第一用户动作,新操作被添加到所述操作调色板,所述新操作对应于所述第一节点。9.根据权利要求1所述的计算机系统,其中,所述配置文件窗格和数据窗格被配置为当在所述数据流程窗格中做出选择时异步地更新。10.根据权利要求1所述的计算机系统,其中,关于在所述配置文件窗格中显示的数据字段的所述信息包括显示数据字段的数据值的分布的一个或更多个直方图。11.一种非暂时性计算机可读存储介质,所述非暂时性计算机可读存储介质存储被配置为由具有一个或更多个处理器、存储器、和显示器的计算机系统执行的一个或更多个程序,所述一个或更多个程序包括用于执行以下操作的指令:显示包括数据流程窗格、工具窗格、配置文件窗格、...

【专利技术属性】
技术研发人员:金俊威尔·皮尤艾萨克·丘嫩
申请(专利权)人:塔谱软件公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1