【技术实现步骤摘要】
【国外来华专利技术】准备和整理用于后续分析的数据的用户界面
所公开的实现方式通常涉及数据可视化,且更具体地涉及准备和整理用于由数据可视化应用进行使用的数据的系统、方法和用户界面。背景数据可视化应用使用户能够在视觉上理解数据集,包括分布、趋势、异常值、和对做出业务决策很重要的其他因素。一些数据集是非常大的或复杂的,且包括许多数据字段。可以使用各种工具来帮助理解和分析数据,包括具有多个数据可视化的仪表板。然而,数据经常需要被操纵或改动以将其置于可以容易被数据可视化应用使用的格式中。有时各种ETL(提取/转换/加载)工具被用来构建可用的数据源。当今在ETL和数据准备空间中有两种占优势的模型。数据流程风格系统使用户聚焦于在整个系统中的数据的操作和流程上,这帮助提供在工作的整体结构上的清楚,并使用户控制那些步骤变得更容易。然而,这些系统通常对向用户显示其实际数据工作做得很差,这使用户实际上理解对他们的数据做什么或者需要做什么变得很难。这些系统也可能遭受节点的激增。当每个小操作在图中得到其自己的节点时,甚至中等复杂的流程也可能变成节点和边的令人混乱的老鼠窝(aconfusingrat’snest)。另一方面,波特轮风格系统给用户显现对其实际数据的非常具体的电子表格风格界面,并允许用户通过直接的动作来对其数据造型。当用户实际上在这些系统中创造数据流程时,该流程通常被阻塞,使用户理解和控制他们的工作的整体结构变得很难。概述所公开的实现方式具有提供数据流程风格系统和波特轮风格系统的益处的特征,并且更进一步使用户构建数据流程变得更容易。所公开的数据准备应用描述数据流程,但是使节点塌缩到更大的 ...
【技术保护点】
1.一种用于准备用于后续分析的数据的计算机系统,包括:一个或更多个处理器;存储器;以及一个或更多个程序,其被存储在所述存储器中并被配置为由所述一个或更多个处理器执行,所述一个或更多个程序包括指令,所述指令用于:显示包括数据流程窗格、工具窗格、配置文件窗格、和数据窗格的用户界面,其中:所述数据流程窗格显示识别数据源、操作、和输出数据集的节点/链路流程图;所述工具窗格包括使用户能够将数据源添加到所述流程图的数据源选择器,包括使用户能够将节点插入到所述流程图中以用于执行特定的转换操作的操作调色板、以及用户能够并入到所述流程图中的其他流程图的调色板;所述配置文件窗格显示对应于所述流程图中的选定节点的方案,包括关于数据字段的信息和关于所述数据字段的数据值的统计信息,并使用户能够通过与各个数据元素交互来修改所述流程图;以及所述数据窗格显示对应于所述流程图中的选定节点的数据行,并使用户能够通过与各个数据值交互来修改所述流程图。
【技术特征摘要】
【国外来华专利技术】2016.11.07 US 15/345,391;2017.09.14 US 15/705,1741.一种用于准备用于后续分析的数据的计算机系统,包括:一个或更多个处理器;存储器;以及一个或更多个程序,其被存储在所述存储器中并被配置为由所述一个或更多个处理器执行,所述一个或更多个程序包括指令,所述指令用于:显示包括数据流程窗格、工具窗格、配置文件窗格、和数据窗格的用户界面,其中:所述数据流程窗格显示识别数据源、操作、和输出数据集的节点/链路流程图;所述工具窗格包括使用户能够将数据源添加到所述流程图的数据源选择器,包括使用户能够将节点插入到所述流程图中以用于执行特定的转换操作的操作调色板、以及用户能够并入到所述流程图中的其他流程图的调色板;所述配置文件窗格显示对应于所述流程图中的选定节点的方案,包括关于数据字段的信息和关于所述数据字段的数据值的统计信息,并使用户能够通过与各个数据元素交互来修改所述流程图;以及所述数据窗格显示对应于所述流程图中的选定节点的数据行,并使用户能够通过与各个数据值交互来修改所述流程图。2.根据权利要求1所述的计算机系统,其中,关于在所述配置文件窗格中显示的数据字段的所述信息包括第一数据字段的数据范围。3.根据权利要求2所述的计算机系统,其中,响应于对在所述配置文件窗格中的所述第一数据字段的第一数据范围的第一用户动作,将数据过滤到所述第一数据范围的新节点被添加到所述流程图。4.根据权利要求2所述的计算机系统,其中,所述配置文件窗格使用户能够将所述第一数据字段的所述数据范围映射到指定值,从而将执行用户所指定的映射的新节点添加到所述流程图。5.根据权利要求1所述的计算机系统,其中,响应于与在所述数据窗格中的第一数据值的第一用户交互,将所述数据过滤到所述第一数据值的节点被添加到所述流程图。6.根据权利要求1所述的计算机系统,其中,响应于对在所述数据窗格中的第一数据字段的第一数据值的用户修改,对所述第一数据字段的数据值等于所述第一数据值的每行数据执行所述修改的新节点被添加到所述流程图。7.根据权利要求1所述的计算机系统,其中,响应于对在所述数据窗格中的第一数据字段的第一用户动作,将所述第一数据字段分成两个或更多个单独的数据字段的节点被添加到所述流程图。8.根据权利要求1所述的计算机系统,其中,响应于在所述数据流程窗格中的将第一节点拖动到所述工具窗格的第一用户动作,新操作被添加到所述操作调色板,所述新操作对应于所述第一节点。9.根据权利要求1所述的计算机系统,其中,所述配置文件窗格和数据窗格被配置为当在所述数据流程窗格中做出选择时异步地更新。10.根据权利要求1所述的计算机系统,其中,关于在所述配置文件窗格中显示的数据字段的所述信息包括显示数据字段的数据值的分布的一个或更多个直方图。11.一种非暂时性计算机可读存储介质,所述非暂时性计算机可读存储介质存储被配置为由具有一个或更多个处理器、存储器、和显示器的计算机系统执行的一个或更多个程序,所述一个或更多个程序包括用于执行以下操作的指令:显示包括数据流程窗格、工具窗格、配置文件窗格、...
【专利技术属性】
技术研发人员:金俊,威尔·皮尤,艾萨克·丘嫩,
申请(专利权)人:塔谱软件公司,
类型:发明
国别省市:美国,US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。