利用自动完成作为支持可视化分析的数据发现支架制造技术

技术编号:37514000 阅读:12 留言:0更新日期:2023-05-12 15:34
一种方法利用数据发现来支持数据集的可视化分析。用户选择数据源,并且该方法呈现用于分析数据源的自然语言界面。用户指定指向数据源的不完整自然语言命令,并且该方法将不完整自然语言命令中的单词与数据源中的数据字段相关联。该方法确定数据字段的数据类型和数据字段的数据值的范围。根据数据类型和数据值的范围,该方法为不完整自然语言命令呈现一个或更多个自动完成选项。每个选项包括相应的文本和相应对应的视觉图形。用户选择自动完成选项之一,并且该方法形成完整自然语言命令。然后,该方法根据完整自然语言命令显示数据可视化。化。化。

【技术实现步骤摘要】
【国外来华专利技术】利用自动完成作为支持可视化分析的数据发现支架
[0001]相关申请
[0002]本申请是2020年9月2日提交的标题为“Utilizing Autocompletion as aData Discovery Scaffold for Supporting Visual Analysis”的美国专利申请17/010,770的延续申请,该美国专利申请17/010,770要求2020年5月6日提交的标题为“Utilizing Autocompletion as a Data Discovery Scaffold for Supporting Visual Analysis”的美国临时专利申请63/021,066的优先权,其中每个专利申请通过引用以其整体并入本文。
[0003]本申请涉及2020年3月18日提交的标题为“Incorporating Data Visualizations into Database Conversational Interfaces”的美国临时专利申请62/991,342,该专利申请通过引用以其整体并入本文。
[0004]本申请涉及2017年11月6日提交的标题为“Systems and Methods of Using Natural Language Processing for Visual Analysis of a Data Set”的美国专利申请15/804,991,该专利申请通过引用以其整体并入本文。
[0005]本申请涉及2018年12月27日提交的标题为“Analyzing Underspecified Natural Language Utterances in a Data Visualization User Interface”的美国专利申请16/234,470,该专利申请通过引用以其整体并入本文。
[0006]本申请还涉及2018年12月14日提交的标题为“Data Preparation User Interface with Coordinated Pivots”的美国专利申请16/221,413,该专利申请通过引用以其整体并入本文。
[0007]本申请还涉及2018年12月30日提交的标题为“Generating Data Visualizations According to an Object Model of Selected Data Sources”的美国专利申请16/236,611,该专利申请通过引用以其整体并入本文。
[0008]本申请还涉及2018年12月30日提交的标题为“Generating Data Visualizations According to an Object Model of Selected Data Sources”的美国专利申请16/236,612,该专利申请通过引用以其整体并入本文。
[0009]本申请还涉及2019年11月10日提交的标题为“Data Preparation Using Semantic Roles”的美国专利申请16/679,234,该专利申请通过引用以其整体并入本文。


[0010]所公开的实施方式总体上涉及自然语言处理,并且更具体地涉及用于基于在命令中识别的数据字段的数据值来提供相关自动完成建议的系统、方法和用户界面。
[0011]背景
[0012]自然语言交互已经发展成为一种有用的模式,以帮助用户在可视化分析期间探索他们的数据和与该数据交互。然而,几乎没有做什么工作来探索自动完成如何可以在帮助用户制定分析问题的同时帮助数据发现。传统的界面侧重于句法(syntactic)查询的完成,而没有关于底层(underlying)数据中的内容的任何指导。支持自动完成的当前可用系统对数据发现没有帮助。此外,传统系统没有考虑用户对支持自然语言界面中的可视化分析的
自动完成的偏好。
[0013]概述
[0014]为了解决这些问题,一些实施方式使用设计探针(有时称为“Sneak Pique系统”)来探索自动完成如何可以在用户的分析工作流期间更好地支持用户。
[0015]名为“Sneak Pique”的新颖的系统说明了自动完成对可视化分析的有用性。三个机械土耳其人(Mechanical Turk)研究评估了用户对各种基于文本和可视化小部件(widget)的自动完成设计变体的偏好,以帮助部分搜索查询。调查结果表明,用户发现数据预览在建议中很有用。小部件优先用于预览时间数据、地理空间数据和数值数据,而文本自动完成优先用于分类和分层数据。对系统进行了探索性分析,实现了优选的自动完成变体的特定子集。关于这些自动完成建议的功效的见解促进了支持可视化分析的自然语言界面的设计。
[0016]根据一些实施方式,一种方法利用数据发现来支持数据集的可视化分析。该方法在具有一个或更多个处理器和存储器的计算系统处执行,该存储器储存被配置为由一个或更多个处理器执行的一个或更多个程序。用户选择数据源,并且系统呈现用于分析所选择的数据源中的数据的自然语言界面。用户指定指向数据源的不完整自然语言命令,并且系统将不完整自然语言命令中的一个或更多个单词与所选择的数据源中的数据字段相关联。系统还确定数据字段的数据类型,并确定数据源中关于数据字段的数据值的范围。根据数据类型和数据值的范围,系统为不完整自然语言命令呈现一个或更多个自动完成选项。每个选项包括相应的文本和相应对应的视觉图形。当用户选择一个或更多个自动完成选项中的选项时,系统形成完整的自然语言命令并根据完整的自然语言命令显示数据可视化。
[0017]在一些实施方式中,将不完整自然语言命令中的一个或更多个单词与所选择的数据源中的数据字段相关联包括:(i)基于来自位于所选择的数据源下的数据集的属性值生成语法规则;(ii)通过使用语法规则解析不完整自然语言命令并检测语法解析树错误来确定不完整自然语言命令中的一个或更多个单词是否包括部分完整的查询;以及(iii)根据不完整自然语言命令包括部分完整的查询的确定:(a)计算部分完整的查询的句法结构以及在部分完整的查询完成的情况下将满足的相关语法规则;以及(b)基于相关语法规则从所选择的数据源中选择数据字段。
[0018]在一些实施方式中,关联不完整自然语言命令中的一个或更多个单词是基于分析针对不同数据类型(包括分类数据、数字数据、地理空间数据、时间数据及其组合)的文本自动完成或小部件自动完成的用户偏好。
[0019]在一些实施方式中,为不完整自然命令呈现一个或更多个自动完成选项包括:根据数据类型是分类类型的确定,显示示出针对分类数据字段的建议的文本列表。根据数据频率对建议进行数值排序,并且文本列表包括示出建议的相应数据频率的数据预览。
[0020]在一些实施方式中,为不完整自然命令呈现一个或更多个自动完成选项包括:根据数据类型是数字类型的确定,显示直方图滑块小部件,该直方图滑块小部件示出来自数据源的数值数据字段的数据频率的直方图。
[本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种利用数据发现来支持数据集的可视化分析的方法,包括:在具有一个或更多个处理器和储存被配置为由所述一个或更多个处理器执行的一个或更多个程序的存储器的计算系统处:接收用户对数据源的选择;呈现用于分析所选择的数据源中的数据的自然语言界面;接收用户输入以指定指向所述数据源的不完整自然语言命令;将所述不完整自然语言命令中的一个或更多个单词与所选择的数据源中的数据字段相关联;确定所述数据字段的数据类型和所述数据源中关于所述数据字段的数据值的范围;根据所述数据类型和所述数据值的范围,为所述不完整自然语言命令呈现一个或更多个自动完成选项,其中,每个选项包括相应的文本和相应对应的视觉图形;以及响应于用户对所述一个或更多个自动完成选项中的选项的选择,形成完整自然语言命令并根据所述完整自然语言命令显示数据可视化。2.根据权利要求1所述的方法,其中,将所述不完整自然语言命令中的所述一个或更多个单词与所选择的数据源中的所述数据字段相关联包括:基于来自所选择的数据源的数据字段的数据值生成语法规则;通过使用所述语法规则解析所述不完整自然语言命令并检测语法解析树错误来确定所述不完整自然语言命令中的所述一个或更多个单词是否包括部分完整的查询;以及根据所述不完整自然语言命令包括部分完整的查询的确定:计算所述部分完整的查询的句法结构和在所述部分完整的查询完成的情况下将满足的相关语法规则;以及基于所述相关语法规则从所选择的数据源中选择所述数据字段。3.根据权利要求2所述的方法,还包括:基于所述相关语法规则显示将所述部分完整的查询解析为所述完整自然语言命令所需要的一个或更多个自动完成建议。4.根据权利要求2所述的方法,其中,使用从左到右(LL(*))解析器来执行对所述不完整自然语言命令的解析,所述解析器执行所述不完整自然语言命令的最左派生,并且在不能构建合适的解析路径的情况下回溯。5.根据权利要求2所述的方法,其中,所述语法规则对应于上下文无关语法,所述上下文无关语法包括预定义的规则和基于所述数据集中的所述数据字段的数据值动态生成的规则。6.根据权利要求1所述的方法,其中,关联所述不完整自然语言命令中的所述一个或更多个单词是基于分析关于不同数据类型的文本自动完成或小部件自动完成的用户偏好,所述不同数据类型包括分类数据、数字数据、地理空间数据、时间数据及其组合。7.根据权利要求6所述的方法,还包括:在可视化分析期间检测一系列任务中用户偏好的变化;以及进一步基于使自动完成工作流适应所述不同数据类型的变化来关联所述不完整自然语言命令中的所述一个或更多个单词。8.根据权利要求1所述的方法,其中,为所述不完整自然命令呈现所述一个或更多个自
动完成选项包括:根据所述数据类型是分类类型的确定,显示示出针对分类数据字段的建议的文本列表,其中,根据数据频率对所述建议进行数值排序,并且所述文本列表包括示出所述建议的相应数据频率的数据预览。9.根据权利要求1所述的方法,其中,为所述不完整自然命令呈现所述一个或更多个自动完成选项包括:根据所述数据类型是数字类型的确定,显示直方图滑块小部件,所述直方图滑块小部...

【专利技术属性】
技术研发人员:维迪亚
申请(专利权)人:塔谱软件有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1