对话式的数据分析制造技术

技术编号:37087793 阅读:15 留言:0更新日期:2023-03-29 20:03
本公开的实施例涉及对话式的数据分析。在接收到用户的数据分析请求之后,可以基于该数据分析请求确定启发性信息。这里所称的启发性信息不是针对该数据分析请求的结果,而是可用于引导对话继续进行下去的信息。用户可以基于这种启发性信息提供与数据分析请求相关联的补充信息,例如澄清数据分析请求的含义、提出相关的进一步分析请求,等等。根据来自用户的补充信息,可以为用户提供其真正需要和有意义的数据分析结果。以此方式,数据分析将更加准确、有效。用户在获得真正有帮助的信息的同时也能具有良好的用户体验。也能具有良好的用户体验。也能具有良好的用户体验。

【技术实现步骤摘要】
对话式的数据分析
[0001]本申请是申请日为2016年9月29日、申请号为201610867019.5、专利技术名称为“对话式的数据分析”的中国专利技术专利申请的分案申请。

技术介绍

[0002]数据分析在数据驱动决策系统等诸多应用领域发挥非常重要的作用。用户可以向数据分析工具提交数据查询,以便从期望的角度查询数据和创建可视化报告。为了使得数据分析更加方便易用,已经提出了将自然语言处理应用于数据分析的用户界面的方案。自然语言处理是指利用计算机处理人类语言的技术,它使得计算机能够理解人类语言。
[0003]基于自然语言处理的传统数据分析方案主要基于单输入框(single input box)方式。当接收到用户输入的自然语言形式的数据分析请求时,机器执行相应的操作并且提供相应的结果。对于简单或基本的数据分析请求而言,这种数据分析方案通常能够得到相应的数据分析结果。然而,对于复杂的数据分析请求,现有的数据分析方案往往难以正确理解用户的真实意图,也就无法提供用户需要的数据分析结果。

技术实现思路

[0004]为了解决上述和潜在的问题,本公开的实施例提供了双向对话式数据分析方法和设备。根据本公开的实施例,用户可以在与机器的对话中完成数据分析请求。在接收到用户的数据分析请求之后,可以基于该数据分析请求确定启发性信息。这里所称的启发性信息不是针对该数据分析请求的结果,而是可用于引导对话继续进行下去的信息。用户可以基于这种启发性信息提供与数据分析请求相关联的补充信息,例如澄清数据分析请求的含义、提出相关的进一步分析请求,等等。根据来自用户的补充信息,可以为用户提供其真正需要和有意义的数据分析结果。以此方式,数据分析将更加准确、有效。用户在获得真正有帮助的信息的同时也能具有良好的用户体验。
[0005]提供
技术实现思路
部分是为了简化的形式来介绍对概念的选择,它们在下文的具体实施方式中将被进一步描述。
技术实现思路
部分无意标识本公开的关键特征或主要特征,也无意限制本公开的范围。
附图说明
[0006]结合附图并参考以下详细说明,本公开各实施例的上述和其他特征、优点及方面将变得更加明显。在附图中,相同或相似的附图标注表示相同或相似的元素,其中:
[0007]图1示出了其中可以实施本公开的一个或多个实施例的计算环境100的框图;
[0008]图2示出了根据本公开的实施例的用于进行数据分析的数据集200的示意图;
[0009]图3示出了根据本公开的实施例的对于数据集200进行数据分析的示意图300;
[0010]图4A示出了根据本公开的实施例的对于数据集200进行数据分析的示意图400;
[0011]图4B示出了根据本公开的实施例基于图4A的启发性信息进行双向对话的数据分析过程示意图450;
[0012]图5示出了根据本公开的实施例的用于数据分析的方法500的流程图;
[0013]图6示出了根据本公开的实施例的用于数据分析的方法600的流程图;
[0014]图7示出了根据本公开的实施例的多个对话的用户界面700;以及
[0015]图8示出了根据本公开的实施例的用户界面800。
[0016]在所有附图中,相同或相似参考数字表示相同或相似元素。
具体实施方式
[0017]下面将参照附图更详细地描述本公开的实施例。虽然附图中显示了本公开的某些实施例,然而应当理解的是,本公开可以通过各种形式来实现,而且不应该被解释为限于这里阐述的实施例,相反提供这些实施例是为了更加透彻和完整地理解本公开。应当理解的是,本公开的附图及实施例仅用于示例性作用,并非用于限制本公开的保护范围。
[0018]一般地,在本公开的实施例中描述的“数据分析”是指用适当的统计分析方法对收集的大量数据(以下简称为“数据集”)进行分析、提取有用信息和形成结论,从而对数据加以详细研究和概括总结的过程。
[0019]本公开的实施例所使用的术语“启发性信息”是指用于对用户与数据分析设备之间的会话进行引导的信息,例如用于引导用户澄清数据分析请求的信息、用于向用户提供扩展性数据分析结果的信息,等等。启发性信息不同于针对用户的数据分析请求而产生的结果(以下也称为“数据分析结果”)。
[0020]本公开的实施例所使用的术语“内容项”是指用于表征数据集中的数据的语义单位,例如关于地点、时间、日期、事件、品牌、类别等的字词或短语。
[0021]本公开的实施例所使用的术语“代码片段”是指用于实现与内容项相关联的一个或多个操作的一段代码。当以内容项作为输入来运行这段代码时,可以将得到的输出作为数据分析请求的部分或全部结果。
[0022]本公开使用的术语“包括”及其变形是开放性包括,即“包括但不限于”。术语“基于”是“至少部分地基于”。术语“一个实施例”表示“至少一个实施例”;术语“另一实施例”表示“至少一个另外的实施例”。其他术语的相关定义将在下文描述中给出。
[0023]传统上,数据分析方案采用的是单向对话方式,其仅能够针对简单或基本的数据分析请求提供相应的数据分析结果。当用户输入复杂的数据分析请求时,传统的数据分析方案通常难以理解此类复杂的数据分析请求,从而导致系统报错或者给出错误的数据分析结果。结果是,无法帮助用户获得他/她真正想要得到的数据分析结果,也就无法满足用户需求,导致数据分析失去其意义。
[0024]为此,本公开提出了一种双向对话方式的数据分析方法和设备,其不仅能接收来自用户的数据分析请求,而且能够通过分析该数据分析请求而生成启发性信息。在此使用的术语“启发性信息”是指在用于引导数据分析对话继续进行的、不是数据分析结果的信息。例如,启发性信息可以引导用户做出进一步的解释或补充,从而得到设备可以理解的问题。启发性信息也可以是数据分析设备主动推荐给用户的与用户当前分析相关的扩展性信息。这些扩展性信息例如可以是数据分析设备通过数据挖掘方法从所分析的数据中得到的。通过这种方式,本公开的实施例的方法和设备可以为用户提供更加满足需求的数据分析结果,显著提高了用户体验。
[0025]以下参考图1至图8来说明本公开的基本原理和若干示例实现方式。图1示出了其中可以实施本公开的实施例的数据分析设备的计算环境100的框图。应当理解,图1所示出的计算环境100仅仅是示例性的,而不应当构成对本文所描述的实施例的功能和范围的任何限制。
[0026]如图1所示,计算环境100包括用户101和通用计算设备形式的计算系统/服务器105。计算系统/服务器105可以用于实施本公开的实施例的数据分析设备(以下也称为“数据分析设备105”)。用户101可以与计算系统/服务器105进行交互以提出数据分析请求102,并获得所需的数据分析结果180。计算系统/服务器105的组件可以包括但不限于一个或多个处理器或处理单元110、存储器120、存储设备130、一个或多个通信单元140、一个或多个输入设备150以及一个或多个输出设备160。处理单元110可以是实际或虚拟处理器并且能够根据存储器120本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种计算系统,包括:处理单元;以及存储器,被耦合到所述处理单元并且具有指令,所述指令在由所述处理单元执行时,执行包括以下的操作:接收来自用户的数据分析请求;生成启发性信息,所述启发性信息提示所述用户针对所述数据分析请求中的内容项提供澄清信息;响应于向所述用户提供所述启发性信息,从所述用户接收补充信息;确定与所述补充信息相关联的数据分析结果;基于以下至少一项扩展所述数据分析结果:所述数据分析结果中的内容项;针对所述数据分析结果的结果;或者预定义的操作模板;以及向所述用户提供所述数据分析结果。2.根据权利要求1所述的系统,其中接收来自所述用户的所述数据分析请求包括:在所述用户与数据分析设备之间的双向对话期间,由所述数据分析设备接收来自所述用户的所述数据分析请求。3.根据权利要求2所述的系统,其中:在所述用户与所述数据分析设备之间的所述双向对话期间,所述用户与所述数据分析设备进行基于语音的交流。4.根据权利要求2所述的系统,其中所述数据分析请求是被输入到由所述数据分析设备提供的对话框中的文本形式。5.根据权利要求1所述的系统,其中所述启发性信息不同于所述数据分析结果。6.根据权利要求1所述的系统,其中所述数据分析请求中的所述内容项对应于与位置、时间、日期、事件、品牌或类别中的至少一个相关的词或短语。7.根据权利要求1所述的系统,其中接收所述数据分析请求包括:确定与所述数据分析请求相关联的数据集;从所述数据分析请求中提取所述内容项;以及基于所述内容项确定要被应用于所述数据集的操作是否是可确定的。8.根据权利要求7所述的系统,其中基于所述内容项确定要被应用于所述数据集的操作是否是可确定的包括:语言分析所述数据分析请求以确定所述内容项的词性。9.根据权利要求7所述的系统,其中基于所述内容项确定要被应用于所述数据集的操作是否是可确定的包括:通过分析在所述数据分析请求之前由所述用户提供的预定数目的句子来检测所述数据分析请求的上下文。10.根据权利要求7所述的系统,其中基于所述内容项确定要被应用于所述数据集的操作是否是可确定的包括:通过分析在所述数据分析请求之前的预定时段内由所述用户提供的多个句子来检测
所述数据分析请求的上下文。11.根据权利要求7所述的系统,其中:响应于确定要被应用于所述数据...

【专利技术属性】
技术研发人员:侯智涛楼建光梁潇张博张海东张冬梅
申请(专利权)人:微软技术许可有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1