当前位置: 首页 > 专利查询>微软公司专利>正文

对结构数据基于场景的洞察制造技术

技术编号:10931230 阅读:56 留言:0更新日期:2015-01-21 12:16
查询有限数据源集。一种方法包括接收来自用户的查询。该方法还包括从有限数据源集中确定可被一起用于满足该查询的两个或更多个数据源的集合。该方法还包括将来自用户的查询的至少一部分翻译为针对该两个或更多个数据源的语义合适的查询。该方法还包括从该两个或更多个数据源接收这些语义合适查询的结果。该方法还包括聚集这些结果,并将聚集呈现给用户。

【技术实现步骤摘要】
【国外来华专利技术】对结构数据基于场景的洞察 背景 背景和相关技术 计算机和计算系统已经影响了现代生活的几乎每个方面。计算机通常涉及工作、 休闲、保健、运输、娱乐、家政管理等。 现代计算系统具有生成并存储大量数据的能力。例如,数据可通过耦合到传感器、 web服务,或其它数据源的数据收集机制来收集。可对原始数据进行操作以创建甚至更多数 据。大容量存储器是非常便宜的,因此这数据可被保存长的时间段,无需破坏数据来收回存 储空间。因此,大量数据可被生成并聚集。 因为大量数据可用,找到特定数据好比常说的大海捞针。困难可仅在搜索通过大 量数据的时候发生。这可因用户不能制定出有效的搜索查询而变得严重。具体地,各种索 引和搜索引擎可组织数据并使数据可搜索,但是这些工具仅仅像执行搜索的用户通过构建 合适的查询而允许这些工具成为的那样高效。此外,用户可能希望找到单个数据存储无法 完整提供的数据。 在此要求保护的主题不限于解决任何缺点或仅在诸如上述环境中操作的各个实 施例。相反,提供该背景仅用以示出在其中可实践在此描述的部分实施例的一个示例性技 术领域。 简要概述 在此所示的一个实施例涉及一种可在分布式计算环境中实施的方法。该方法包括 用于查询有限数据源集的动作。该方法包括接收来自用户的查询。该方法还包括从有限数 据源集中确定可被一起用于满足该查询的两个或更多个数据源的集合。该方法还包括将来 自用户的查询的至少一部分翻译为对该两个或更多个数据源的语义合适查询。该方法还包 括从该两个或更多个数据源接收这些语义合适查询的结果。该方法还包括聚集这些结果, 并将聚集呈现给用户。 提供本概述是为了以简化的形式介绍将在以下【具体实施方式】中进一步描述的概 念选择。本概述不旨在标识出所要求保护的主题的关键特征或必要特征,也不旨在用于帮 助确定所要求保护的主题的范围。 将在以下的描述中阐述另外的特征和优点,并且部分特征和优点可从该描述中显 而易见,或者可从本文教导的实践中获知。本专利技术的特征和优点可以通过在所附权利要求 中特别指出的手段和组合来实现并获取。本专利技术的特征将从以下描述和所附权利要求书中 变得完全显而易见,或者可通过如下所述对本专利技术的实践而获知。 附图简述 为了描述可获得本主题的上述和其它优点和特征的方式,将通过参考附图中示出 的本主题的具体实施例来呈现以上简要描述的本主题的更具体描述。应该理解,这些附图 仅描绘了各典型实施例,因此其不应被认为是对范围的限制,各实施例将通过使用附图用 附加特征和细节来描述并解释,在附图中: 图1示出了配置用于将查询接收进来,将查询翻译成语义合适查询的引擎; 图2示出了包括配置用于处理自然语言查询的专用功能的电子表格界面; 图3示出了配置用于连接到服务的聊天客户端,该服务可接收聊天形式的自然语 言查询,并将这些查询翻译为对于底层数据存储的语义合适查询; 图4示出了配置用于允许管理员添加、编辑、和删除自然语言查询的管理控制板; 图5示出了管理控制板的示出了管理员能够如何将语义合适查询与自然语言的 查询相关联的附加细节; 图6示出了查询有限的数据源集的方法。 详细描述 在此描述的一些实施例允许用户在通过数据平台展示的数据的顶上构建自然语 言查询,所述数据平台具有它可从其中提供数据的一组数据提供者。一个这样的数据平台 是以从华盛顿州雷蒙德市的微软公司获得的Windows Azure? Marketplace (视窗云平台 市场)。然而,各实施例可与包含结构化数据的其它存储一起使用。自然语言查询可被用作 系统的输入来形成对两个或更多个数据集提供者的语义合适查询,这两个或更多个数据集 提供者可接着被使用这些语义合适查询来查询。来自两个或更多个提供者的结果可被聚集 并作为单个统一结果提供给用户。 现参考图1,示出了一个示例。一些实施例包括位于中央位置中的(例如云104中 的)、主存了查询模式集106的引擎102,该查询模式集耦合到底层数据存储108 - 1、108 - 2到108 - η中的结构化数据。由用户100提供的查询110被映射到来自查询模式106的 最接近的结构化模式,且引擎102接着针对结构化数据存储108 - 1、108 - 2到108 - η 中的两个或更多个执行查询112 - 1、112 - 2和112 - m中的两个或更多个查询(其中在 每个情况下,m和η均分别指示某个查询数和某个其他数据存储数,使得在仅仅三个明确示 出时,省略号和变量m和η表示其它查询数和数据存储数可被实现)。针对不同数据存储的 查询可一起使用。例如查询可被链接。来自一个或多个早先查询的输出(例如结果114 一 1、114 一 2或114 一 m中的一个或多个)可被用于后续查询(例如112 - 1到112 - m中 的一个或多个)。用户查询110和所选择的查询模式查询(查询112 - 1到112 - m中的 两个或更多个)的结果是特定值,该特定值随后被当做结果116返回给用户100。该值是对 用户100通过该模式提出的问题的回答。 下面示出了一示例:自然语言查询Crime rate in Seattle (西雅图的犯罪率) 映射到模式Crime rate in {City} ({城市}中的犯罪率),这接着被翻译成针对适合每 个给定数据存储库的结构化数据存储库的查询集(诸如OData查询、SQL查询或以另一个 查询语言的查询)。这些查询导致表示西雅图的犯罪率的特定值。随后将这一值返回给用 户。 -些实施例可在电子表格应用(诸如从华盛顿州雷蒙德市的微软公司获得的 Excel?)中使用查找或类似功能来实现。这样的示例在图2中示出。图2示出了电子表 格应用的用户界面202。电子表格界面202的B列包括如下构建的专用查找(Lookup)命 令:=DL00KUP( Crime rate in&A5)。DL00KUP命令可具有用于连接到引擎102和相关 联的查询模式集1〇6(见图1)的功能。用户可向单元格A5键入城市名,DL00KUP将返回那 个城市的犯罪率。该命令由引擎102翻译成可针对不同数据存储(诸如数据存储108 - 1到108 - η)运行的语义合适查询。结果可接着被返回并在单元格B5显示。图2还在 第8行示出了股票报价示例。在此示例中,单元格B5可具有如下构建的专用查找命令:= DLOOKUP( Stock quote for&A8) 替换地或附加地,各实施例可被实现为可在诸如Microsoft? Communicator(微 软通信器)的即时消息收发客户端中使用的机器人(bot)。例如,用户可能能够使用即时消 息收发客户端来连接到信息服务。现参考图3,示出了一个示例。图3示出了用于消息收发 客户端的用户界面302。用户可提出自然语言查询,就像用户正在与另一个人类用户聊天一 样。例如,图3示出了各种自然语言查询,包括Last high temperature in Seattle (西雅 图的最近高温)、Last market price for MSFT(MSFT 的最近市场价格)、Stock quote for MSFT(MSFT的股票报价)、和Crime rate in Seattle (西雅图的犯罪率)。本文档来自技高网...

【技术保护点】
一种在分布式计算环境中查询有限数据源集的方法,所述方法包括:从用户接收查询;从所述有限数据源集中确定可被一起用于满足所述查询的两个或更多个数据源的集合;将来自所述用户的所述查询的至少一部分翻译为针对所述两个或更多个数据源的语义合适查询;从所述两个或更多个数据源接收所述语义合适查询的结果;聚集所述结果;并将所述聚集呈现给所述用户。

【技术特征摘要】
【国外来华专利技术】2012.05.15 US 13/471,7071. 一种在分布式计算环境中查询有限数据源集的方法,所述方法包括: 从用户接收查询; 从所述有限数据源集中确定可被一起用于满足所述查询的两个或更多个数据源的集 合; 将来自所述用户的所述查询的至少一部分翻译为针对所述两个或更多个数据源的语 义合适查询; 从所述两个或更多个数据源接收所述语义合适查询的结果; 聚集所述结果; 并将所述聚集呈现给所述用户。2. 如权利要求1所述的方法,其特征在于,从所述用户接收的所述查询是自然语言查 询。3. 如权利要求1所述的方法,其特征在于,语义合适查询串行运行,且其中聚集包括将 来自一个数据源的结果用于针对另一数据源的查询。4. 如权利要求1所述的方法,其特征在于,语义合适查询...

【专利技术属性】
技术研发人员:C·林斯伯格Q·张M·乌里茨基
申请(专利权)人:微软公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1