【技术实现步骤摘要】
【国外来华专利技术】聚合查询的数据库系统和处理
技术介绍
用户越来越多地转向计算服务(诸如数据库引擎)以分析大量的数据。例如,在线分析处理(OLAP)系统可以被设计为分析临床测试数据或商务智能(BI)数据。然而,许多数据库系统不能提供对大数据集的实时或近实时的查询响应。因此,用户必须提前计划他们的分析,并且不能参与探索分析以试图对数据中的模式进行定位。一些“近似查询处理”(AQP)数据库系统通过提供对查询的近似答案来减少响应延迟。然而,这些系统所提供的答案可能远离实际答案,使得用户无法依赖于近似结果。
技术实现思路
本公开描述了用于构建数据库和/或处理查询的系统、方法和计算机可读介质。在一些示例中,一种计算设备可以确定数据集的第一子集,该第一子集包括至少部分地基于第一数据记录的相应测量值而从数据集中选择的第一数据记录。该计算设备可以确定索引,索引模块包括从断言到与断言相关联的数据集的一个或多个第二数据记录和到与一个或多个第二数据记录相关联的相应近似值的映射。此外,该计算设备还可以针对第一子集来处理查询以提供第一结果和第一精确度值;确定第一精确度值不满足预定精确度标准;以及针对索引来处理查询以提供第二结果。根据在本文中的示例查询处理技术,计算设备可以针对数据集的第一子集来处理查询以提供第一查询结果,第一子集包括至少部分地基于第一数据记录的相应测量值而从数据集中选择的第一数据记录。计算设备可以确定第一查询值不满足预定精确度标准。此外,计算设备可以针对数据集的第二子集来处理查询以提供第二查询结果,第二子集包括从数据集中选择的第二数据记录,其中第二数据记录中的个体记录满足第二子集的预定断言。根 ...
【技术保护点】
1.一种设备,包括:处理单元;以及计算机可读介质,所述计算机可读介质包括被配置用于由所述处理单元执行的模块,所述模块包括:采样模块,所述采样模块被配置为确定数据集的第一子集,所述第一子集包括至少部分地基于第一数据记录的相应测量值而从所述数据集中选择的所述第一数据记录;索引模块,所述索引模块被配置为确定索引,所述索引包括从断言到所述数据集的与所述断言相关联的一个或多个第二数据记录和到与所述一个或多个第二数据记录相关联的相应近似值的映射;以及查询模块,所述查询模块被配置为:针对所述第一子集来处理查询,以提供第一结果和第一精确度值;确定所述第一精确度值不满足预定的精确度标准;以及针对所述索引来处理所述查询,以提供第二结果。
【技术特征摘要】
【国外来华专利技术】2016.06.24 US 15/192,9091.一种设备,包括:处理单元;以及计算机可读介质,所述计算机可读介质包括被配置用于由所述处理单元执行的模块,所述模块包括:采样模块,所述采样模块被配置为确定数据集的第一子集,所述第一子集包括至少部分地基于第一数据记录的相应测量值而从所述数据集中选择的所述第一数据记录;索引模块,所述索引模块被配置为确定索引,所述索引包括从断言到所述数据集的与所述断言相关联的一个或多个第二数据记录和到与所述一个或多个第二数据记录相关联的相应近似值的映射;以及查询模块,所述查询模块被配置为:针对所述第一子集来处理查询,以提供第一结果和第一精确度值;确定所述第一精确度值不满足预定的精确度标准;以及针对所述索引来处理所述查询,以提供第二结果。2.根据权利要求1所述的设备,其中:所述采样模块还被配置为:确定所述数据集的断言相关联子集,所述断言相关联子集包括从所述数据集中选择的第三数据记录,其中所述第三数据记录中的个体记录满足所述断言相关联子集的预定的断言;并且所述查询模块还被配置为:针对所述断言相关联子集来处理所述查询。3.根据权利要求2所述的设备,其中所述查询模块被配置为:响应于确定所述第一精确度值不满足所述预定的精确度标准,针对所述断言相关联子集来处理所述查询。4.根据权利要求2或3所述的设备,其中:所述采样模块还被配置为:确定所述数据集的第二断言相关联子集,所述第二断言相关联子集包括从所述数据集中选择的第四数据记录;所述第四数据记录中的个体记录满足所述第二断言相关联子集的预定的第二断言;并且所述采样模块被配置为:确定所述断言相关联子集和所述第二断言相关联子集,所述断言相关联子集和第二断言相关联子集具有小于预定的阈值数目的相应数目的数据记录。5.根据权利要求1至4中任一项所述的设备,其中所述查询模块还被配置为:确定所述第一子集的一个或多个数据记录,其中所述一个或多个数据记录中的每个数据记录满足所述查询;以及基于所述一个或多个数据记录的计数来确定所述第一精确度值。6.根据权利要求1至5中任一项所述的设备,其中所述查询模块还被配置为:使用所述查询来搜索所述索引,以确定所述数据集的候选数据记录;至少部分地基于所述相应近似值来选择多个所述候选数据记录,以提供所选择的数据记录;以及至少部分地基于所选择的所述数据记录的相应测量值来确定所述第二结果。7.一种方法,包括:针对数据集的第一子集来处理查询以提供第一查询结果,所述第一子集包括至少部分地基于所述第一数据记录的相应测量值而从所述数据集中选择的第一数据记录;确定所述第一查询值不满足预定的精确度标准;以及针对所述数据集的第二子集来处理所述查询以提供第二查询结果,所述第二子集包括从所述数据集中选择的第二数据记录,其中所述第二数据记录中的个体记录满足所述第二子集的预定的断言。8.根据权利要求7所述的方...
【专利技术属性】
技术研发人员:丁博麟,黄思露,王篪,K·查克拉巴蒂,S·乔杜里,
申请(专利权)人:微软技术许可有限责任公司,
类型:发明
国别省市:美国,US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。