使用存储器中的智能索引的分区过滤制造技术

技术编号:14697357 阅读:52 留言:0更新日期:2017-02-24 02:09
示例装置和方法检测对布置在表格‑实体‑属性组织中的表格仓库中的分区的查询。分区是具有相同分区键值的实体的集群。如果查询寻求在分区中的特定实体上过滤,则分区可以被复制到存储器(例如,结构化共享缓存器、共享存储器),该存储器准备有促进过滤分区的一个或多个索引。示例装置和方法可以将分区从表格仓库复制到存储器中并且然后使用一个或多个索引过滤来自存储器的特定字段上的分区。过滤特定字段上的分区可以使用可用于存储器的所有索引而并行地进行,可能地大规模并行地。

【技术实现步骤摘要】
【国外来华专利技术】
技术介绍
结构化查询语言(SQL)数据库模型依赖于关系数据库中的表格式关系。代表“不仅”SQL的NoSQL是指用于存储和检索不使用SQL模型的数据的方案。NoSQL模型可以使用针对检索和添附而优化的表格存储装置中的实体中的键-值对。针对一个动作的优化可能使得其它动作具有欠佳的性能。键-值仓库允许数据以无模式方式存储,例如对象(例如,二进制大对象(BLOB))。表格存储系统可以建立在BLOB和NoSQL框架上。类似于所有数据结构和组织,表格存储系统可以针对一种类型的操作很好地工作,但是可能对于另一种类型的操作不会很好地工作。表格存储系统可以使用NoSQL数据库存储大量数据。数据可以例如是非结构化数据。数据也可以例如是结构化但非关系数据。表格存储系统可以优化以用于存储结构化、非关系数据。表格存储系统可以存储表格。表格可以被视为实体的集群。实体粗略地对应于无模式数据库记录。表格可以存储具有不同属性集合的不同实体。一个属性可以是促进将项目分组到分区或集群中的分区键。表格可以具有多个“分区”,其中分区被限定为具有用于其分区键的相同值的实体。在分区内可以存在具有不同属性集合的不同实体。实体可以被视为属性集合。在面向对象的系统中,实体可以使用例如定制分类而映射到对象。将实体添加到表格可以涉及创建限定实体的属性(例如,名称-值对)的分类。属性可以被限定为名称-值对。表格可以不向实体强加模式要求,即便是实体可以具有分区键和行键的情况下。行键可以是用于分区中的实体的唯一标识符。不同类型的查询可以从表格寻求不同类型的数据。例如,第一查询可以寻求检索分区中的所有实体,而第二查询可以寻求仅检索分区中的一些实体。一个查询可以寻求关于具有姓“Smith”的人的数据,并且然后在由之前查询所返回的实体集合上的随后查询可以寻求关于姓为Smith且其名在“John”之前的人的数据。另一查询可以得到关于具有某一分区键(例如,姓“Smith”)和某一行键(例如,名“John”)的所有人的数据。针对具有分区键的分区的表格-实体-属性组织可以优化某些操作,但是可以在支持其它操作时面临挑战。例如,过滤特定字段(例如,属性名称)而不是分区键或行键上的分区可能是挑战性的。
技术实现思路
提供该
技术实现思路
来以简化形式引入以下在具体实施方式中进一步描述的概念的选择。该
技术实现思路
不意图标识所要求保护的主题的关键特征或必要特征,也不意图用于限制所要求保护的主题的范围。示例方法和装置针对使用表格-实体-属性组织而改进存储在表格仓库中的表格中的特定字段上的过滤。如本文中使用的术语“字段”是指属性,其中属性是名称-值对。如本文中使用的术语“过滤”是指检索在表格的分区中发现的实体的特定子集。常规地,为了在特定字段上过滤,表格仓库可能已经首先扫描整个分区并且然后在特定字段上过滤。扫描和过滤可能已经在查询每一次寻求与特定字段相关联的数据时发生。特定字段上的过滤的欠佳性程度可能随其中执行过滤的分区的大小而直接地变化。示例方法和装置提供可以针对其准备一个或多个索引以支持特定字段上的过滤的存储器(例如,共享存储器、缓存器、结构化共享缓存器)。过滤将在存储器中而不是在表格仓库中执行。具有用于其分区键的公共值的实体的集群(例如,分区)可以从表格仓库读取到存储器中并且然后在存储器中使用(多个)索引过滤。代替于针对寻求在特定字段上过滤的每一个查询而扫描表格仓库中的整个分区,示例装置和方法可以将分区读取到已经针对其准备(多个)索引的存储器中。存储器可以布置成使得一个或多个字段可以被用作索引以支持查询。在一个示例中,存储器可以布置成使得与分区中的名称-值对相关联的任何属性名称可以被用作索引以支持查询(例如,语言集成查询、NoSQL查询)。存储器还可以布置成使得可以并行地执行查询。因而,代替于扫描表格仓库中的整个分区,对分区的第一查询可以使得分区被读取到存储器(例如,结构化共享缓存器)中。然后可以在存储于存储器中的数据上执行过滤。分区上的随后查询可以从存储器提供服务而不是返回到表格仓库中。在一个实施例中,一旦已经将分区读取到存储器中,就可以更新分区以便替代于或附加于更新表格仓库中的分区。附图说明附图图示了本文描述的各种示例装置、方法和其它实施例。将领会到,在图中所图示的元件边界(例如,框、框群或其它形状)表示边界的一个示例。在一些示例中,一个元件可以设计为多个元件,或者多个元件可以设计为一个元件。在一些示例中,被示为另一元件的内部组件的元件可以作为外部组件而实现,并且反之亦然。此外,元件可能没有按照比例绘制。图1图示了用于使用存储器中的智能索引过滤特定字段上的分区的示例系统。图2图示了用于使用存储器中的智能索引过滤特定字段上的分区的示例系统。图3图示了用于使用存储器中的智能索引过滤特定字段上的分区的示例方法。图4图示了用于使用存储器中的智能索引过滤特定字段上的分区的示例方法。图5图示了用于使用存储器中的智能索引过滤特定字段上的分区的示例装置。图6图示了用于使用存储器中的智能索引过滤特定字段上的分区的示例装置。图7图示了支持过滤特定字段上的分区的存储器中的智能索引可以在其中操作的示例云操作环境。图8是描绘了可以与支持过滤特定字段上的分区的存储器中的智能索引交互的示例性移动通信设备的系统图。具体实施方式示例装置和方法提供了用于在分区与表格-实体-属性组织相关联时过滤特定字段上的分区的不同方案。分区可以初始地存储在表格存储系统中。表格存储系统可以包括一个或多个数据仓库。分区可以移动到支持具有可用于过滤分区的一个或多个索引的存储器。存储器可以例如是共享存储器或者缓存器。存储器可以是位于表格存储系统外部的数据仓库。表格存储系统可以使用表格-实体-属性组织存储大量结构化但是非关系数据。数据可以使用例如二进制大对象(BLOB)存储在表格中。表格可以是实体的集群。表格中的实体可以粗略地对应于数据库记录。实体中的属性可以粗略地对应于数据库记录中的字段,其中字段可以具有名称和值。表格可以经由例如具象状态传输(REST)应用编程接口(API)而从包括移动设备的许多位置可访问。查询可以使用REST接口呈现给表格存储系统。一些用户可能想要通过特定字段过滤分区。建立在表格-实体-属性和BLOB框架上的常规表格存储系统可能受到该操作的挑战。例如,常规系统可以扫描表格存储系统中的整个分区并且然后在字段上过滤。这可以针对寻求在字段上过滤的分区上的每一个查询而完成。这在时间、处理器循环、输入/输出操作和其它机器性能参数方面可能是低效的。示例装置和方法以与常规系统不同的方式操作。代替于没有分区特定索引的益处的表格仓库中的过滤,示例方法和装置可以准备分区特定以及甚至查询特定的索引并且将分区复制到其中使用那些索引对它过滤的存储器中。图1图示了可以产生查询的前端服务器110。查询可以设计成过滤特定字段上的分区。查询可以呈现给表格服务器120。前端服务器110可以位于高等待时间链接150(例如,网络链接)的一侧上,并且表格服务器120可以位于高等待时间链接150的另一侧上。表格服务器120可以能够访问表格仓库存储器140和共享存储器130二者。表格服务器120可以通过访问表格仓库存储器140或者通过访问共享存储器130来确定是否应当本文档来自技高网
...
<a href="http://www.xjishu.com/zhuanli/55/201580016793.html" title="使用存储器中的智能索引的分区过滤原文来自X技术">使用存储器中的智能索引的分区过滤</a>

【技术保护点】
一种方法,包括:检测从位于表格仓库中的表格中的分区寻求信息的查询,其中查询寻求在分区中的特定属性上过滤,其中表格仓库根据表格‑实体‑属性组织进行布置,并且其中分区是表格中的实体的集群;为存储器准备促进过滤分区的一个或多个索引;将分区从表格仓库复制到存储器中;使用一个或多个索引过滤所述特定属性上的分区,其中分区在存储器中过滤;在将分区从表格仓库复制到存储器中之前、期间或之后序列化分区;在确定查询没有寻求在特定属性上过滤时,从表格仓库为查询提供服务;以及在确定查询寻求在特定属性上过滤时,并且在确定分区已经处于存储器中时,从存储器为查询提供服务。

【技术特征摘要】
【国外来华专利技术】2014.03.27 US 14/2268661.一种方法,包括:检测从位于表格仓库中的表格中的分区寻求信息的查询,其中查询寻求在分区中的特定属性上过滤,其中表格仓库根据表格-实体-属性组织进行布置,并且其中分区是表格中的实体的集群;为存储器准备促进过滤分区的一个或多个索引;将分区从表格仓库复制到存储器中;使用一个或多个索引过滤所述特定属性上的分区,其中分区在存储器中过滤;在将分区从表格仓库复制到存储器中之前、期间或之后序列化分区;在确定查询没有寻求在特定属性上过滤时,从表格仓库为查询提供服务;以及在确定查询寻求在特定属性上过滤时,并且在确定分区已经处于存储器中时,从存储器为查询提供服务。2.权利要求1所述的方法,其中过滤特定属性上的分区使用可用于存储器的两个或更多索引并行地进行。3.权利要求1所述的方法,包括检测从分区寻求信息的两个或更多查询,其中两个或更多查询寻求在分区中的特定属性上过滤,并且过滤所述特定属性上的分区使用一个或多个索引,其中分区在存储器中并行地过滤。4.权利要求1所述的方法,其中表格-实体-属性组织中的表格包括实体的集合,其中表格-实体-属性组织中的实体包括属性的集合,并且其中表格-实体-属性组织中的属性包括名称-值对,其中表格不在实体上推行方案,其中表格可以存储具有不同属性集合的不同实体,并且其中分区可以具有带有不同属性集合的不同实体。5.权利要求4所述的方法,其中实体具有分区键和行键,其中分区键用于标识实体的相关集群,并且其中行键被用作用于分区内的实体的唯一标识符。6.权利要求1所述的方法,包括在将分区从表格仓库复制到存储器中之前、期间或之后压缩分区。7.权利要求1所述的方法,其中一个或多个索引是分区特定的或查询特定的。8.权利要求1所述的方法,其中存储器是结构化共享缓存器,并且其中存储器处于与表格仓库不同的存储装置中。9.权利要求1所...

【专利技术属性】
技术研发人员:R凯姆K茹安尼F吉拉尔W茹安尼
申请(专利权)人:微软技术许可有限责任公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1