当前位置: 首页 > 专利查询>伊姆西公司专利>正文

在无共享分布式数据库中查询优先级的设备和方法技术

技术编号:8687921 阅读:169 留言:0更新日期:2013-05-09 07:46
无共享分布式数据库系统包括主节点和一组无共享节点。每个无共享节点包括存储在存储器中的节点状态表,其表征不同语句和实现每个语句的多个进程,每个进程的目标资源消耗率和进程活动信息,和监控器模块,由中央处理单元执行以处理节点状态表中的信息,并且根据指定给予语句的个人用户优先级的优先级标准来调节节点状态表中的值,使得根据优先级标准在无共享分布式数据库系统中处理与语句相关的查询。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术总地涉及数字数据存储和检索。更具体地,本专利技术涉及在无共享分布式数据库中查询优先级。
技术介绍
图1示出根据现有技术使用的无共享网络100。无共享网络或结构100包括主节点102和一组无共享节点104_A到104_N。每个无共享节点104具有它自己的专有的存储器、磁盘和输入输出设备,其操作独立于结构100中的任何其他节点。每个节点都是自给的,通过网络不进行任何共享。由此,在系统上不存在冲突点并且不共享系统资源。这种结构的优点在于其尺寸是高度可变的。在无共享网络上实现了企业数据库系统。这样的企业数据库系统用于支持商业智能(BI)操作。随着数据仓库情景中集成的数据资源的增大和分析处理的进展,查询工作负载的经典分类,例如在线交易处理(0LTP)、在线分析处理(0LAP)、载入、报告或大量同时发生的查询已经变得模糊。混合的工作负载已经变为现实,使得今天的数据库管理系统必须能够同时帮助和支持。混合工作负载的处理引起了一系列有意思的问题,因为工作负载的不同分量根据资源概况竞争资源,通常彼此负面影响。这需要允许用户对不同工作负载分配优先级的机制,然后通过相应地分配资源来实施优先级。下面的列表示出了竞争具有不同优先级的工作负载的最主要情景中的一些:载入vs报告分析处理的质量除了别的以外依赖于周期负载提供的数据的新鲜程度。负载通常以在线形式执行,即,数据库系统用于报告同时负载是激活的。及时完成负载对于所有进一步的分析和处理是关键的。这一情景的变形是夜间发生的负载。与报告工作负载相比,周期的负载通常被分配更高的优先级。战术vs策略分析同时发生的报告可能在合时(timeliness)方面对于商业的重要性上存在差异,通过报告需要得出商业决定的结果。战术分析通常对于商业具有近期影响并且通常与策略分析报告相比被分配更高的优先级。操作的工作负载这个参考操作紧急情况,其中管理者必须快速反应进行损坏控制,例如校正由于故障负载过程等引起的数据污染。这些工作负载应该比其他进行的动作具有优先权。操作安全性通过对临时用户的工作负载分配恰当的低优先级,管理员可以限制实验和偶然负载查询的影响,而不用必须持续监控系统上的所有动作或者预防性地拒绝用户的接入。由此,期望提供一种对数据库查询自动分配优先级的机制,其中该机制恰当地平衡竞争工作负载
技术实现思路
无共享分布式数据库系统包括主节点和一组无共享节点。每个无共享节点包括:节点状态表,存储在存储器中,所述节点状态表表征不同语句和实现每个语句的多个进程,每个进程的目标资源消耗率和进程活动信息。由中央处理单元执行的监控器模块处理节点状态表中的信息,并且根据指定给予语句的个人用户优先级的优先级标准来调节节点状态表中的值。根据优先级标准在无共享分布式数据库系统中处理与语句相关的查询。一种分布式数据库的节点,包括:节点状态表,存储在存储器中,所述节点状态表表征同时发生的数据库进程的运行时间统计数据;以及监控器模块,由中央处理单元执行以对于所述同时发生的数据库进程动态地改变目标资源消耗率,其中,每个同时发生的数据库进程周期地比较目标资源消耗率和实际资源消耗率,并且当实际资源消耗率超过目标资源消耗率时将资源消耗后退一定量时间。附图说明结合附图从下面的具体实施方式中可以更完全地理解本专利技术,其中:图1示出了根据现有技术实现分布式数据库的无共享系统结构。图2示出了根据本专利技术的实施例中利用的无共享分布式数据库系统的主节点。图3示出了根据本专利技术的实施例中利用的无共享分布式数据库系统的无共享节点。图4示出了根据本专利技术的实施例实现的节点状态表。图5示出了根据本专利技术的实施例实现的与监控器模块相关的处理。图6示出了根据本专利技术的实施例执行的作业处理操作。图7示出了根据本专利技术的实施例中利用的更新的节点状态表。在附图的多个视图中类似的附图标记指的是对应的部件。具体实施例方式本专利技术提供了基于并发数据库进程的运行时间统计数据来确定和重新计算并发数据库进程的理想目标速度以实现作业优先级的机制。每个进程使用控制理论原理来自主调整它的资源消耗。系统的自调节和分权设计使得即使存在例外情况时也能有效地区分优先级,例外情况包括软件缺陷或没有可度量的开心的情况下的不期望/未计划的查询终止。通过控制可用于单个查询CPU时间,机制根据优先级自动地平和工作负载之间的资源。技术杠杆控制理论主要用于实现后退机制,在该机制中,每个参与的进程周期地检查它是否已经超过了其资源消耗的当前目标速率。如果是,通过将CPU释放特定量的时间来进行后退操作。该原理的连续的应用导致实际和理想资源消耗率之间的快速收敛。图2示出了用于实现本专利技术的操作的主节点202。主节点202包括标准元件,例如一个或多个CPU 210_八到210_1 CPU通过总线214附接于输入/输出设备212。输入/输出设备202可以包括标准元件,例如键盘、鼠标、显示器、打印机等。网络接口电路216还连接至总线214,允许主节点202在联网环境下操作。存储器220还连接至总线214。存储器220存储可执行指令以实现本专利技术的实施例。存储器存储查询解析器222。查询解析器222包括可执行指令以解释数据库查询。查询解析器222通常检查正确的句法并且建立数据结构(例如树)来表示查询。存储器还存储查询计划器或查询优化器224。查询计划器224处理查询解析器的输出并且研发查询计划以执行查询。查询计划制定一组步骤,用于接入或修改与查询相关的数据。细节,例如如何接入给定数据关系、以什么顺序加入数据关系、排序顺序等,可以形成查询计划的一部分。对于给定的查询,可以通过改变查询计划的不同构成部分,例如接入路径、加入方法、加入断言和排序顺序,来生成大量查询计划。通常的数据仓库查询可以产生几亿可能的执行计划。可以关于各种参数对查询计划的成本建模,各种参数包括例如磁盘接入的数目和取得数据所需的响应时间。查询优化器对于给定查询可以评估所有可能的查询计划的成本,并且确定执行查询最优的,即最有效的计划。一旦选择查询计划,将其传给查询分配器226。查询分配器226在一组无共享节点上应用查询计划。图3示出了根据本专利技术的实施例实现的无共享节点304。无共享节点304还包括连接至总线314的标准元件,例如一组CPU 310_八到310_1 —组输入/输出设备312也连接至总线314。也连接至总线314的网络接口电路316提供对网络的连接。存储器320也连接至总线314。存储器320包括数据和控制下指令以实现本专利技术的操作。节点状态表322存储与系统中正在处理的查询相关的状态信息。监视器模块324包括可执行指令以检查节点状态表322中的信息。基于节点状态表信息的检查,监控器模块324实现CPU后退操作以恰当地对执行查询分配优先级。此外,通过系统状态信息和动态优先级调整,监控器模块324选择性地改变节点状态表322。图4提供了可以根据本专利技术的实施例使用的节点状态表400的例子。节点状态表400包括语句ID列402。语句ID列列出了在特定的无共享节点上当前正在被处理的不同查询。在这个例子中,两个查询Ql和Q2正在被处理。表400还包括进程ID列。每个查询通常被划分为若干并行进程或线程。在这个例子中,进程Pl和P2与查询Ql相关联,并且进程P3和P4本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】2010.03.31 US 12/751,2081.一种无共享分布式数据库系统,包括: 主节点;和 多个无共享节点,其中每个无共享节点包括: 节点状态表,存储在存储器中,所述节点状态表表征不同语句和实现每个语句的多个进程,每个进程的目标资源消耗率和进程活动信息,和 监控器模块,由中央处理单元执行以处理节点状态表中的信息,并且根据指定给予语句的个人用户优先级的优先级标准来调节节点状态表中的值,使得根据优先级标准在无共享分布式数据库系统中处理与语句相关的查询。2.根据权利要求1所述的无共享分布式数据库系统,其中,进程活动信息包括时间戳信息。3.根据权利要求1所述的无共享分布式数据库系统,其中,进程活动信息包括休眠状态。4.根据权利要求1所述的无共享分布式数据库系统,其中,监控器模块计算中央处理单元负载。5.根据权利要求1所述的无共享分布式数据库系统,其中,监控器模块改变进程目标资源消耗率。6.根据权利要求1所述的无共享分布式数据库系统,其中,监控器模块具有可配置的扫描频率,用于限定节点状态表...

【专利技术属性】
技术研发人员:西瓦芮马里旭南·纳拉亚南迈克尔·F·瓦斯
申请(专利权)人:伊姆西公司
类型:
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1