用于数据库查询的计算机系统和方法技术方案

技术编号:3487352 阅读:252 留言:0更新日期:2012-04-11 18:40
在包括多个节点和互连所述节点的多个网络的网络计算机系统中,数据库查询优化器在优化查询时考虑网络选择。所述查询优化器为查询记录包括网络信息的历史信息。网络监控器确定所述多个网络的网络特征。随后所述查询优化器根据所述网络特征,并且可选地也根据所述历史信息为查询选择网络。结果是考虑网络选择的查询优化器,由此提供根据所述网络的所述特征优化的查询。

【技术实现步骤摘要】

本专利技术一般地涉及数据库查询优化,并且更特别地涉及一种在包括 多个节点和多个网络路径的系统中当执行查询时考虑网络选择的查询优 化器。
技术介绍
已经开发了数据库系统,其允许计算机以允许用户搜索和获取数据 库中特定信息的方式存储大量信息。例如,保险公司的数据库可以包含其所有^:保人及投保人的当前帐户信息,包括支付记录、保险金额、保 单号、保单类型、排除给付等。数据库系统允许保险公司在其数据库中 从数以千计以及可能数百万的投保人中获取某个投保人的帐户信息。从数据库中获取信息典型地通过使用查询完成。数据库查询典型地 包括一个或者由逻辑算子互连的多个谓词表达式。已开发出了数据库查 询优化器,用来评估查询以及确定如何根据影响查询性能的多个不同因 素最佳地执行所述查询。然而,已知的查询优化器在执行查询时均未能 考虑对网络的选择。作为结果,已知的查询优化器不能根据多个网络的 特征优化查询。
技术实现思路
在包括多个节点和互联所述节点的多个网络的网络计算机系统中, 数据库查询优化器在优化查询时考虑网络选择。所述查询优化器为查询 记录包括网络信息的历史信息。网络监控器确定所述多个网络的网络特 征。随后所述查询优化器根据所述网络特征,并且可选地也根据所述历 史信息为查询选择网络。结果是考虑网络选择的查询优化器,由此提供 根据所述网络的特征优化的查询。参照附图和以下更具体的描述,将理解前述的和其它的特征和优势。附图说明参照附图对本专利技术进行描述,其中相同的元件使用相同的参考标号。图1是包括查询优化器的网络计算机系统的方框图,其中所述优化器在优化数据库查询时考虑网络选择;图2是可以由图1中的网络监控器124确定的可能的网络特征表124;图3是根据优选实施例的计算机系统的方框图,所述计算机系统通 过多个网络连接到多个其它计算机系统(或节点);图4是图1和图3中的查询优化器125在执行查询时选择网络的方 法的流程图5是所述查询优化器在执行查询时记录包括网络信息的历史信息的方法的流程图6是将查询与执行所述查询使用的网络相关联的历史信息表;图7是图1和图3中的网络监控器123确定和存^f诸网络特征的方法的流程图;以及图8是代表图1和图3所示网络特征124的一个特定实现的网络文 件记录表。具体实施例方式已开发出包括通过多个不同网络路径彼此连接的多个节点的计算机 系统。IBM开发的BlueGene超级计算机家族包括通过多个不同网络连 接到一起的数以千计的计算机节点。例如,在BlueGene体系结构中,节 点通过环接(torus)网络和逻辑树网络互连。环接网络利用环回链路在 三维网格中连接节点。逻辑树网络以二叉树配置连接所有节点,其中每 个节点有一个父节点和两个子节点,不过根据硬件配置,某些节点也可 能有一个子节点或没有子节点。在BlueGene体系结构中,环接和逻辑树 网络是独立网络,这意味着其不共享网络资源如链路或分组注入FIFO。当节点象在Blue Gene体系结构中那样与不同的独立网络互连时, 选择使用哪个网络能够影响包括其它节点的数据库查询的性能。作为结 果,查询优化器现在可以在执行数据库查询时考虑对网络的选择。已知 的查询优化器在优化数据库查询时考虑多种因素,但没有一种已知的查 询优化器在执行查询时考虑网络选择。本公开和权利要求书提供了 一种在执行查询时考虑网络选择的查询 优化器。所述查询优化器为查询记录表示过去执行查询时网络选择的历 史信息。网络监控器确定每个所述网络的网络特征。随后所述查询优化 器根据查询本身的属性,根据所述历史信息以及根据所述网络特征选择 网络。结果是能够更优化地执行查询的查询优化器,其当在网络计算机 系统中通过多个网络与其它节点连接的节点上执行查询时考虑网络选 择。参考图1,所示系统115包括通过多个网络(在图1中示出为107A, 107B, 107C,..., 107N)连接到一起的多个节点105。所述多个网络也连接 到网络监控器123,网络监控器123监控网络并确定适当的网络特征124。 数据库查询优化器125记录包括在查询优化器125执行查询时的网络选 择信息的历史信息127 。网络选择机制126根据网络特征124和/或历史 信息127为查询选择网络。结果是在执行查询时考虑网络选择的查询优 化器125。在最优选的实现中,所述多个网络是独立网络,因此一个网 络的问题不影响不同网络的功能。然而,也可以使用不独立的网络。图2的表中示出了网络特征124的一些特定例子。网络特征124可 以包括表征网络的网络拓朴项目210,如网格型、环接型、环型、总线 型、树型等。网络利用率220可以表示网络是否忙、故障、空闲等。网 络延时230表明网络的延迟。也可以指定其它网络能力240,如算术逻 辑单元(ALU)归约操作。图2所示是网络特征的一些具体例子,本公 开和权利要求书明确地扩展到包括能够描述或以其它方式表征网络的任 何适当的参数或度量的网络特征。参考图3,计算机系统IOO是计算机系统的一个适当的实现,所述 计算机系统可以是通过多个网络将多个节点互连的网络计算机系统中的节点,并且包括在执行数据库查询时考虑网络选择的查询优化器。计算机系统100是IBM e Server System i计算机系统。但是,本领域的技术 人员可以理解,本公开可以同样地用于任意计算机系统,无论计算机系 统是复杂的多用户计算机装置、单用户工作站、嵌入式控制系统,还是 或大型并行计算机系统,如IBM开发的BlueGene计算才几系统。如图3 所示,计算机系统100包括一个或多个处理器110、主存储器120、大型 存储接口 130、显示器接口 140以及多个网络接口,在图3中示为网络 ^接口 150A、 150B和150N。这些系统组件通过^f吏用系统总线160互连。 大型存储接口 130用于将大型存储设备(如直接访问存储设备155)连 接到计算机系统100。 一种特定类型的直接访问存储设备155是可读可 写CD-RW驱动器,其可以向CD-RW 195写入数据或从CD-RW 195获 取数据。主存储器120优选地包含数据121、操作系统122、网络监控器123 和数据库查询优化器125。数据121代表任何作为计算机系统100中任 何程序的输入或输出的数据。操作系统122是行业内公知为i5/0S的多 任务操作系统;然而,本领域的普通技术人员将可以理解,本专利技术的精 神和范围不限于任何一种操作系统。网络监控器123是监控连接到计算 机系统100的多个网络的特征的软件机制。所述网络监控器将这些特征 记录为网络特征124。所述数据库查询优化器包4舌网络选择机制126和 历史信息127。当查询优化器125执行数据库查询时,它记录包括网络 选择信息的历史信息127。网络选择机制126在执行查询时通过查看所 述查询本身的属性和/或网络特征124和/或历史信息127为所述查询考 虑网络选择。通过在执行查询时考虑网络选择,查询优化器125可以增 强所述查询的性能。计算机系统100采用公知的虛拟寻址机制,其允许计算机系统100 的程序如同只访问大型、单个存储实体而不是访问多个较小存储实体(如 主存储器120和DASD设备155)那样工作。因此,虽然数据121本文档来自技高网...

【技术保护点】
一种装置,包括:至少一个处理器;连接到所述至少一个处理器的存储器;连接到多个网络的多个网络接口;以及查询优化器,存在于所述存储器内并且由所述至少一个处理器执行,所述查询优化器在执行数据库查询时,通过在选择所述多个网络中的至少一个网络用于执行所述查询时考虑所述多个网络的特征,而考虑网络选择。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:EL巴斯内斯DL达林顿A彼得斯JM桑托苏奥索
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1