计算机系统、服务器以及作业执行控制方法技术方案

技术编号:2844204 阅读:170 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供一种计算机系统及其构成服务器、作业执行控制方法和程序,在网格计算中,可执行从计算机的种类或使用状态及作业种类等方面看最适当的调度,可容易地应对系统结构的变更。在网格计算系统中,向网络上的处理服务器发出作业执行请求的中央服务器(100)具备:向处理服务器分配应执行的作业,发出作业执行请求的调度部(110);和PS代理部(120),在管理处理服务器(200)的信息的同时,接收调度部(110)发出的请求,依据被分配以有关该请求的作业的处理服务器(200)的操作状态,将该请求发送到处理服务器(200)。代理部(120)可连接进行询问的类型的处理服务器(200)和不进行询问的类型的处理服务器(200)两者。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及网格计算,特别涉及向计算机分配作业的调度方法及实现该方法的系统结构。
技术介绍
近年来,综合利用通过网络而连接的异质性(heterogeneous)(不同机种混杂)的信息系统、被称为网格计算的系统倍受关注。在该系统中,共享网络上多个计算机中的CPU功率或数据存储等计算机资源,并用作1台虚拟的高性能计算机。通过使多个计算机执行并列处理,即便1台计算机的性能降低,也能高速地执行大量的处理。在网格计算中,用以根据作业的特性或优先顺序来确定提供给系统的作业(程序的处理单位)的执行顺序的调度是非常重要的。在以不同机种混杂的环境为前提的网格环境中,除必需向性能不同的多个计算机分配作业之外,所分配的作业的大小也是各式各样的。另外,由于不只是从本地用户、还从远程用户处提供作业,所以必需适当地设定各种作业的执行调度。网格计算中的作业调度方式大致有推(Push)型和挽(Pull)型。在推型(例如参照非专利文献1)调度方式中,在调度程序中有作业加入时,调度程序分配应处理该作业的计算机,请求该计算机执行作业。这时,调度程序监视各计算的利用状态,根据作业的负荷信息等来分配最适当的计算机和作业。该推型调度方式多用于主要由称为网格簇的、几百台左右的服务器(计算机)构成且它们被配置在同一站点内的类型的网格系统。另外,推型调度方式可特别地向最适当的计算机分配作业,可执行最适当的调度。尤其是,各计算机的行为存在差异、且在用户使用计算机时取消作业的环境中,在附加了这样的操作环境的基础上,通过最适当的调度,可期待效率非常好的运用。另外,在挽型(例如参照非专利文献2)调度方式中,在各计算机成为可执行作业的状态时,以询问的形式向调度程序请求作业。然后,在发出该请求时,如果是应执行的作业,则调度程序向该计算机分配作业,计算机执行分配的作业。在没有应执行的作业时,计算机经过一定时间后再次进行询问。该挽型调度方式由于能以非常简单的结构进行安装,所以多在几千台规模的网格系统中使用。尤其是,针对构筑于互联网络上的网格,由于网络的限制,多使用该挽型调度方式。另外,在挽型调度方式中,计算机的管理信息简单,易适用于多个计算机。于是,通过基于询问的自身最适当化(越是具有裕度的计算机越频繁地进行询问)来谋求某种程度的效率化。非专利文献1Chirs Smith,“Open Source Metascheduling forVirtual Organizations with the Community SchedulerFramework(CSF)”,Technical Whitepaper,Platform ComputingInc.2003年8月非专利文献2Erie Korpe,Dan Werthimer,David Anderson,Jeff Cobb,Matt Lebolsky,“Massively Distributed Computing forSETI”,computing in Science & amp;Engineering,Vol3,Issue1,Jan.-Feb.2001,Pages78-83.
技术实现思路
如上所述,网格计算中的现有调度方式可在推型调度方式的情况下分配最适当的作业。可是,为了进行最适当的调度,必需管理各计算机的使用状态。因此,调度程序的操作变得复杂,不能容易地应对系统结构的变更(增减执行作业的计算机等)。另外,由于是从调度程序访问各计算机后请求执行作业的方式,所以不能适用于防火墙内侧的计算机等。另外,如果是挽型调度方式,则如上所述,由于调度程序所需的计算机管理信息简单,所以可容易应对系统结构的变更,另外,由于利用来自计算机的询问来进行网络上的访问,所以也可以向防火墙内部的计算机分配作业。可是,尽管基于询问来进行自身最适当化,但在挽型调度方式中,即便存在应执行的作业,也会因等待来自计算机的询问、请求执行作业,而产生时间的损失。另外,在进行询问时,分配应执行的多个作业中、最适合进行该询问的计算机的作业,但是根据该作业的种类,有可能存在更适合的其他计算机,所以从整个系统看未必是效率最高的最适当调度。因此,本专利技术的目的在于提供一种系统及其作业执行控制方法,其在网格计算中,从计算机的种类或使用状态以及作业种类两方面实现最适当的调度,同时,可容易地应对系统结构的变更。另外,本专利技术的另一目的在于,在包含因防火墙等而具有访问限制的计算机的网格中,也可分配与推型调度方式同等的最适当作业。本专利技术的另一目的还在于,提供组合了推型和挽型的调度方式及使用该调度方式的系统。为了实现上述目的,本专利技术被实现为利用经网络连接的多个计算机而实现网格计算系统的、如下构成的计算机系统。即,该计算机系统具备中央服务器,是向网络上的计算机发出作业执行请求的计算机;和处理服务器,是响应来自中央服务器的要求而执行作业的计算机。而且,该中央服务器具备调度部,用以向处理服务器分配应执行的作业并发出作业执行请求;和代理部,在管理处理服务器的信息的同时,接收调度部发到的请求,根据被分配以有关该请求的作业的处理服务器的状态,将该请求发送到处理服务器。其中,更具体而言,代理部相对于多个处理服务器一一对应设置。另外,最好代理部从处理服务器取得与对应的处理服务器的能力及操作状态有关的信息并进行管理。然后,调度部根据由代理部管理的信息,向处理服务器分配作业。另外,代理部根据对处理服务器的访问类型、或响应由来自处理服务器的询问导致的访问,发送从调度部接收到的请求,或在由代理部管理的定时发送从所述调度部接收到的请求。更具体地说,由于在存在经防火墙与中央服务器连接的处理服务器的情况下,不能越过防火墙从中央服务器访问处理服务器,所以在等待由来自处理服务器的询问而导致的访问后发送请求。另外,为实现上述目的的另一本专利技术作为利用计算机执行网格计算系统中的作业调度及发出该作业的执行请求的如下作业执行控制方法而实现。即,该作业执行控制方法的特征在于,包含根据存储于存储装置中的、构成系统且执行作业的处理服务器的能力,与该处理服务器的操作状态无关地分配作业的步骤;和向被分配以作业的处理服务器发出作业执行请求的步骤;和暂时保持发出的作业执行请求,并根据被分配以作业的处理服务器的操作状态,将其发送到该处理服务器的步骤。进而,本专利技术被实现为控制计算机来实现上述中央服务器的功能的程序,或使计算机执行与上述作业执行控制方法的各步骤相对应的处理的程序。该程序可通过存储于磁盘、光盘或半导体存储器等记录媒体中进行分发,或通过经网络分发来提供。根据如上述构成的本专利技术,在网格计算中,在中央服务器中设置用以中继调度程序与处理服务器之间的通信的代理部,利用代理部的控制来吸收处理服务器的访问类型的差异,从而无论处理服务器的访问类型的差异如何,均可从计算机的种类或使用状态及作业种类这两方面进行最适当的调度。于是,通过针对每个处理服务器来设置代理部,可容易地增减处理服务器,以变更系统结构。另外,根据本专利技术,通过利用代理部的控制来吸收在处理服务器的访问类型上的差异,使现有的直接接收用以执行推型调度的作业执行请求的处理服务器、和现有的在执行了进行挽型调度的询问之后接收作业执行请求的处理服务器混合存在本文档来自技高网
...

【技术保护点】
一种利用经由网络而连接的多个计算机来实现网格计算的计算机系统,包括:向网络上的计算机发出作业执行请求的中央服务器;和响应来自所述中央服务器的请求而执行作业的处理服务器,所述中央服务器包括:调度部,向所述处理服 务器分配应执行的作业,发出作业执行请求;和代理部,在管理所述处理服务器的信息的同时,接收所述调度部发出的所述请求,对应于被分配以有关该请求的作业的处理服务器的状态,将该请求发送到该处理服务器。

【技术特征摘要】
【国外来华专利技术】JP 2004-3-19 080396/20041.一种利用经由网络而连接的多个计算机来实现网格计算的计算机系统,包括向网络上的计算机发出作业执行请求的中央服务器;和响应来自所述中央服务器的请求而执行作业的处理服务器,所述中央服务器包括调度部,向所述处理服务器分配应执行的作业,发出作业执行请求;和代理部,在管理所述处理服务器的信息的同时,接收所述调度部发出的所述请求,对应于被分配以有关该请求的作业的处理服务器的状态,将该请求发送到该处理服务器。2.根据权利要求1所述的计算机系统,其特征在于所述代理部相对于多个所述处理服务器一对一地对应设置。3.根据权利要求2所述的计算机系统,其特征在于所述代理部从该处理服务器取得并管理与对应的所述处理服务器的能力及操作状态有关的信息,所述调度部根据所述代理部中管理着的所述信息,向所述处理服务器分配所述作业。4.根据权利要求1所述的计算机系统,其特征在于所述代理部对至少一部分所述处理服务器,响应由来自该处理服务器的询问导致的访问而发送从所述调度部接收到的所述请求,而对至少另一部分所述处理服务器,在由代理部管理的定时发送从所述调度部接收到的所述请求。5.根据权利要求1所述的计算机系统,其特征在于至少一部分所述处理服务器经防火墙连接于所述中央服务器,所述代理部对经所述防火墙而连接的所述处理服务器,响应由来自该处理服务器的询问导致的访问而发送从所述调度部接收到的所述请求。6.一种执行网格计算系统中的作业调度及发出该作业执行请求的服务器,其特征在于,包括调度部,向构成系统的计算机分配应执行的作业,并发出该作业的执行请求;和代理部,在管理所述计算机的信息的同时,代替被分配以该作业的该计算机接受由所述调度部发出的所述作业执行要求,根据该计算机的状态而向该计算机发出该作业的执行请求。7.根据权利要求6所述的服务器,其特征在于所述代理部按构成系统的每个所述计算机而设置,各自以在与对应的计算机之间设定的单独的通信形式来发出所述作业执行请求。8.根据权利要求7所述的服务器,其特征在于至少一部分所述代理部响应由来自构成系统的所述计算机的询问所导致的访问而向该计算机发出所述作业执行请求,至少另一部分所述代理部在由代理部管理的定时向对应的所述计算机发出所述作业执行请求。9.一种执行网格计算系统中的作业调度及发出该作业的执行请求的服务器,其特征在于,包括代理部,在管理与构成系统的计算机的能力及操作状态...

【专利技术属性】
技术研发人员:米泽隆杉本和敏美园和久
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1