RAID设备和通信-连接监控方法及程序技术

技术编号:2846519 阅读:258 留言:0更新日期:2012-04-11 18:40
装置间通信监控单元(62-1)通过从用于监控模块间通信的预定固定超时时间(T2)中减掉经历时间(T)而计算出可变超时时间(T2-T),以监控模块间通信的经历时间。固定超时时间(T2)是比用于监控与通道的接口连接的预定接口连接检查时间(T1)短的时间。当模块间通信的经历时间(T)超过了可变超时时间(T2-T)时,装置间通信监控单元请求通道分开接口连接,然后,当从控制模块获得了结束响应时,请求通道进行接口重新连接,然后传送结束响应。

【技术实现步骤摘要】

本专利技术涉及RAID设备和通信-连接监控方法及程序,其中,当多个处理装置根据来自主机装置的处理请求分级地进行处理并且作出响应时,对通信超时时间进行监控,并且更加具体地讲,涉及这样的RAID设备和通信-连接监控方法及程序,其允许作出即使分级处理花费了时间也不致造成超过主机装置的通道连接的超时时间的响应。
技术介绍
传统上,用作全球服务器、开放服务器等使用的存储装置的RAID设备是由多个控制模块、通道适配器、装置适配器、盘盒(disk enclosure)和路由器构成的。控制模块各自包括CPU、高速缓存等,用来控制整个存储装置的操作。通道适配器是将RAID设备与各种服务器连接起来的模块,并且使用诸如光纤通道(Fibre Channel)或iSCSI之类的接口。装置适配器是将控制模块与驱动器盒(具有结合在其中的多个磁盘驱动器)连接起来的模块,并且使用光纤通道接口。此外,路由器是用于在控制模块、通道适配器和装置适配器之间进行高速连接的模块。在这样的传统RAID设备中,接收由服务器(其为主机装置)的通道通过接口连接发出的输入/输出请求,然后借助高速缓存对卷(volume)进行输入/输出处理。一般来说,通道和RAID设备之间的接口连接的通信时间是通过接口连接检查ICC来监控的。如果在通道和RAID设备处于连接状态的情况下,经过了预定的时间,则在通道端认定ICC超时错误,强制断开与RAID设备的连接、认定RAID设备不正常并且禁止随后的输入/输出请求。造成在通道端的接口连接检查ICC中出现超时错误的因素是,设置在RAID设备中的两个控制模块根据来自通道的处理请求分级地进行处理时的模块间通信(装置间通信),这样的通信会花费一些处理时间。因此,在传统的RAID设备中,将比通道端的接口连接检查ICC的超时时间短的时间设置为定时器值,作为监控用于由两个控制模块进行的分级处理的装置间通信的超时时间。当由两个控制模块进行的分级处理花费了时间时,会在与通道的通信连接的超时错误之前,引发在这两个控制模块中的装置间通信的超时错误。然后,从RAID设备端请求断开通道的接口连接,于是在认定接口连接检查ICC的错误之前,解除了接口连接。附图1是用于介绍在传统RAID设备中的通信-连接监控处理的示意图。在附图1中,通道200在时刻t1建立了与设置在RAID设备202中的控制模块204的接口连接,用于传送处理请求208。控制模块204读取该处理请求208,建立与控制模块206的装置间通信,然后在时刻t2发出处理请求210。控制模块206进行与处理请求210相对应的处理执行215,并且在时刻t4返回代表正常结束的处理响应212。在接收到这个响应时,控制模块204在时刻t6向通道200传送处理响应214。通道200随后解除与RAID设备202的连接。这里,通道200在时刻t1将接口连接检查(ICC)216的超时时间T1设置为定时器值,以监控来自RAID设备202的响应是否在超时时间T1内到达。此外,在控制模块204中,当装置间通信在时刻t2开始时,将比通道端的超时时间T1短的装置间通信超时时间T2设置为定时器值,以监控是否从控制模块216获得了处理响应212,作为模块间通信检查218。在附图1的情况下,由控制模块204和206进行的分级处理没有延迟,因此装置间通信超时时间T2的届满造成的错误没有出现,通道端200的接口连接检查ICC的超时时间T1的届满造成的错误也没有出现,从而促成处理正常结束。附图2表示由控制模块206进行的分级处理花费了时间的情况。在这种情况下,装置间通信在时刻t2建立,以开始控制模块206的处理执行215-1,但是这个处理花费了时间,导致在时刻t3超过了模块间通信检查218的超时时间T2,时刻t3是在发出处理响应的时刻t4之前的时间,从而造成发生超时错误。通过向通道200发出连接解除请求220,解除了通道200与RAID设备202之间的接口连接,从而防止了由于超过接口连接检查216的超时时间T1而造成超时错误发生。而且,如果在时刻t3认定了模块间通信的超时错误,从而解除了与通道200的连接,则在控制模块206的处理执行215-1中发生错误的可能性很高。因此,将在时刻t2发出的处理请求210取消,并且通过所建立的装置间通信向控制模块206再次发出具有相同内容的处理请求222,从而进行相同的处理执行215-2,并且等待来自控制模块206的处理响应。当在时刻t5获得了处理响应212时,控制模块204在时刻t6请求通道200的接口重新连接。一旦建立了连接,就传送处理响应214,从而结束一系列处理。这里,即使在超时错误之后从控制模块206获得了对处理请求210的处理响应,由于在发生超时错误时就取消了时刻t2发出的处理请求210,因此该处理响应被丢弃。专利文献1日本专利特开第2003-233514号专利文献2日本专利特开平第07-006058号不过,在这种通过将超时时间T2设置得比通道端的接口连接检查的超时时间T1短的传统装置间通信监控中,如果处理过程在装置间通信开始之前就花费了时间,就会出现这样的问题可能会发生通道端接口连接检查的超时错误。附图3表示在装置间通信开始之前处理被延迟的情况。在附图3中,在时刻t1接收到来自通道200的处理请求208的控制模块204由于某些原因具有处理延迟222,然后在经过了时间T之后的时刻t2向控制模块206发出处理请求210。因此,通道200的超时时间T1在时刻t3届满,该时刻t3在控制模块204中的装置间通信超时时间T2届满时的时刻t4之前。这样,出现这样的问题发生了接口连接检查216的超时错误224,从而分开与RAID设备202的接口连接,错误终止通道200端的处理,并且不允许后续的来自RAID设备202的请求或对RAID设备202的响应。
技术实现思路
按照本专利技术,提供了这样的RAID设备、通信-连接监控方法和程序,即使伴随装置间通信的处理花费了时间,其也能够防止在通道端发生接口连接监控的超时错误。本专利技术致力于一种RAID设备,包括进行卷输入/输出处理的第一处理装置(控制模块)和第二处理装置(控制模块),其中通过装置间通信将由第一处理装置通过与主机装置(服务器)的接口连接接收到的处理请求传送给第二处理装置,以进行分级处理,并且经过第一处理装置将结束响应从第二处理装置传递到主机装置,以解除接口连接。本专利技术的这种RAID设备包括经历时间检测单元60-1,检测从第一处理装置接收到来自主机装置的处理请求时的时刻到通过装置间通信将处理请求传送给第二处理装置时所经历的时间;和装置间通信监控单元62-1,通过从用于监控第一处理装置和第二处理装置之间的装置间通信的预定固定超时时间T2中减掉所述经历时间T来计算可变超时时间Tx(=T2-T),并且监控装置间通信的经历时间。这里,固定超时时间T2是比用于监控主机装置和第一处理装置之间的接口连接的经历时间的预定接口连接检查时间T1短的时间。当装置间通信的经历时间超过了可变超时时间时,装置间通信监控单元请求主机装置分开接口连接,然后,当从第二处理装置获得了结束响应时,请求主机装置进行接口重新连接并且发送结束响应。经历时间检测单元检测从第一处理装置接收到来自主机本文档来自技高网
...

【技术保护点】
一种RAID设备,包括进行卷输入/输出处理的第一处理装置和第二处理装置,其中通过装置间通信将由第一处理装置通过与主机装置的接口连接接收到的处理请求传送给第二处理装置,以进行分级处理,并且经过第一处理装置将结束响应从第二处理装置传递到主机装置,以解除接口连接,所述RAID设备包括:经历时间检测单元,检测从第一处理装置接收到来自主机装置的处理请求时的时刻到通过装置间通信将处理请求传送给第二处理装置时的经历时间;和装置间通信监控单元,通过从用于监控第一处理装置和第二 处理装置之间的装置间通信的预定固定超时时间中减掉所述经历时间来计算可变超时时间,并且监控所述装置间通信的经历时间。

【技术特征摘要】
JP 2005-6-30 2005-1915121.一种RAID设备,包括进行卷输入/输出处理的第一处理装置和第二处理装置,其中通过装置间通信将由第一处理装置通过与主机装置的接口连接接收到的处理请求传送给第二处理装置,以进行分级处理,并且经过第一处理装置将结束响应从第二处理装置传递到主机装置,以解除接口连接,所述RAID设备包括经历时间检测单元,检测从第一处理装置接收到来自主机装置的处理请求时的时刻到通过装置间通信将处理请求传送给第二处理装置时的经历时间;和装置间通信监控单元,通过从用于监控第一处理装置和第二处理装置之间的装置间通信的预定固定超时时间中减掉所述经历时间来计算可变超时时间,并且监控所述装置间通信的经历时间。2.根据权利要求1所述的RAID设备,其中固定超时时间是比用于监控主机装置和第一处理装置之间的接口连接的经历时间的预定接口连接检查时间短的时间。3.根据权利要求1所述的RAID设备,其中当装置间通信的经历时间超过可变超时时间时,装置间通信监控单元请求主机装置以分开接口连接,然后,当从第二处理装置获得了结束响应时,请求主机装置进行接口重新连接,并发送结束响应。4.根据权利要求1所述的RAID设备,其中经历时间检测单元检测从第一处理装置接收到来自主机装置的处理请求的时刻到通过装置间通信将第一处理请求传送给第二处理装置以获得结束响应时的经历时间,并且装置间通信监控单元通过从所述固定超时时间中减掉经历时间而计算出可变超时时间,并且监控直到通过装置间通信将第二处理请求传送给第二处理装置以获得结束响应时的经历时间。5.根据权利要求4所述的RAID设备,其中由第一处理装置通过装置间通信传送给第二处理装置的处理请求是用于对与输入/输出请求相关的处理信息进行备份的处理请求。6.一种系统,其中通过装置间通信将由第一处理装置通过与主机装置的接口连接接收到的处理请求传送给第二处理装置,以实现分级处理,并且通过第一处理装置将结束响应从第二处理装置传递到主机装置,以解除接口连接,该系统包括经历时间检测单元,检测从第一处理装置接收到来自主机装置的处理请求时的时刻到通过装置间通信将处理请求传送给第二处理装置时的经历时间;和装置间通信监控单元,通过从用于监控第一处理装置和第二处理装置之间的装置间通信的预定固定超时时间中减掉所述经历时间来计算可变超时时间,并且监控装置间通信的经历时间。7.一种用于RAID设备的通信-连接监控方法,该RAID设备包括进行卷输入/输出处理的第一处理装置和第二处理装置,其中通过装置间通信将由第一处理装置通过与主机装置的接口连接接收到的处理请求传送给第二处理装置,以进行分级处理,并且经过第一处理装置将结束响应从第二处理装置传递到主机装置,以解除接口连接,该方法包括经历时间检测步骤,检测从第一处理装置接收到来自主机装置的处理请求时的时刻到通过装置间通信将处理请求传送给第二处理装置时的经历时间;和装置间通信监控步骤,通过从用于监控第一处理装置和第二处理装置之间的装置间通信的预定固定超时时间中减掉所述经历时间来计算可变超时时间,并且监控装置间通信的经历时间。8.根据权利要求7所述的通信-连接监控方法,其中固定超时时间是比用于监控主机装置和第一处理装置之间的接口连接的经历时间的预定接口连接检查时间短的时间。9.根据权利要求7所述的通信-连接监控方法,其中,在装置间通信监控步骤中,当装置间通信的经历时间超过可变超时时间时,请求主机装置以分开接口连接,然后,当从第二处理装置获得了结束响应时,请求主机装置进行接口重新连接,并发送结束响应。10.根据权利要求7所述的通信-连接监控方法,其中在经历时间检测步骤中,检测从第一处理装置接收到来自主...

【专利技术属性】
技术研发人员:小林明人山田秀宪长嶋克彦大村英明内田幸治西园晋一
申请(专利权)人:富士通株式会社
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利