用于通信系统中的动态阈值缩放的方法和系统技术方案

技术编号:2853150 阅读:203 留言:0更新日期:2012-04-11 18:40
一种包括错误恢复系统的计算机系统与相似类型的系统资源诸如主机适配器的数量成反比例地建立错误阈值。当主机适配器启动或失活时,处理设备的软件子组件计算新的阈值数量,并且将其写到与每个主机适配器相关的存储器单元。当错误的数量超过了所述阈值数量时,所述主机适配器被复位、被静止以便修复、或被隔开以便进行替换。

【技术实现步骤摘要】

本专利技术一般地涉及数据存储系统领域。尤其是,本专利技术包括用于动态地缩放数据通信构造设备中的错误阈值的系统。
技术介绍
在图1中,计算机存储系统10包括主机服务器(“主机”)12、数据处理服务器14、包括多个数据存储设备诸如廉价/独立磁盘冗余阵列(“RAID”)的数据存储系统16、以及数据通信系统18。通常由主机12发起的对信息的请求由通信系统18传输,并且由数据处理服务器14处理。数据处理服务器从数据存储设备16中检索数据,并通过通信系统将数据传输回主机12。类似地,主机12可以将数据写到数据存储设备16。通信系统18可以是通信总线、点到点网络或者其它通信方案。图2示出了一种通信构造设备20,包括系统资源诸如对称多处理器(“SMP复合体”)22、构造设备控制器24以及主机适配器26。SMP复合体22是数据处理服务器14(图1)的组件,并且主机适配器26是用于主机服务器12(图1)的接口。这些组件的任意一个中都可能发生各种错误状态。这些错误状态可能是非常严重的,即,妨碍设备运行,或者实质上是暂时的。如果发生严重的错误,则出现故障的设备必需被重新启动或者被替换。然而,暂时的错误可本文档来自技高网...

【技术保护点】
一种错误恢复系统,包括多个系统资源;包括存储器设备的处理设备,所述存储器设备包括多个存储器单元,并且所述多个存储器单元中的每一个对应于所述多个系统资源中的一个;以及通信通道,将所述多个系统资源连接到所述处理设备; 其中所述处理设备还包括软件子组件,所述软件子组件用于检测所述多个系统资源、计算表示所述多个系统资源的第一数量、计算与所述第一数量成反比例的错误阈值、以及将所述错误阈值写到所述多个存储器单元中的每一个。

【技术特征摘要】
US 2004-11-16 10/989,5621.一种错误恢复系统,包括多个系统资源;包括存储器设备的处理设备,所述存储器设备包括多个存储器单元,并且所述多个存储器单元中的每一个对应于所述多个系统资源中的一个;以及通信通道,将所述多个系统资源连接到所述处理设备;其中所述处理设备还包括软件子组件,所述软件子组件用于检测所述多个系统资源、计算表示所述多个系统资源的第一数量、计算与所述第一数量成反比例的错误阈值、以及将所述错误阈值写到所述多个存储器单元中的每一个。2.如权利要求1的错误恢复系统,其中所述处理设备包括对称多处理器(“SMP”)复合体。3.如权利要求1的错误恢复系统,其中所述多个系统资源包括多个主机适配器。4.如权利要求1的错误恢复系统,其中所述软件子组件适用于检测与所述多个系统资源中的第一个系统资源相关的错误状态,并且增加相应于所述多个系统资源中的所述第一个系统资源的错误计数器内的值。5.如权利要求4的错误恢复系统,其中如果所述值超过了相应于所述多个系统资源中的所述第一个系统资源的所述错误阈值,则复位所述多个系统资源中的所述第一个系统资源。6.如权利要求4的错误恢复系统,其中如果所述值超过了相应于所述多个系统资源中的所述第一个系统资源的所述错误阈值,则隔开所述多个系统资源中的所述第一个系统资源。7.如权利要求6的错误恢复系统,其中所述多个系统资源中的所述第一个系统资源被静止。8.如权利要求3的错误恢复系统,其中当所述多个主机适配器中的一个被启动时,所述软件子组件计算所述错误阈值。9.如权利要求3的错误恢复系统,其中当所述多个主机适配器中的一个失活时,所述软件子组件计算所述错误阈值。10.一种错误恢复的方法,包括如下步骤检测多个系统资源;计算表示所述多个系统资源的第一数量;计算与所述第一数量成反比例的错误阈值;以及将所述错误阈值写到所述多个存储器单元中的每一个。11.如权利要求10的方法,还包括步骤检测与所述多个系...

【专利技术属性】
技术研发人员:DF德阿劳约PM里查兹BA里纳尔迪TC索伦森
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1