用于从数据存储系统的故障中恢复的方法和系统技术方案

技术编号:2853065 阅读:144 留言:0更新日期:2012-04-11 18:40
提供了一种方法、系统和产品,其中在第一计算装置上接收命令,该第一计算装置连接到能够允许第一计算装置访问数据存储装置的第一适配器。第一计算装置发送命令到第二计算装置。由连接到第二计算装置的第二适配器处理该命令,其中第二适配器允许第二计算装置访问数据存储装置,并且其中第二适配器访问第一计算装置中的存储器以处理命令。在特定实施例中,允许第一计算装置访问数据存储装置的第一适配器已经出故障。

【技术实现步骤摘要】

本公开涉及用于从数据存储系统中的适配器故障中恢复的方法、系统、以及产品。
技术介绍
在某些数据存储环境中,多个服务器可以提供对存储装置的访问,其中经由适配器将每个服务器连接到存储装置。例如,在双服务器数据存储环境中,两个服务器中的每一个都可以具有提供对共享存储装置的盘驱动器的访问的适配器。第一服务器可以控制第一适配器以访问盘驱动器,而第二服务器可以控制第二适配器以访问盘驱动器。数据存储环境通过允许主系统经过两个服务器中的任一个或两者访问存储在盘驱动器中的数据而提供了冗余。在适配器出现故障的情况下,控制适配器的服务器可以就不能访问盘驱动器。例如,在第一适配器出现故障的情况下,第一服务器可以失去对盘驱动器的访问。数据存储环境提供的冗余可以允许主系统通过使用第二服务器来访问盘驱动器,其中第二服务器使用第二适配器来访问盘驱动器并处理来自主机的命令。然而,可以直到第一适配器再次运转才使用第一服务器。
技术实现思路
提供了一种方法、系统和产品,其中在第一计算装置上接收命令,该第一计算装置连接到能够允许第一计算装置访问数据存储装置的第一适配器。第一计算装置发送命令到第二计算装置。由连接到第二计算装置的第二适配器处理该命令,其中第二适配器允许第二计算装置访问数据存储装置,并且其中第二适配器访问第一计算装置中的存储器以处理命令。在特定实施例中,允许第一计算装置访问数据存储装置的第一适配器已经出故障。在另一个实施例中,第一计算装置和第二计算装置为产生命令的主机提供冗余。在另一个实施例中,由第二适配器处理命令还包括执行对第一计算装置中的存储器的直接存储器访问,以执行命令。将完成通知发送到第二计算装置,以转发到第一计算装置。将命令状态字写入到第一计算装置的存储器,以指示命令执行的完成。在另一个实施例中,第一计算装置在命令状态字被写入到第一计算装置的存储器之前接收来自第二计算装置的完成通知。在另一个实施例中,第二适配器和第一计算装置之间的第一路径长度与第二计算装置和第一计算装置之间的第二路径长度不同。在另一个实施例中,第一计算装置基于完成通知和指示完成的命令状态字二者的接收确定已经执行命令。在另一个实施例中,第一和第二适配器能够执行对第一计算装置的存储器和第二计算装置的存储器的直接存储器访问操作,其中第二适配器经由直接存储器访问操作来访问第一计算装置的存储器。在另一个实施例中,第二适配器响应对命令的处理而产生结果,并将该结果传送给第一计算装置。第一计算装置将该结果发送到第一计算装置从其上接收命令的主机。在另一个实施例中,第一计算装置产生用于执行命令的数据和控制信息。将数据和控制信息存储在第一计算装置的存储器中。由第二适配器经由对存储器的直接存储器访问来访问所存储的数据和所存储的控制信息。在另一个实施例中,即使第一适配器已经出故障,命令的发送方也能够使用第一计算装置和第二计算装置二者来发起对命令的执行。在另一个实施例中,第二适配器处理命令的结果等价于当前已经出故障的第一适配器处理命令的结果。附图说明现在参考附图,其中相同的附图标记始终表示对应部分图1图解根据特定实施例的计算环境的方框图;图2图解根据特定实施例示出计算环境中的适配器故障的方框图;图3图解根据特定实施例示出适配器如何能够执行对服务器的直接存储器访问的方框图;图4图解根据特定实施例示出在计算环境中的不同的示例路径长度的方框图; 图5图解根据特定实施例示出如何执行从故障中恢复的方框图;图6图解根据特定实施例示出从适配器的故障中恢复的操作;以及图7图解在其中实现特定实施例的系统。具体实施例方式在下面的描述中,讨论形成本文一部分并图解几个实施例的附图。可以理解,可以采用其它实施例,且可以作出结构和操作上的变化。图1图解根据特定实施例的计算环境100的方框图。计算环境100包括在通信环106上连接到第二服务器104的第一服务器102。第一服务器102和第二服务器104可以任何合适的计算装置,包括那些目前本领域已知的装置,如个人计算机、工作站、大型机、手持计算机、掌上计算机、电话装置、网络设备、叶片计算机(blade computer)、存储服务器等。通信环106可以包括任何合适的网络,包括那些目前本领域已知的网络,如存储区网(SAN)、局域网(LAN)、以及企业内部互联网等。通信环106包括数据存储装置108、第一适配器110、以及第二适配器112。数据存储装置108可以包括任何合适的数据存储装置,包括那些目前本领域已知的存储器,如盘驱动器、带驱动器等。第一适配器110能够由第一服务器102控制并为第一服务器102提供对数据存储装置108的访问。第二适配器112能够由第二服务器104控制并为第二服务器104提供对数据存储装置108的访问。第一服务器102包括存储器104,第二服务器包括存储器116,其中存储器可以包括随机访问存储器。在特定实施例中,第一适配器110和第二适配器112能够执行对服务器102、104中的存储器114、116的直接存储器访问。因此,在计算环境100中,适配器110、112都可以访问数据存储装置108和在两个服务器102、104中的存储器114、116。主机118可以发送执行命令到服务器102和104中的任一个或二者。命令的执行可能需要对于数据存储装置108的输入/输出(I/O)操作。服务器102、104可以通过访问数据存储装置108来执行命令。由于有两个服务器104,104可以命令执行中为主机118提供冗余。图1图解这样的特定实施例,其中在双服务器数据存储环境100中,第一服务器102经由第一适配器110访问数据存储装置108,且第二服务器104经由第二服务器112也访问数据存储装置108。在替换的实施例中,可以有多于两个的服务器,并可以有多于两个的适配器。尽管在图1中示出了两个适配器和一个数据存储装置,但是在替换实施例中可以有多于两个适配器和多于一个数据存储装置。图2图解根据特定实施例示出在计算环境中100的第一适配器110的故障的方框图。尽管图2将第一适配器110示出为已经出故障,但是在替换实施例中,第二适配器112可以出故障而第一适配器110可以是运转的。第一适配器110的故障可以由各种原因引起,包括硬件故障、软件错误故障、适配器重起等。如果第一适配器110故障,则第一服务器102不能经由第一适配器110访问数据存储装置108。类似地,在替换实施例中,如果第二适配器112故障,则第二服务器104不能经由第二适配器112访问数据存储装置108。如果主机118等待出故障的第一适配器110开始运转,则只有在诸如经由适配器重起等引起问题的临时适配器问题的情况下,等待才会成功。等待将花费相当长的时间周期,并可能不适于主机118产生的某些命令的执行。另外,如果主机118要等待出故障的第一适配器110开始运转,则在诸如由适配器的硬件故障引起的适配器问题的永久适配器问题的情况下,等待将不会成功。特定实施例提供了对于临时的和永久的适配器故障系统都能够容忍的机制。如果第一适配器110出故障,则主机118可以停止发送命令到第一服务器102,并将所有命令发送到第二服务器104来执行。所有对数据存储装置108的访问将经由控制运转的第二适配器112的第二服本文档来自技高网...

【技术保护点】
一种方法,包括:在第一计算装置上接收命令,该第一计算装置连接到能够允许第一计算装置访问数据存储装置的第一适配器;由第一计算装置发送命令到第二计算装置;以及由连接到第二计算装置的第二适配器处理该命令,其中第二适配器允许 第二计算装置访问数据存储装置,并且其中第二适配器访问第一计算装置中的存储器以处理命令。

【技术特征摘要】
US 2004-11-16 10/991,1101.一种方法,包括在第一计算装置上接收命令,该第一计算装置连接到能够允许第一计算装置访问数据存储装置的第一适配器;由第一计算装置发送命令到第二计算装置;以及由连接到第二计算装置的第二适配器处理该命令,其中第二适配器允许第二计算装置访问数据存储装置,并且其中第二适配器访问第一计算装置中的存储器以处理命令。2.根据权利要求1的方法,其特征在于,允许第一计算装置访问数据存储装置的第一适配器已经出故障。3.根据权利要求2的方法,其特征在于,第一计算装置和第二计算装置为产生命令的主机提供冗余。4.根据权利要求2的方法,其特征在于,由第二适配器处理命令还包括执行对第一计算装置中的存储器的直接存储器访问,以执行命令;将完成通知发送到第二计算装置,以转发到第一计算装置;以及将指示命令执行完成的命令状态字写入到第一计算装置的存储器。5.根据权利要求4的方法,其特征在于,第一计算装置在命令状态字被写入到第一计算装置的存储器之前接收来自第二计算装置的完成通知。6.根据权利要求5的方法,其特征在于,第二适配器和第一计算装置之间的第一路径长度与第二计算装置和第一计算装置之间的第二路径长度不同。7.根据权利要求4的方法,其特征在于,第一计算装置基于完成通知和指示完成的命令状态字二者的接收确定已经执行命令。8.根据权利要求2的方法,其特征在于,第一和第二适配器能够执行对第一计算装置的存储器和第二计算装置的存储器的直接存储器访问操作,并且其中第二适配器经由直接存储器访问操作来访问第一计算装置的存储器。9.根据权利要求2的方法,还包括由第二适配器响应对命令的处理而产生结果;将该结果传送给第一计算装置;以及由第一计算装置将该结果发送到第一计算装置从其上接收命令的主机。10.根据权利要求2的方法,还包括由第一计算装置产生用于执行命令的数据和控制信息;将数据和控制信息存储在第一计算装置的存储器中;以及由第二适配器经由对该存储器的直接存储器访问来访问所存储的数据和所存储的控制信息。11.根据权利要求2的方法,其特征在于,即使第一适配器已经出故障,命令的发送方也能够使用第一计算装置和第二计算装置二者来发起对命令的执行。12.根据权利要求2的方法,其特征在于,第二适配器处理命令的结果等价于当前已经出故障的第一适配器处理命令的结果。13.一种系统,包括数据存储装置;具有存储器的第一计算装置;连接到第一计算装置的第一适配器,其中第一适配器能够允许第一计算装置访问数据存储装置;第二计算装置;连接到第二计算装置的第二适配器,其中第二适配器允许第二计算装置访问数据存储装置,其中第一计算装置接收命令,其中第一计算装置发送命令到第二计算装置,并且其中第二适配器通过访问在第一计算装置中的存储器来处理命令。14.根据权利要求13的系统,其特征在于,允许第一计算装置访问数据存储装置的第一适配器已经出故障。15.根据权利要求14的系统,其特征在于,第一计算装置和第二计算装置为产生命令的主机提供冗余。16.根据权利要求14的系统,其特征在于,由第二适配器处理命令还包括执行对第一计算装置中的存储器的直接存储器访问,以执行命令;将完成通知发送到第二计算装置,以转发到第一计算装置;以及将指示命令执行完成的命令状态字写入到第一计算装置的存储器。17.根据权利要求16的系统,其特征在于,第一计算装置在命令状态字被写入到第一计算装置的存储器之前接收来自第二计算装置的完成通知。18.根据权利要求17的系统,其特征在于,第二适配器和第一计算装置之间的第一路径长度与第二计算装置和第一计算装置之间的第二路径长度不同。19.根据权利要求16的系统,其特征在于,第一计算装置基于完成通知和指示完成的命令状态字二者的接收确定已经执行命令。20.根据权利要求14的系统,其特征在于,第一和第二适配器能够执行对第一计算装置的存储器和第二计算装置的存储器的直接存储器访问操作,并且其中第二适配器经由直接存储器访问操作来访问第一计算装置的存储器。21.根据权利要求14的系统,其特征在于,第二适配器响应对命令的处理而产生结果,其中该结果被传送给第一计算装置,并且其中第...

【专利技术属性】
技术研发人员:迈克尔T本哈斯马修J卡洛斯卡尔A尼尔森宋正中
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1