具有镜象存储盘的替换延迟更新的数字存储系统和方法技术方案

技术编号:2891999 阅读:211 留言:0更新日期:2012-04-11 18:40
一种容错镜象盘子系统,它具有改善的写盘方案以便为随机写盘提供高吞吐量,并保证读盘的高性能。要写到盘上的数据块或页暂时按一定次序(或调度)积累并分类(或调度),以便有效地写到盘上,在最佳实施例中这对应于每块写到盘上的物理地址。一般情况下这也对应于在物理扫描磁盘时写磁头所用的顺序。镜象对的两个盘彼此反相运行,使它们一个处于读状态而另一个处于写状态。(*该技术在2014年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术一般涉及到容错数字存储盘系统,更具体地涉及到镜象盘类型的数字存储盘系统,其中数字信息一式两份地存储在两个单独的存储盘上,以保证可靠性。随着对于在线数据库事务处理(OLTP)的要求的增长,以每秒数千事务计的高事务率必须由OLTP系统支持。此外,这些应用程序要求高度可靠性和容错能力。在诸如OLTP那样的应用程序中,大部分请求是对数据的随机访问。由于大部分数据存放在盘上,所以盘子系统必须支持高的随机访问率,它高达每秒数千次随机访问的数量级。还有,盘应能有容错能力,以满足OLTP对可靠性的要求。当对盘实行随机访问时,一般情况下盘需要转动至新方位,使所需数据位于盘臂之下,而该盘臂上的读/写头也必须沿该臂移动至新的径向位置,以使所需数据位于读/写头之下。遗憾的是,这种物理操作的技术性能,并且因而随机盘输入/输出(I/O)技术性能不像其它系统参量如CPU MIPS改善得那么快。因此,对于那些随机访问数据操作处于主导地位的应用程序,例如OLTP,本因素有着限制作用,这在本门技术中称为受盘臂所限。在受盘臂所限系统中,盘成本在整个系统成本中所占比例变得愈来愈大。因此,需要一种盘子系统,它能比常规盘系统支持更高的每秒随机访问率,并有更好的性能价格比特性。镜象盘系统和RAID盘系统(独立盘的冗余阵列,即Redundant Array of Independent Disks)两者都曾为OLTP提供容错盘系统。在镜象盘系统中,每个盘的信息在第二个(也即冗余)盘上有备份。在RAID阵列中,几个盘上相对应的块地址上的信息用来在另一个盘上建立一个奇偶校验块。当发生故障时,RAID阵列中任一盘可依靠阵列中其他盘进行重建。RAID体系对于特定存储容量讲,所用盘数较少,但镜象盘一般性能较好。1990年5月在科罗拉多的博尔德举行的计算机系统的测量和建模SIGMETRICS会议的论文集74-85页上的论文“使用Amdahl5890的盘冗余阵列的估价”中P.Chen等人证明了,当随机写操作占主导地位时,镜象盘比RAID-5盘阵列更好(就是说,当随机读/写操作占主导地位时,镜象盘体系的平均读/写时间比RAID-5体系的时间短些)。例如,1988年6月在伊利诺伊的芝加哥举行的数据管理的ACM SIGMOD国际会议的论文集109-116页上的论文“价格低廉盘冗余阵列的一例”中D.Patterson等人介绍了RAID-5体系。然而,镜象盘要求每一个数据都应写到镜象盘对的两个盘上。因此,一般认为,为了保证容错性,镜象盘存储系统会增加性能代价。在转让给本专利申请的同一受让人的未决专利申请系列号8-036636(1993年3月24日递交),名为“在保留盘上物理群集的情况下用于将随机写操作转换为顺序写操作的盘存储方法和装置”的申请中,本专利技术的一些专利技术人公开了一种用于改善单个盘或RAID阵列的性能的方法。这是通过以下操作实现的在内存中建立写盘操作的分类运行数据,将它们写入运行记录盘,再将运行记录盘的分类运行数据加以合并,依靠大的成批写操作将它们一次地施加到数据盘上。本方法的优点是将大量的随机写操作转换成顺序写操作。本方法的问题是,当随机读盘操作中断了成批写操作时,将增加以下代价如成批写操作继续进行,则盘的读请求被延迟,导致读盘响应时间增大的代价;或如成批写操作被读盘所中断,结果大量损失写操作(当然也是总的)吞吐量。只要是成批写操作时经常需要读盘,则以上两种情况中任何一种都会降低总的性能,以致建立分类运行数据的优点被大量抵消掉。镜象盘系统中的常规恢复方法是将镜象盘对中保存完好的盘的数据复制到空闲的备份盘上。典型做法是对保存完好盘的数据加以扫描,并将在此过程中插进来的写操作运用于两个盘。这个方法的问题是在恢复过程中盘系统性能将显著地下降。当需要将每个写盘操作一式两份地使用到镜象盘对的两个盘上时,正常情况下会增加代价。相应地,本专利技术的目的是通过大量地消除该代价,因而改善镜象盘系统的性能。本专利技术的另一个目的是提供一种镜象盘子系统,它通过将随机盘I/O写操作转换成近似于顺序I/O的方法来改善随机盘I/O的性能。本专利技术的又一个目的是不增加读响应时间的代价而改善镜象盘吞吐量。本专利技术还有一个目的是在从故障盘恢复的过程中,在保留快速恢复性能的同时,保证恢复过程中的读盘和写盘性能,因而改善了性能。这些和更多的目的和优点可由本专利技术提供的镜象盘类的容错盘存储子系统所得到,在该子系统中将盘的更新(即要写的数据块)积累起来并调度成连续的成批更新操作,该调度可以产生一种顺序,从而能有效地写到镜象盘上。虽非必要,但更新数据最好积累在盘控制器的内存中;虽非必要,但最好由镜象盘的盘控制器进行调度。内存最好是非易失性或是容错的。在最佳实施例中,调度是按照镜象盘的更新数据的起始地址将更新数据分类而完成的(也即按照更新数据将写到盘上的地址)。这种顺序也对应于对盘的扫描。每个镜象盘对的盘就运行于彼此不同的相位。一个在读状态,而另一个在写状态。按照调度顺序,每一次成批写操作都有效地施加于写状态下的盘。因为更新数据是按照盘上的物理顺序复制到镜象盘对的每一个盘,所以写操作时性能良好。因此随机写操作转换成大量的顺序写盘操作,并且数据群集保留在盘上。应用这种方法写一个块的平均时间通常不到随机写一个块到盘上的时间的一半,因此大大地消除了不得不将一个块向镜象盘对写两次的问题。这时候,读请求是通过从内存读取数据或从处于读状态下的盘读出而得到处理的。因此,也能得到所保证的读请求的性能。当成批更新数据应用到镜象盘对中的一个盘时(就是处于写状态的那个),各盘就变换运行状态。也可能会出现一段时间,在这两个运行状态中间,两个盘都处于读状态。也会出现这样的时刻,这时镜象盘对的两个盘都处于写状态,例如在装载或其他大量复制操作时。在处理镜象盘对中一个故障盘的恢复时,引用了一对备用镜象盘。后者用替换镜象方案进行操作。在恢复过程中,新的写操作加到备用盘对上。读操作或从保存完好的盘或从替换镜象备用盘对加以处理。在后台,在备用周期内,对保存完好盘的数据加以扫描并复制到备用替换镜象对上。本方法提供快速恢复,并在恢复过程中保证读和写请求两者的性能。通过下列对最佳实施例的详细描述和附图,本专利技术的这些和更多的目的、优点、和特征将更加清楚。附图说明图1是本专利技术最佳实施例的总框图;图2描述了I/O处理器的非易失存储器的数据的最佳组织;图3是一幅流程图,用于显示正常操作时处理写请求的步骤;图4是一幅流程图,用于显示正常操作时对盘进行成批写操作的过程的步骤;图5是一幅时序图,显示对两个镜象盘进行成批写操作的两个过程之间的时序关系;图6是一幅流程图,显示正常操作时处理读请求的步骤;图7示意性图示故障盘恢复时的配置;图8是一幅流程图,显示恢复过程中处理读请求的步骤;图9是一幅流程图,显示后台进程对保存完好的盘扫描的步骤。图1是一幅具有镜象存储盘的盘存储子系统的计算机系统的最佳实施例的框图,该镜象存储盘用积累的更新数据以成批方式替换地进行更新,而该积累的更新数据曾按照本专利技术加以分类,以得到有效写操作(以后有时称为AMDU,即替换延迟更新的镜象盘)。该系统包括一个控制器或I/O处理器(IOP)200,多个的镜象盘对300-1至300-N,本文档来自技高网...

【技术保护点】
一种用于存储数字信息数据块的容错盘存储子系统,它包括: 用于存储数字信息数据块的镜象盘对,所述数据块一式两份地存储在所述镜象对的两个盘上;和 一个用于所述镜象盘对的控制器,所述控制器具有一个存储器; 其特征在于: 所述控制器暂时将所述计算机系统所提供的数据块累积在所述存储器内,直至一式两份地存储在所述镜象对的两个盘上; 所述控制器按一定次序将所述存储器内积累的所述数据块加以调度,以便有效地写到所述镜象盘对; 所述控制器有第一运行状态和第二运行状态,在所述第一运行状态下所述镜象对的一个盘处于写状态,而所述镜象对的另一盘处于读状态;在所述第二运行状态下所述一个盘处于读状态,而所述另一盘处于写状态; 所述控制器在所述第一运行状态下按调度次序将尚未写到所述一个盘上的数据块从所述存储器复制到所述一个盘上,并在所述第二运行状态下按调度次序将尚未写到所述另一盘上的数据块从所述存储器复制到所述另一盘上; 所述控制器在相隔的时间周期内使所述镜象盘对运行在所述第一运行状态,同时在所述相隔的时间周期之间的至少一部分时间内使所述镜象盘对运行在所述第二运行状态;和 如果所述存储内存在着所述所请求的数据块,则所述控制器从所述存储器中取出所请求的数据块,并提供给所述计算机系统;否则的话,如果所述镜象盘对正运行在第一运行状态,则从所述另一盘取;如果所述镜象盘正运行在所述第二运行状态,则从所述一个盘取;如果所述镜象盘对正运行在所述第二运行状态,则从所述一个盘取;其中数据块按一定调度次序写到所述镜象盘对上,并且既不受干扰也不会干扰所述计算机系统所请求的数据块读操作。...

【技术特征摘要】
...

【专利技术属性】
技术研发人员:克里斯托阿尔基维阿迪斯波利佐斯丹尼尔曼纽尔迪亚斯阿努潘克沙夫布海德
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1