用于检测和替代失效的数据存储器的装置、系统和方法制造方法及图纸

技术编号:7140035 阅读:272 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种用于检测和替代失效的数据存储器的装置、系统和方法。读取模块1002从存储设备902、904的阵列读取数据。该阵列包括存储设备902和存储来自存储设备902的奇偶校验信息的额外存储设备904。ECC模块1004利用纠错码(ECC)确定测试的数据是否存在错误以及错误是否可用ECC修正。测试的数据包括由读取模块1002读取的数据。隔离模块1006响应于ECC模块1004确定错误存在于由读取模块1002读取的数据中且数据是不可修正的而选定存储设备902。隔离模块1006还用替代数据和可用数据替代读取自选定的存储设备902的数据,其中,测试的数据包括结合有替代数据的可用数据。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及数据存储,并且更具体地,涉及检测和替代存储设备的阵列中失效的 数据存储器。
技术介绍
固态存储器和其他形式的数据存储媒体容易受到固态存储器内的具体区域中的 失效或数据错误的影响。在其他例子中,整个设备或芯片发生故障并丧失功能。通常,使用 多个存储器设备或存储元件,例如在分布式独立驱动器冗余阵列(RAID)或其他冗余数据 系统中。存储器设备的阵列(例如RAID系统)提供了防止数据错误和设备故障的一定程 度的保护,这是由于存储在阵列中的奇偶校验数据可被用于替换失效的数据。然而,当存储在阵列中的数据未与任意具体的物理硬件边界对齐时,确定产生错 误的存储器设备或存储元件是困难的。
技术实现思路
如上所述,显而易见,存在对用于检测和替代失效的数据存储器的装置、系统和方 法的需求。有利地是,这种装置、系统和方法单独地测试阵列的存储设备以检测数据错误。本专利技术是针对现有技术的现况开发出来的,具体地,是针对现有技术中现有的可 用数据存储系统并未完全解决的问题和需要。因此,本专利技术已经被开发出来以提供一种用 于检测和替代失效的数据存储器的装置、系统和方法,克服现有技术中的上述多数或全部 缺陷。用于检测和替代失效的数据存储器的装置具有多个配置为功能性的执行下述必 要步骤的模块从存储设备的阵列读取数据,利用纠错码(ECC)确定测试的数据是否存在 一个或多个错误以及错误是否可用ECC修正,从存储设备的阵列选定存储设备和替代读取 自选定的存储设备的数据。在描述的实施方式中,这些模块包括读取模块、ECC模块和隔离 模块。读取模块从存储设备的阵列读取数据。该阵列包括两个或多个存储设备和一个或 多个额外存储设备。额外存储设备存储来自存储设备的奇偶校验信息。在一种实施方式中, 读取模块从逻辑页的至少一部分读取数据。逻辑页遍及存储设备的阵列。存储设备的阵列 包括N+P个存储元件的阵列。存储元件的阵列包括N个每个存储ECC组块的一部分的存储 元件和P个存储奇偶校验数据的存储元件。ECC组块包括存储的数据和生成自存储的数据 的纠错码(ECC),其中ECC遍及存储的数据。P个存储元件存储生成自存储在N个存储元件中的ECC组块的奇偶校验数据。在某些实施方式中,每个存储设备包括非易失性固态存储οECC模块利用纠错码(ECC)确定测试的数据是否存在一个或多个错误以及错误是 否可用ECC修正,测试的数据包括由读取模块读取的数据。隔离模块响应于ECC模块确定错误存在于由读取模块读取的数据中且该错误不 可用ECC修正而从存储设备的阵列选定存储设备。隔离模块还利用包括生成自奇偶校验数 据的数据(替代数据)和读取自未被选定的存储设备的数据(可用数据)的数据替代读 取自选定的存储设备的数据,奇偶校验数据存储在一个或多个额外存储设备上,其中由ECC 模块测试的数据还包括结合有替代数据的可用数据。在一种实施方式中,隔离模块响应于 ECC模块确定结合有替代数据的可用数据包含不可用ECC修正的错误而选定用于测试的下 一存储设备。下一存储设备选自存储设备的阵列。隔离模块选定每个隔离模块用于测试, 直到ECC 1004模块确定结合有替代数据的可用数据不包含错误或包含可用ECC修正的错 误。在一种实施方式中,该装置包括引退模块,其响应于ECC模块确定结合有替代数 据的可用数据不包含错误或包含可用ECC修正的错误而基于引退策略引退选定的存储设 备和选定的存储设备上的一个或多个存储区域中的一个。一个或多个存储区域包括一个或 多个错误。存储区域包括选定的存储设备的至少一部分。在另一种实施方式中,引退模块引退擦除块并响应于下述情况用来自一个或多个 额外存储设备的替代数据替代来自擦除块的数据存储错误恢复模块擦除擦除块,顺序地 将额外数据写入擦除块,读取模块顺序地读取额外数据和使用ECC模块和隔离模块确定擦 除块包括不可修正的错误,其中通过结合替代数据和可用数据,不可修正的错误是可修正 的。在一种实施方式中,该装置包括存储设备重新配置模块,其响应于ECC模块确定 结合有替代数据的可用数据不包含错误或包含可用ECC修正的错误而识别选定的存储设 备,从而为将来的操作生成数据以替代来自选定的存储设备的读取数据。在一种实施方式中,装置包括记录模块,其响应于ECC模块确定结合有替代数据 的可用数据不包含错误或包含可用ECC修正的错误,进行下述操作中的一个或多个记录 选定的存储设备的标识;和记录指明包括一个或多个错误的一个或多个存储区域的存储位 置数据。该区域包括选定的存储设备的至少一部分。在一些实施方式中,记录模块记录选定的存储设备的标识而不记录包括具有一个 或多个错误的存储区域的存储位置数据。在另一种实施方式中,记录模块记录包括一个或 多个错误的一个或多个存储区域,并且还记录指明选定的存储设备中包括一个或多个错误 的一个或多个存储区域的存储位置数据。记录模块还响应于读取模块进行的后续读取和使 用ECC模块和隔离模块确定具有不可修正的错误的存储区域,记录一个或多个存储区域和 额外存储区域,其中结合替代数据和可用数据,不可修正的错误是可修正的。在又一种实施方式中,后续读取包括由存储区域测试模块初始化的读取和来自读 取请求的读取中的一个。在一种实施方式中,存储区域包括下述中的一个或多个一个或多 个ECC组块、一个或多个物理页、一个或多个逻辑页、一个或多个物理擦除块、一个或多个 逻辑擦除块、芯片、芯片的一部分、一个或多个芯片块的一部分和一个或多个芯片块。在一种实施方式中,装置包括存储区域测试模块,其识别选定的存储设备内包括 错误的一个或多个存储区域。记录模块还记录包括由存储区域测试模块识别的一个或多个 存储区域的存储位置数据。在又一种实施方式中,存储区域测试模块利用后续读取并使用 ECC模块和隔离模块确定具有不可修正的错误的存储区域来识别具有一个或多个错误的存 储区域,后续读取由读取模块进行,通过结合替代数据和可用数据,不可修正的错误是可修 正的。在一种实施方式中,装置包括区重新配置模块,其为了将来的操作,用来自一个或 多个额外存储设备的替代数据替代选定的存储设备中一个或多个存储区域的数据,从而选 定的存储设备中一个或多个存储区域外的数据不被替代。在又一种实施方式中,区重新配 置模块用来自一个或多个额外存储设备的替代数据替代来自选定的存储设备上的一个或 多个存储区域的数据,并用来自相相同的一个或多个额外存储设备的替代数据替代来自相 同选定的存储设备或不同选定的存储设备上的一个或多个额外存储区域的数据,一个或多 个额外存储区域中的每一个包括一个或多个错误,其中,一个或多个存储区域和一个或多 个额外存储区域不共享共同的逻辑页。在另一种实施方式中,区重新配置模块用来自一个或多个额外存储设备的替代数 据替代来自选定的存储设备上的一个或多个存储区域的数据,并用来自一个或多个不同额 外存储设备的替代数据替代一个或多个额外存储区域。一个或多个额外存储区域中的每一 个包括一个或多个错误,其中,一个或多个存储区域和一个或多个额外存储区域共享共同 的逻辑页。在一种实施方式中,装置包括分析模块,其分析记录以确定下述中的一项或多项 选定的存储设备中具有数据错误的区和错误类型。在一种实施方式中,装置包括错误存本文档来自技高网...

【技术保护点】
1.一种检测和替代失效的数据存储器的装置,该装置包括:读取模块,其从存储设备的阵列读取数据,该阵列包括两个或多个存储设备和一个或多个额外存储设备,额外存储设备存储来自存储设备的奇偶校验信息;ECC模块,其利用纠错码(ECC)确定测试的数据是否存在一个或多个错误以及错误是否可用ECC修正,测试的数据包括由读取模块读取的数据;隔离模块,所述隔离模块响应于ECC模块确定错误存在于由读取模块读取的数据中且该错误不可用ECC修正而从存储设备的阵列选定存储设备;并利用包括生成自奇偶校验数据的数据(替代数据)和读取自未被选定的存储设备的数据(可用数据)的数据替代读取自选定的存储设备的数据,奇偶校验数据存储在一个或多个额外存储设备上,其中,测试的数据还包括结合有替代数据的可用数据。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:大卫·弗林
申请(专利权)人:弗森艾奥公司
类型:发明
国别省市:US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1