存储设备的可靠性测试方法及其存储设备技术

技术编号:27435108 阅读:21 留言:0更新日期:2021-02-25 03:19
公开了存储设备的可靠性测试方法及其存储设备。所公开的存储设备的可靠性测试方法,包括:使用第一读命令从存储设备的物理块读取第一数据;响应于第一数据的错误比特数大于第一阈值,使用第二读命令从存储设备的所述物理块读取第二数据;若第二数据的错误比特数大于第二阈值,将所述物理块识别为坏块;其中所述第二读命令是具有指定参数的读重做命令。第二读命令是具有指定参数的读重做命令。第二读命令是具有指定参数的读重做命令。

【技术实现步骤摘要】
存储设备的可靠性测试方法及其存储设备


[0001]本申请涉及存储
,尤其涉及在存储设备中实施可靠性测试(Reliability Demonstration Test,RDT)方法及其存储设备。

技术介绍

[0002]图1展示了固态存储设备的框图。固态存储设备102同主机相耦合,用于为主机提供存储能力。主机同固态存储设备102之间可通过多种方式相耦合,耦合方式包括但不限于通过例如SATA(Serial Advanced Technology Attachment,串行高级技术附件)、SCSI(Small Computer System Interface,小型计算机系统接口)、SAS(Serial Attached SCSI,串行连接SCSI)、IDE(Integrated Drive Electronics,集成驱动器电子)、USB(Universal Serial Bus,通用串行总线)、PCIE(Peripheral Component Interconnect Express,PCIe,高速外围组件互联)、NVMe(NVM Express,高速非易失存储)、以太网、光纤通道、无线通信网络等连接主机与固态存储设备102。主机可以是能够通过上述方式同存储设备相通信的信息处理设备,例如,个人计算机、平板电脑、服务器、便携式计算机、网络交换机、路由器、蜂窝电话、个人数字助理等。存储设备102包括接口103、控制部件104、一个或多个NVM芯片105以及DRAM(Dynamic Random Access Memory,动态随机访问存储器)110。
[0003]NAND闪存、相变存储器、FeRAM(Ferroelectric RAM,铁电存储器)、MRAM(Magnetic Random Access Memory,磁阻存储器)、RRAM(Resistive Random Access Memory,阻变存储器)等是常见的NVM。
[0004]接口103可适配于通过例如SATA、IDE、USB、PCIE、NVMe、SAS、以太网、光纤通道等方式与主机交换数据。
[0005]控制部件104用于控制在接口103、NVM芯片105以及DRAM 110之间的数据传输,还用于存储管理、主机逻辑地址到闪存物理地址映射、擦除均衡、坏块管理等。控制部件104可通过软件、硬件、固件或其组合的多种方式实现,例如,控制部件104可以是FPGA(Field-programmable gate array,现场可编程门阵列)、ASIC(Application Specific Integrated Circuit,应用专用集成电路)或者其组合的形式。控制部件104也可以包括处理器或者控制器,在处理器或控制器中执行软件来操纵控制部件104的硬件来处理IO(Input/Output)命令。控制部件104还可以耦合到DRAM 110,并可访问DRAM 110的数据。在DRAM可存储FTL表和/或缓存的IO命令的数据。
[0006]控制部件104包括闪存接口控制器(或称为介质接口控制器、闪存通道控制器),闪存接口控制器耦合到NVM芯片105,并以遵循NVM芯片105的接口协议的方式向NVM芯片105发出命令,以操作NVM芯片105,并接收从NVM芯片105输出的命令执行结果。已知的NVM芯片接口协议包括“Toggle”、“ONFI”等。
[0007]存储器目标(Target)是NAND闪存封装内的共享CE(,Chip Enable,芯片使能)信号的一个或多个逻辑单元(LUN,Logic UNit)。NAND闪存封装内可包括一个或多个管芯(Die)。典型地,逻辑单元对应于单一的管芯。逻辑单元包括一个或多个平面(Plane)。逻辑单元内
的多个平面可以并行存取,而NAND闪存芯片内的多个逻辑单元可以彼此独立地执行命令和报告状态。
[0008]存储介质上通常按页来存储和读取数据。而按块来擦除数据。块(也称物理块)包含多个页。块包含多个页。存储介质上的页(称为物理页)具有固定的尺寸,例如17664字节。物理页也可以具有其他的尺寸。
[0009]NAND闪存读写速度快,写入数据前必须先擦除数据,且擦除是以块(Block)为单位进行的。NAND闪存的寿命是有限的。一般来说,NAND闪存的寿命以擦写循环次数(Program and Erase cycle,PE cycle)来定义的。常见的3D TLC NAND闪存的寿命一般在3000次左右,这意味着NAND闪存的块在经历了大约3000次擦写后,其寿命将耗尽,该块将不能再被使用。随着寿命将近,NAND闪存块存储数据的可靠性逐渐降低。包括NAND闪存的存储设备的控制部件记录其NAND闪存的各块是否可用。
[0010]作为NAND闪存的NVM芯片,即使是全新的,也可能包括不可使用的坏块(称为原始坏块)。由于其他原因,诸如存放时间、环境等因素,NAND闪存中的坏块会发生变化(例如,逐渐增多)。在固态存储设备的生产过程中,要识别出其上的NVM芯片的所有坏块,并建立标识了固态存储设备的所有NVM芯片的所有坏块的坏块表,并记录在NVM芯片的指定区域。例如,采用集中的方式,将存储设备的所有NVM芯片的所有坏块的坏块表记录到例如存储设备的NOR闪存上,或者采用分布的方式,在各个逻辑单元(LUN)的第一个块上记录用于该LUN的坏块表。可选地还为坏块表记录多个副本,以提高坏块表的可靠性。
[0011]可靠性测试(RDT)在存储设备的生产过程中被实施,以识别出存储设备的坏块,并在存储设备上记录坏块表。通过的做法,向NAND闪存的各块实施擦除、编程再读出的操作。将编程或擦除中出现错误的块标记为坏块,而将读出数据中错误率过大的块也标记为坏块。

技术实现思路

[0012]交付给客户的存储设备运行产品固件,使得存储设备的控制部件使用复杂的数据恢复技术来提高其存储的数据的可靠性。例如对写入NVM芯片的数据实施错误校正编码,而对从NVM芯片读出数据实施错误校正译码,以纠正读出数据中存在的数据。还实施例如重读(Read-Retry)或基于RAID的数据重建来以相对于通常的读操作不同的方式从NVM芯片读出数据。重读操作通过调整例如读取数据时的判决电压来适应NVM芯片或环境在使用过程中的变化。而在可靠性测试中运行的可靠性测试固件使用相对简单的数据恢复技术。这导致可靠性测试过程中,控制部件的数据恢复能力明显弱于交付给客户的存储设备。进而,在可靠性测试中,由于数据恢复能力相对较若,从而倾向于将更多的块识别为坏块(因为无法对从这些块读出的数据成功实施错误校正),而如果使用产品固件,那么从这些坏块中的至少部分(将其称为弱块)读出的数据有机会被成功实施错误校正。希望至少部分利用弱块,以使用相同的NVM芯片为存储设备提供更多的存储空间,从而降低存储设备的制造成本,同时对弱块的选取应当是谨慎的,以保证存储设备的可靠性。对弱块的选取过程还需要是简单的,以使其能在可靠性测试过程中完成。
[0013]本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种存储设备的可靠性测试方法,包括:使用第一读命令从存储设备的物理块读取第一数据;响应于第一数据的错误比特数大于第一阈值,使用第二读命令从存储设备的所述物理块读取第二数据;若第二数据的错误比特数大于第二阈值,将所述物理块识别为坏块;其中所述第二读命令是具有指定参数的读重做命令。2.根据权利要求1所述的方法,其中响应于第一数据的错误比特数大于第一阈值,使用多个第二读命令从存储设备的所述物理块读取多个第二数据;若任何第二数据的错误比特数不大于第二阈值,将所述物理块识别为通过好块。3.根据权利要求1或2所述的方法,还包括:响应于所述存储设备未通过第一可靠性测试,执行所述使用第一读命令从存储设备的物理块读取第一数据的步骤及其后续步骤。4.根据权利要求3所述的方法,其中所述第一可靠性测试包括:使用第一读命令从存储设备的多个或所有物理块的多个物理页读取第三数据;响应于第三数据的错误比特数大于第三阈值,将从中读取第三数据的物理块识别为坏块;将存储设备的被识别为坏块的物理块数量作为所述存储设备是否通过第一可靠性测试的依据。5.根据权利要求3或4所述的方法,其中响应于所述存储设备未通过第一可靠性测试,执行对所述存储设备的第二可靠性测试;所述第二可靠性测试包括:使用第一读命令从存储设备的多个或所有物理块的多个物理页读取第三数据;响应于从相同的物理页读取的第三数据的错误比特数大于第三阈值的次数超出阈值,将所述相同的物理页所在的物理块识别为坏块;将存储设备的被识别为坏块的物理块数量作为所述存储设备是否通过第一可靠性测试的依据。6.根据权利要求1-5之一所述的方法,还包括:响应于存储设备上电,加载并运行可靠性测试固件;从存储设备的LUN的指定物理块的指定物理页...

【专利技术属性】
技术研发人员:杨帆谢海龙
申请(专利权)人:上海忆芯实业有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1