随机存储器失效的检测处理方法及其系统技术方案

技术编号:3083548 阅读:178 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种RAM失效的检测处理方法,应用于对CPU/DSP的RAM失效的检测处理,包括:读取所述RAM中的程序内容;将读取的程序内容与正确的程序内容进行比对,当两者不一致时,判断RAM失效并进行数据修复;或者将读取的程序内容采用设定的校验方法进行数据校验,并与正确的校验结果进行比对,当两者不一致时,判断RAM失效并报警。采用本发明专利技术方法,可及时检测CPU/DSP  RAM失效的情况,及时采取相应的处理措施,将RAM失效引起的影响降到最低。

【技术实现步骤摘要】

本专利技术涉及检测领域,尤其涉及一种CPU/DSP的RAM存储空间失效的检测处理方法及其系统。
技术介绍
带有随机存储器(Random Access Memory,RAM)的器件在其生命周期中,会由于各种各样的原因导致功能失效,一般而言,硬件本身发生损坏的,我们称之为器件硬失效(Firm Error),否则,称之为器件软失效(Soft Error)。软失效主要是由于带电粒子撞击器件的存储单元RAM引起的,这些高能粒子和半导体存储器的原子相互作用产生电子空穴对,该电子空穴对导致存储单元中存储信息的改变,进而导致器件功能错误。上世纪70年代末的时候,工程人员就发现了软失效的现象,当时的原因是器件封装材料放射性杂质衰变发出α粒子,引起了电离效应,导致存储单元状态发生改变。随着半导体技术的发展、器件工艺尺寸的降低、工作电压的减少,现在发现宇宙射线同样也能引起器件软失效,且其影响的程度将比以往严重的多,因此现在器件软失效再次受到业界的关注。所有带RAM的器件都有可能发生软失效,不过迄今为止业界关注较多的是基于RAM的现场可编程门阵列(Field Programmable Gate Array,FPGA)和专用集成电路(Application Specific Integrated Circuit,ASIC)等逻辑器件出现的软失效问题,而且在设计和防护上已经积累了一定的经验,但对于应用更广泛的CPU/DSP的静态随机存储器(Static Random Access Memory,SRAM)和动态随机存储器(Dynamic Random Access Memory,DRAM)的软失效问题则关注甚少。实际上,CPU/DSP的SRAM和DRAM储存器照样存在严重的软失效情况,而且根据多个器件厂商提供的数据,折合成年失效率,1兆比特SRAM中出现1比特空间软失效的概率是千分之几的级别,对于通讯、航天和军用等对稳定性要求很严的产品而言,这是一个很高的失效率。通过实际应用所捕获的软失效案例不在少数,某通讯厂商曾对某个特定产品的年度返修板进行统计,发现近80%的返修板在擦除存储器内的数据库并重下主机软件后可以修复,经过分析,里面很大概率是由于SRAM器件软失效导致的。在另外一个产品的某问题定位过程中,研发人员捕获到DSP内存中仅有某个程序比特位信息异常丢失的情况,而分析代码,是绝对不可能出现更改该比特位的情况,基本可以确定是由于DSP的SRAM存放程序比特位软失效导致的问题。可以确定的是,在那些对CPU/DSP使用很频繁的商用产品中,出现SRAM或DRAM软失效的概率很大。其中有一些可以通过内存分析找到并确认是软失效引起的,但是绝大多数都会表现为一些无法重现的故障,比如复位、死机、无异常记录情况下部分功能错误等等。这一方面会影响产品的可靠性,另一方面为了定位这些问题会投入大量的人力,因此有必要将软失效的影响限制在最低的限度。
技术实现思路
本专利技术提供一种RAM失效的检测处理方法,用以及早发现CPU/DSP的RAM失效故障和减少RAM失效的发生。基于上述方法,本专利技术还提供了一种RAM失效的检测处理系统。本专利技术方法包括A、读取所述RAM中的程序内容;B、将读取的程序内容与正确的程序内容进行比对,当两者不一致时,判断所述RAM失效并进行数据修复;或者将读取的程序内容采用设定的校验方法进行数据校验,并与正确的校验结果进行比对,当两者不一致时,判断所述RAM失效并报警。根据本专利技术的上述方法,若所述RAM可被CPU/DSP的高层控制实体访问,则由该高层控制实体读取所述RAM中的程序内容并将其与该高层控制实体本地存储的正确的程序内容进行比对,当两者不一致时,该高层控制实体将所述正确的程序内容加载到所述RAM中进行数据修复。若所述RAM不能被CPU/DSP的高层控制实体访问,则由所述CPU/DSP读取所述RAM中的程序内容进行校验;或者预先在所述RAM中备份正确的程序内容;CPU/DSP将所述RAM中的程序内容与所述备份的程序内容进行比对,当两者不一致时,根据所述备份的程序内容修复所述RAM中的程序内容。上述方法中,对所述RAM中的程序内容进行校验或比对,采用低优先级的任务触发。根据本专利技术的上述方法,在进行程序内容比对时,将RAM中存储程序内容的数据单元与存储正确程序内容的数据单元逐一进行比对,并逐一对所述数据单元中的比特位进行比对。根据本专利技术的上述方法,在进行数据修复后判断修复是否成功,若修复成功,则判断所述RAM发生软失效,并记录软失效相关信息;否则,重复修复过程;当重复修复次数达到预设阈值时,判断所述RAM发生硬失效,并上报硬件故障告警。根据本专利技术的上述方法,对所述RAM中的程序内容按设定周期分批进行所述比对或校验。上述方法中,分批对所述RAM中的程序内容进行校验,包括将上一批数据的校验结果值与下一批数据一起进行校验,得到下一批数据的校验结果值; 将最后一批数据的校验结果值作为所述RAM中的程序内容的最终校验结果。上述方法中,采用循环冗余或奇偶校验方法对所述RAM中的程序内容进行校验。根据本专利技术的上述方法,按照设定的间隔时间,重复所述步骤A和B。本专利技术提供的RAM失效的检测处理系统,包括检测判断模块和失效处理模块;所述检测判断模块读取所述RAM中的程序内容;将读取的程序内容与正确的程序内容进行比对,当两者不一致时,判断所述RAM失效,发送修复指令到所述失效处理模块;或者将读取的程序内容采用设定的校验方法进行数据校验,并与正确的校验结果进行比对,当两者不一致时,判断所述RAM失效,发送报警指令到所述失效处理模块;所述失效处理模块接收到修复指令后,对所述RAM中的程序内容进行数据修复处理;接收到报警指令后,进行报警处理。根据本专利技术的上述系统,若所述RAM能被CPU/DSP的高层控制实体访问,则所述检测判断模块和失效处理模块位于所述CPU/DSP的高层控制实体;所述检测判断模块读取所述RAM中的程序内容;将读取的程序内容与所述CPU/DSP的高层控制实体本地存储的正确的程序内容进行比对,当两者不一致时,判断所述RAM失效,发送修复指令到所述失效处理模块;所述失效处理模块接收到修复指令后,对所述RAM中的程序内容进行数据修复处理。根据本专利技术的上述系统,若所述RAM不能被CPU/DSP的高层控制实体访问,则所述检测判断模块和失效处理模块位于所述CPU/DSP中;所述检测判断模块读取所述RAM中的程序内容; 将读取的程序内容采用设定的校验方法进行数据校验,并与正确的校验结果进行比对,当两者不一致时,判断所述RAM失效,发送报警指令到所述失效处理模块;或者将读取的程序内容与在所述RAM中备份的正确程序内容进行比对,当两者不一致时,判断所述RAM失效,发送修复指令到所述失效处理模块;所述失效处理模块接收到报警指令后,进行报警处理;接收到修复指令后,对所述RAM中的程序内容进行数据修复处理。本专利技术的有益效果如下(1)本专利技术方法对CPU/DSP RAM中的程序内容进行周期性实时检测,可及时检测CPU/DSP中出现的程序空间RAM失效的情况,可以节省大量对RAM失效进行定位和分析的工作量。(2)本专利技术针对可被高层控制实体访问的RAM,采用数据比本文档来自技高网
...

【技术保护点】
一种随机存储器RAM失效的检测处理方法,应用于对中央处理器CPU/数字信号处理器DSP的RAM失效的检测处理,该方法包括:A、读取所述RAM中的程序内容;B、将读取的程序内容与正确的程序内容进行比对,当两者不一致时,判断所述 RAM失效并进行数据修复;或者将读取的程序内容采用设定的校验方法进行数据校验,并与正确的校验结果进行比对,当两者不一致时,判断所述RAM失效并报警。

【技术特征摘要】
1.一种随机存储器RAM失效的检测处理方法,应用于对中央处理器CPU/数字信号处理器DSP的RAM失效的检测处理,该方法包括A、读取所述RAM中的程序内容;B、将读取的程序内容与正确的程序内容进行比对,当两者不一致时,判断所述RAM失效并进行数据修复;或者将读取的程序内容采用设定的校验方法进行数据校验,并与正确的校验结果进行比对,当两者不一致时,判断所述RAM失效并报警。2.如权利要求1所述的方法,其特征在于,若所述RAM可被CPU/DSP的高层控制实体访问,则由该高层控制实体读取所述RAM中的程序内容并将其与该高层控制实体本地存储的正确的程序内容进行比对,当两者不一致时,该高层控制实体将所述正确的程序内容加载到所述RAM中进行数据修复。3.如权利要求2所述的方法,其特征在于,若所述RAM不能被CPU/DSP的高层控制实体访问,则由所述CPU/DSP读取所述RAM中的程序内容进行校验;或者预先在所述RAM中备份正确的程序内容;CPU/DSP将所述RAM中的程序内容与所述备份的程序内容进行比对,当两者不一致时,根据所述备份的程序内容修复所述RAM中的程序内容。4.如权利要求3所述的方法,其特征在于,对所述RAM中的程序内容进行校验或比对,采用低优先级的任务触发。5.如权利要求1所述的方法,其特征在于,在进行程序内容比对时,将RAM中存储程序内容的数据单元与存储正确程序内容的数据单元逐一进行比对,并逐一对所述数据单元中的比特位进行比对。6.如权利要求1所述的方法,其特征在于,在进行数据修复后判断修复是否成功,若修复成功,则判断所述RAM发生软失效,并记录软失效相关信息;否则,重复修复过程;当重复修复次数达到预设阈值时,判断所述RAM发生硬失效,并上报硬件故障告警。7.如权利要求1所述的方法,其特征在于,对所述RAM中的程序内容按设定周期分批进行所述比对或校验。8.如权利要求7所述的方法,其特征在于,分批对所述RAM中的程序内容进行校验,包括将上一批数据的校验结果值与下一批数据一起进行校验,得到下一批数据的校验结果值;将最后一批数据的校验结果值作为...

【专利技术属性】
技术研发人员:李强
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:94[中国|深圳]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利