【技术实现步骤摘要】
一种用于神经网络处理器的故障检测方法
本专利技术涉及深度学习领域,具体来说涉及深度学习处理器故障测试领域,更具体地说,涉及一种神经网络处理器的故障检测方法。
技术介绍
随着深度学习算法、存算一体化技术和近似计算技术的不断成熟,专用神经网络处理器凭借其在性能、成本上的优势,被广泛应用在生产、生活的各个方面。然而新兴技术在极大改善处理器性能的同时,也带来了明显的可靠性问题。新兴制造工艺的不成熟、环境噪声、器件老化等问题都可能导致深度学习处理器发生故障。特别是在目前流行的基于忆阻器的神经网络芯片中,神经元细胞不可避免的会受到制造工艺的影响,使得其存储的神经网络参数偏离其理想值,最终导致严重的系统故障。即便处理器采用基于传统的CMOS(互补金属氧化物半导体)技术,SRAM(静态随机存储器)单元也有可能由于损耗、环境变化等原因出现故障。在处理器可靠性领域,存储器故障可以根据故障原因分成永久性故障和瞬时故障。永久性故障是指由制造缺陷或者或电路老化造成的不可恢复的故障。对于可变电阻式随机存取存储器(ReRAM),永久故障会导致Re ...
【技术保护点】
1.一种用于神经网络处理器的故障检测方法,其特征在于,所述检测方法包括:/nS1、根据待检测处理器的应用场景,获取该场景中对故障敏感的测试样本组成的测试集;/nS2、将所述测试集输入待检测处理器中进行神经网络推理;/nS3、计算待检测处理器对测试集进行神经网络推断后的分类置信度与无故障神经网络处理器对测试集进行神经网络推断后的分类置信度的置信度偏差,根据所述置信度偏差判断待检测处理器是否发生故障。/n
【技术特征摘要】
1.一种用于神经网络处理器的故障检测方法,其特征在于,所述检测方法包括:
S1、根据待检测处理器的应用场景,获取该场景中对故障敏感的测试样本组成的测试集;
S2、将所述测试集输入待检测处理器中进行神经网络推理;
S3、计算待检测处理器对测试集进行神经网络推断后的分类置信度与无故障神经网络处理器对测试集进行神经网络推断后的分类置信度的置信度偏差,根据所述置信度偏差判断待检测处理器是否发生故障。
2.根据权利要求1所述的一种用于神经网络处理器的故障检测方法,其特征在于,所述测试集是针对应用场景预先生成的测试集,生成所述测试集的方法包括如下步骤:
P1、根据待检测处理器的应用场景的资源限制以及检测精度要求,设置测试样本集的大小;
P2、在应用场景的原始正常数据样本中添加扰动生成多个初始测试样本;
P3、对应用场景对应的原始神经网络模型随机进行不同的故障设置以生成多个不同的模拟故障神经网络模型;
P4、用所有的模拟故障神经网络模型对每一个初始测试样本进行神经网络推断,统计每一个初始测试样本对所有模拟故障神经网络模型的故障检测精度,将故障检测精度大于预设的故障检测精度阈值的初始测试样本放入测试样本集。
3.根据权利要求2所述的一种用于神经网络处理器的故障检测方法,其特征在于,在所述步骤P2中,在原始正常数据样本基础上,沿神经网络模型的分类判断方向添加指定的扰动以产生对神经网络模型参数变动敏感的初始测试样本。
4.根据权利要求2所述的一种用于神经网络处理器的故障检测方法,其特征在于,所述步骤P3通过在原始神经网络模型上修改神经网络参数值以模拟不同故障的发生情况来生成模拟...
【专利技术属性】
技术研发人员:李雯,王颖,李华伟,李晓维,
申请(专利权)人:中国科学院计算技术研究所,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。