一种识别指令软错误类型的方法、装置、设备及介质制造方法及图纸

技术编号：38270477 阅读：10 留言：0更新日期：2023-07-27 10:25

本发明专利技术公开了一种识别指令软错误类型的方法、装置、设备及介质；本方案在识别目标程序中指令软错误类型时，并不需要对目标程序执行大量的注错实验，只需要通过少量的注错实验得到的结果构建指令识别模型，即可利用该指令识别模型自动识别目标程序中各指令发生软错误的错误类型，可以很大程度上降低容错分析的开销；并且，这种分析方式不需要依赖人工识别，可以提高指令识别的效率和准确度。以提高指令识别的效率和准确度。以提高指令识别的效率和准确度。

全部详细技术资料下载

【技术实现步骤摘要】
一种识别指令软错误类型的方法、装置、设备及介质

[0001]本专利技术涉及指令识别
，更具体地说，涉及一种识别指令软错误类型的方法、装置、设备及介质。

技术介绍

[0002]随着高性能计算技术不断深入并推进气象海洋、材料仿真、数值模拟、人工智能、生命医药等众多科学计算领域的研究与发展，近年来各行业对高性能计算平台算力的需求也在不断提高，此前被认为是超级计算机领域的“下一顶皇冠”的E级计算，也在2022年被实现。然而，现阶段大多数高性能计算集群运算能力的提升并不源自单个中央运算单元核心主频的提高，实际上，05年之后“摩尔定律“遇到瓶颈，处理器主频上升的趋势已经停滞多年，原因是越来越高的芯片集成程度使工程师们不得不在处理器主频与处理器发热量及功耗之间权衡，目前高性能平台算力的提升主要依赖于不断提高计算单元的并行度，所以高性能计算集群(平台)未来将向着规模更大、效率更高的方向发展。但是，随着高性能计算集群规模的不断增大，运算能力不断增强的同时，软错误对集群的影响也日益严重。
[0003]目前，高性能计算平台可使用容错方法将软错误的影响降到最低，在使用容错方法时，需要根据高性能应用程序中指令的容错特性设置容错策略，现有在分析指令的容错特性时，现有的分析方式是使用错误注入的方式对高性能应用程序进行随机注入，通过注入后运行结果判断指令的容错特性。但是使用该方法想要得到较为全面、完整的指令错误崩溃倾向性分析结果，需要进行大量的注错实验，覆盖程序中的指令，且对不同的程序以及输入需要重复进行实验分析，这种大量重复进行错误...

【技术保护点】

【技术特征摘要】
1.一种识别指令软错误类型的方法，其特征在于，包括：确定目标程序及指令识别模型；其中，所述指令识别模型为通过指令的容错特征与软错误类型之间的对应关系训练得到；利用所述指令识别模型对所述目标程序分析，识别所述目标程序中各指令发生软错误的错误类型。2.根据权利要求1所述的方法，其特征在于，所述确定目标程序及指令识别模型，包括：确定目标高性能计算程序及指令识别模型；其中，所述指令识别模型为通过初始高性能计算程序中指令的容错特征与软错误类型之间的对应关系训练得到。3.根据权利要求1所述的方法，其特征在于，所述目标程序中各指令发生软错误的错误类型包括：掩盖错误类型、错误崩溃类型及结果错误类型。4.根据权利要求1至3中任意一项所述的方法，其特征在于，所述确定目标程序及指令识别模型之前，还包括：将初始高性能程序在高性能计算平台上并行运行，并通过注错工具对所述高性能程序的并行运行实例执行注错操作，得到执行结果数据；根据所述执行结果数据生成输入数据集；其中，所述输入数据集包括所述初始高性能程序中各注错指令的容错特征及对应的软错误类型；利用所述输入数据集对初始深度学习模型训练，得到所述指令识别模型。5.根据权利要求4所述的方法，其特征在于，所述初始深度学习模型为RNN深度学习模型。6.根据权利要求4所述的方法，其特征在于，所述容错...

【专利技术属性】
技术研发人员：于洪梅，刘圆圆，吴旗，魏晓辉，徐海啸，董飒，李翔，岳恒山，
申请(专利权)人：吉林大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人