当前位置: 首页 > 专利查询>吉林大学专利>正文

一种识别指令软错误类型的方法、装置、设备及介质制造方法及图纸

技术编号:38270477 阅读:10 留言:0更新日期:2023-07-27 10:25
本发明专利技术公开了一种识别指令软错误类型的方法、装置、设备及介质;本方案在识别目标程序中指令软错误类型时,并不需要对目标程序执行大量的注错实验,只需要通过少量的注错实验得到的结果构建指令识别模型,即可利用该指令识别模型自动识别目标程序中各指令发生软错误的错误类型,可以很大程度上降低容错分析的开销;并且,这种分析方式不需要依赖人工识别,可以提高指令识别的效率和准确度。以提高指令识别的效率和准确度。以提高指令识别的效率和准确度。

【技术实现步骤摘要】
一种识别指令软错误类型的方法、装置、设备及介质


[0001]本专利技术涉及指令识别
,更具体地说,涉及一种识别指令软错误类型的方法、装置、设备及介质。

技术介绍

[0002]随着高性能计算技术不断深入并推进气象海洋、材料仿真、数值模拟、人工智能、生命医药等众多科学计算领域的研究与发展,近年来各行业对高性能计算平台算力的需求也在不断提高,此前被认为是超级计算机领域的“下一顶皇冠”的E级计算,也在2022年被实现。然而,现阶段大多数高性能计算集群运算能力的提升并不源自单个中央运算单元核心主频的提高,实际上,05年之后“摩尔定律“遇到瓶颈,处理器主频上升的趋势已经停滞多年,原因是越来越高的芯片集成程度使工程师们不得不在处理器主频与处理器发热量及功耗之间权衡,目前高性能平台算力的提升主要依赖于不断提高计算单元的并行度,所以高性能计算集群(平台)未来将向着规模更大、效率更高的方向发展。但是,随着高性能计算集群规模的不断增大,运算能力不断增强的同时,软错误对集群的影响也日益严重。
[0003]目前,高性能计算平台可使用容错方法将软错误的影响降到最低,在使用容错方法时,需要根据高性能应用程序中指令的容错特性设置容错策略,现有在分析指令的容错特性时,现有的分析方式是使用错误注入的方式对高性能应用程序进行随机注入,通过注入后运行结果判断指令的容错特性。但是使用该方法想要得到较为全面、完整的指令错误崩溃倾向性分析结果,需要进行大量的注错实验,覆盖程序中的指令,且对不同的程序以及输入需要重复进行实验分析,这种大量重复进行错误注入的分析方式会导致实验开销巨大,并且,该分析方式主要依靠人工进行分析识别,因此指令识别效率及指令识别准确度较低。

技术实现思路

[0004]本专利技术的目的在于提供一种识别指令软错误类型的方法、装置、设备及介质,以提高指令识别效率及识别准确度,节省试验开销。
[0005]为实现上述目的,本专利技术提供一种识别指令软错误类型的方法,包括:
[0006]确定目标程序及指令识别模型;其中,所述指令识别模型为通过指令的容错特征与软错误类型之间的对应关系训练得到;
[0007]利用所述指令识别模型对所述目标程序分析,识别所述目标程序中各指令发生软错误的错误类型。
[0008]优选地,所述确定目标程序及指令识别模型,包括:
[0009]确定目标高性能计算程序及指令识别模型;
[0010]优选地,所述指令识别模型为通过初始高性能计算程序中指令的容错特征与软错误类型之间的对应关系训练得到。
[0011]优选地,所述目标程序中各指令发生软错误的错误类型包括:掩盖错误类型、错误
崩溃类型及结果错误类型。
[0012]优选地,所述确定目标程序及指令识别模型之前,还包括:
[0013]将初始高性能程序在高性能计算平台上并行运行,并通过注错工具对所述高性能程序的并行运行实例执行注错操作,得到执行结果数据;
[0014]根据所述执行结果数据生成输入数据集;其中,所述输入数据集包括所述初始高性能程序中各注错指令的容错特征及对应的软错误类型;
[0015]利用所述输入数据集对初始深度学习模型训练,得到所述指令识别模型。
[0016]优选地,所述初始深度学习模型为RNN深度学习模型。
[0017]优选地,所述容错特征包括:指令类型、注错目标寄存器、注错位置与内存访问边界、注错指令静态切片。
[0018]为实现上述目的,本专利技术进一步提供一种识别指令软错误类型的装置,包括:
[0019]确定模块,用于确定目标程序及指令识别模型;其中,所述指令识别模型为通过指令的容错特征与软错误类型之间的对应关系训练得到;
[0020]识别模块,用于利用所述指令识别模型对所述目标程序分析,识别所述目标程序中各指令发生软错误的错误类型。
[0021]优选地,本装置还包括:
[0022]执行结果获取模块,用于将初始高性能程序在高性能计算平台上并行运行,并通过注错工具对所述高性能程序的并行运行实例执行注错操作,得到执行结果数据;
[0023]输入数据集生成模块,用于根据所述执行结果数据生成输入数据集;其中,所述输入数据集包括所述初始高性能程序中各注错指令的容错特征及对应的软错误类型;
[0024]训练模块,用于利用所述输入数据集对初始深度学习模型训练,得到所述指令识别模型。
[0025]为实现上述目的,本专利技术进一步提供一种电子设备,包括:
[0026]存储器,用于存储计算机程序;
[0027]处理器,用于执行所述计算机程序时实现上述识别指令软错误类型的方法的步骤。
[0028]为实现上述目的,本专利技术进一步提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现如上述识别指令软错误类型的方法的步骤。
[0029]通过以上方案可知,本专利技术实施例提供的一种识别指令软错误类型的方法、装置、设备及介质;本方案在识别目标程序中指令软错误类型时,并不需要对目标程序执行大量的注错实验,只需要通过少量的注错实验得到的结果构建指令识别模型,即可利用该指令识别模型自动识别目标程序中各指令发生软错误的错误类型,可以很大程度上降低容错分析的开销;并且,这种分析方式不需要依赖人工识别,可以提高指令识别的效率和准确度。
附图说明
[0030]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以
根据这些附图获得其他的附图。
[0031]图1为本专利技术实施例公开的一种识别指令软错误类型的方法流程示意图;
[0032]图2为本专利技术实施例公开的另一种识别指令软错误类型的方法流程示意图;
[0033]图3为本专利技术实施例公开的一种指令识别模型生成方法流程示意图;
[0034]图4为本专利技术实施例公开的一种基于机器学习的高性能计算程序错误崩溃倾向性指令识别装置框架图;
[0035]图5为本专利技术实施例公开的一种识别指令软错误类型的装置结构示意图;
[0036]图6为本专利技术实施例公开的一种电子设备结构示意图。
具体实施方式
[0037]为了对本专利技术进行清楚阐述,在此先对本专利技术所涉及的专业术语进行具体说明:
[0038]高性能计算(High Performance Computing,HPC):指将计算能力聚集起来处理标准服务器无法完成的数据密集型或计算密集型任务,包括数值模拟,仿真,深度学习等;
[0039]集群(Cluster):多台服务器通过高速网络互联(InfiniBand)、共享并行文件系统(Lustre)、管理调度软件(Load Sharing Facility,LSF)等技术组织在一起,组成一个相互合作且本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种识别指令软错误类型的方法,其特征在于,包括:确定目标程序及指令识别模型;其中,所述指令识别模型为通过指令的容错特征与软错误类型之间的对应关系训练得到;利用所述指令识别模型对所述目标程序分析,识别所述目标程序中各指令发生软错误的错误类型。2.根据权利要求1所述的方法,其特征在于,所述确定目标程序及指令识别模型,包括:确定目标高性能计算程序及指令识别模型;其中,所述指令识别模型为通过初始高性能计算程序中指令的容错特征与软错误类型之间的对应关系训练得到。3.根据权利要求1所述的方法,其特征在于,所述目标程序中各指令发生软错误的错误类型包括:掩盖错误类型、错误崩溃类型及结果错误类型。4.根据权利要求1至3中任意一项所述的方法,其特征在于,所述确定目标程序及指令识别模型之前,还包括:将初始高性能程序在高性能计算平台上并行运行,并通过注错工具对所述高性能程序的并行运行实例执行注错操作,得到执行结果数据;根据所述执行结果数据生成输入数据集;其中,所述输入数据集包括所述初始高性能程序中各注错指令的容错特征及对应的软错误类型;利用所述输入数据集对初始深度学习模型训练,得到所述指令识别模型。5.根据权利要求4所述的方法,其特征在于,所述初始深度学习模型为RNN深度学习模型。6.根据权利要求4所述的方法,其特征在于,所述容错...

【专利技术属性】
技术研发人员:于洪梅刘圆圆吴旗魏晓辉徐海啸董飒李翔岳恒山
申请(专利权)人:吉林大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1