一种多芯粒芯片的故障检测方法和装置制造方法及图纸

技术编号:37991144 阅读:9 留言:0更新日期:2023-06-30 10:05
本发明专利技术提供了一种多芯粒芯片的故障检测方法和装置,涉及计算机芯片技术领域。该方法包括:获取目标多芯粒芯片的运行数据;对运行数据进行解析,确定目标多芯粒芯片中各芯粒之间的关联关系;其中,关联关系用于表征芯粒之间的通信连接关系;根据每个关联关系,确定包括位于芯粒上的待检测位点;基于预先训练的故障检测模型,根据运行数据对每个待检测位点进行故障检测,得到故障检测结果。本方案能有效实现多芯粒芯片的故障检测,精确定位故障芯粒。粒。粒。

【技术实现步骤摘要】
一种多芯粒芯片的故障检测方法和装置


[0001]本专利技术涉及计算机芯片
,特别涉及一种多芯粒芯片的故障检测方法和装置。

技术介绍

[0002]目前的高性能计算芯片架构,由于考虑成本和扩展性而广泛使用了芯粒架构方式。根据不同芯片的性能需求,将多个裸芯片(即芯粒)封装到一起,再通过高速总线链接和扩展,组成性能不同的芯片。然而在基于芯粒架构得到的芯片封装后,其内会因芯粒间连接故障或运输中发生碰撞甚至长期运行损耗而导致一个或多个芯粒故障。同时现有故障检测方法在发现多芯粒芯片故障后,常将封装后的该芯片进行整体废弃,难以真正解决具体位置的故障修复问题,不仅提高了多芯粒芯片的制造成本,也降低了芯粒的利用率。

技术实现思路

[0003]本专利技术提供了一种多芯粒芯片的故障检测方法和装置,该方法能有效实现多芯粒芯片的故障检测,精确定位故障芯粒。
[0004]第一方面,本专利技术实施例提供了一种多芯粒芯片的故障检测方法,包括:获取目标多芯粒芯片的运行数据;对所述运行数据进行解析,确定所述目标多芯粒芯片中各芯粒之间的关联关系;其中,所述关联关系用于表征芯粒之间的通信连接关系;根据每个所述关联关系,确定包括位于芯粒上的待检测位点;基于预先训练的故障检测模型,根据所述运行数据对每个所述待检测位点进行故障检测,得到故障检测结果。
[0005]可选地,所述根据每个所述关联关系,确定包括位于芯粒上的待检测位点,包括:针对每个所述关联关系,将所述待检测位点设置在该关联关系所包括的芯粒上以及该关联关系的通信连接上
[0006]可选地,所述预先训练的故障检测模型通过如下方法训练得到:获取所述目标多芯粒芯片的历史运行数据集;其中,所述历史运行数据集包括历史运行数据以及故障位点;采用粒子群优化算法对深度信念网络进行优化,建立优化深度信念网络;利用所述历史运行数据对所述优化深度信念网络进行训练,得到所述故障检测模型。
[0007]可选地,所述采用粒子群优化算法对深度信念网络进行优化,建立优化深度信念网络,包括:S1:确定粒子群的规模、维数、预设迭代次数、初始化粒子群的位置、速度;S2:构建深度信念网络,根据所述粒子群对所述深度信念网络的权值和网络隐藏节点数值进行初始化,得到初始化深度信念网络,将所述初始化深度信念网络作为当前的
深度信念网络执行步骤S3;S3:根据当前的深度信念网络,利用所述粒子群优化算法进行迭代,得到当前最优解;S4:将所述当前最优解作为初始点,获取所述当前最优解的位置和速度;S5:根据所述当前最优解的位置和速度,利用共轭梯度更新所述当前最优解的速度,得到全局最优解;S6:根据所述全局最优解更新所述粒子群的位置、速度、所述深度信念网络的权值和网络隐藏节点数值,得到新的深度信念网络;判断当前迭代次数是否小于所述预设迭代次数;若是,将该新的深度信念网络作为当前的深度信念网络返回步骤S3;否则,将该新的深度信念网络输出为优化深度信念网络。
[0008]可选地,所述利用共轭梯度更新所述当前最优解的速度,包括:所述速度的计算公式如下:其中,用于表示第n次内部迭代后更新的粒子i在第j维的速度;用于表示第n次内部迭代前粒子i在第j维的位置;r1用于表示随机数;p
g
用于表示所述当前最优解;ε用于表示调整系数。
[0009]可选地,在所述得到故障检测结果之后,还包括:在所述故障检测结果所包括的故障位点分别位于不同芯粒上时,针对每个故障芯粒,获取与该故障芯粒相同的正常芯粒;利用该故障芯粒和所述正常芯粒分别运行目标硬件事件,得到由该故障芯粒输出的第一响应信号和由所述正常芯粒输出的第二响应信号;对所述第一响应信号和所述第二响应信号进行相似度计算,得到对应该故障芯粒的相似度值;对各故障芯粒的相似度值进行由大至小的排序,得到故障芯粒序列;对所述故障芯粒序列中各故障芯粒标记由大至小的故障等级;其中,相似度值与故障等级呈正相关。
[0010]可选地,在所述得到故障检测结果之后,还包括:获取所述故障检测结果所包括的故障位点;根据所述故障位点确定故障芯粒的故障接口;将所述故障接口对应的关联关系转移到该故障芯粒的其他可行接口上,实现对该故障芯粒的修复。
[0011]第二方面,本专利技术实施例还提供了一种多芯粒芯片的故障检测装置,包括:
获取模块,用于获取目标多芯粒芯片的运行数据;预处理模块,用于对所述运行数据进行解析,确定所述目标多芯粒芯片中各芯粒之间的关联关系;其中,所述关联关系用于表征芯粒之间的通信连接关系;位点确定模块,用于根据每个所述关联关系,确定包括位于芯粒上的待检测位点;检测模块,用于基于预先训练的故障检测模型,根据所述运行数据对每个所述待检测位点进行故障检测,得到故障检测结果。
[0012]可选地,该装置还包括:模型训练模块;所述模型训练模块用于执行如下操作:获取所述目标多芯粒芯片的历史运行数据集;其中,所述历史运行数据集包括历史运行数据以及故障位点;采用粒子群优化算法对深度信念网络进行优化,建立优化深度信念网络;利用所述历史运行数据对所述优化深度信念网络进行训练,得到所述故障检测模型。
[0013]第三方面,本专利技术实施例还提供了一种计算设备,包括存储器和处理器,所述存储器中存储有计算机程序,所述处理器执行所述计算机程序时,实现上述任一项所述的多芯粒芯片的故障检测方法。
[0014]第四方面,本专利技术实施例还提供了一种计算机可读存储介质,其上存储有计算机程序,当所述计算机程序在计算机中执行时,令计算机执行上述任一项所述的多芯粒芯片的故障检测方法。
[0015]本专利技术实施例提供了一种多芯粒芯片的故障检测方法和装置,该方法针对包含多芯粒的芯片,首先获取目标多芯粒芯片的运行数据,通过对运行数据进行解析,确定其中表征各芯粒之间通信连接关系的关联关系,然后通过基于该关联关系确定位于芯粒上的待检测位点,使用预先训练的故障检测模型对每个待检测位点进行故障检测,得到故障检测结果,如此能有效实现多芯粒芯片的故障检测,精确定位故障芯粒,从而对该故障芯粒进行修复或替换,提高芯粒利用率的同时,也提高了该多芯粒芯片的利用率,减少了不必要的整体废弃。
附图说明
[0016]为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0017]图1是本专利技术一实施例提供的一种多芯粒芯片的故障检测方法的流程图;图2是本专利技术一实施例提供的一种计算设备的硬件架构图;图3是本专利技术一实施例提供的一种多芯粒芯片的故障检测装置结构图。
具体实施方式
[0018]为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例,基于本专利技术中的实施例,本领本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种多芯粒芯片的故障检测方法,其特征在于,包括:获取目标多芯粒芯片的运行数据;对所述运行数据进行解析,确定所述目标多芯粒芯片中各芯粒之间的关联关系;其中,所述关联关系用于表征芯粒之间的通信连接关系;根据每个所述关联关系,确定包括位于芯粒上的待检测位点;基于预先训练的故障检测模型,根据所述运行数据对每个所述待检测位点进行故障检测,得到故障检测结果。2.根据权利要求1所述的方法,其特征在于,所述根据每个所述关联关系,确定包括位于芯粒上的待检测位点,包括:针对每个所述关联关系,将所述待检测位点设置在该关联关系所包括的芯粒上以及该关联关系的通信连接上。3.根据权利要求1所述的方法,其特征在于,所述预先训练的故障检测模型通过如下方法训练得到:获取所述目标多芯粒芯片的历史运行数据集;其中,所述历史运行数据集包括历史运行数据以及故障位点;采用粒子群优化算法对深度信念网络进行优化,建立优化深度信念网络;利用所述历史运行数据对所述优化深度信念网络进行训练,得到所述故障检测模型。4.根据权利要求3所述的方法,其特征在于,所述采用粒子群优化算法对深度信念网络进行优化,建立优化深度信念网络,包括:S1:确定粒子群的规模、维数、预设迭代次数、初始化粒子群的位置、速度;S2:构建深度信念网络,根据所述粒子群对所述深度信念网络的权值和网络隐藏节点数值进行初始化,得到初始化深度信念网络,将所述初始化深度信念网络作为当前的深度信念网络执行步骤S3;S3:根据当前的深度信念网络,利用所述粒子群优化算法进行迭代,得到当前最优解;S4:将所述当前最优解作为初始点,获取所述当前最优解的位置和速度;S5:根据所述当前最优解的位置和速度,利用共轭梯度更新所述当前最优解的速度,得到全局最优解;S6:根据所述全局最优解更新所述粒子群的位置、速度、所述深度信念网络的权值和网络隐藏节点数值,得到新的深度信念网络;判断当前迭代次数是否小于所述预设迭代次数;若是,将该新的深度信念网络作为当前的深度信念网络返回步骤S3;否则,将该新的深度信念网络输出为优化深度信念网络。5.根据权利要求4所述的方法,其特征在于,所述利用共轭梯度更新所述当前最优解的速度,包括:所述速度的计算公...

【专利技术属性】
技术研发人员:王嘉诚张少仲张栩
申请(专利权)人:中诚华隆计算机技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1