多芯片模块故障识别处理方法及系统技术方案

技术编号:29077810 阅读:19 留言:0更新日期:2021-06-30 09:36
本发明专利技术提供一种多芯片模块故障识别处理方法及系统,其中,多芯片模块故障识别处理方法包括:启动MCM多芯片,所述MCM多芯片包括至少一个单芯片;通过检查所述MCM多芯片中控制链路的连通性,从所述至少一个单芯片中筛选出控制链路稳定连接的一级单芯片;对所述一级单芯片的控制链路和数据链路进行重新规划和配置;检查所述一级单芯片的数据链路;将数据链路稳定连接的一级单芯片作为二级单芯片,并通过所述二级单芯片实现所述MCM多芯片的功能。本发明专利技术能够降低MCM多芯片制造的成本,提高MCM多芯片的可靠性。多芯片的可靠性。多芯片的可靠性。

【技术实现步骤摘要】
多芯片模块故障识别处理方法及系统


[0001]本专利技术涉及MCM(Multi

chip Module,多芯片模块)
,尤其涉及一种多芯片模块故障识别处理方法及系统。

技术介绍

[0002]在目前的高性能计算芯片架构中,考虑到成本和扩展性等因素,广泛使用了Chiplet(小芯片)的架构方式。即在开发阶段,以Die(裸芯片)为单位进行完整的SOC(System on Chip,系统级芯片)设计,并同时设计可扩展接口。在封装阶段,根据不同芯片产品线的需求,将多个Die封装到一个Package(包)中,然后再通过高速总线链接和扩展,组成性能不同的芯片。
[0003]在实际的芯片制造环节,单芯片是以晶圆为单位进行流水化生产的,每个单芯片即为后续封装中的Die。同一片MCM多芯片中有的Die是合格的,有的Die是不合格的,即有的Die是有故障的。所以在当封装厂进行封装前,会剔除掉不合格芯片,筛选出合格的芯片进行后续的封装,以提升单芯片的良率,进而提升MCM多芯片封装后的整体良率。
[0004]但是在MCM多芯片封装后,其内会因Die间连接故障或因运输过程中碰撞等因素而导致的一个或多个Die故障,并且在使用过程中也会因长期损耗使得一个或多个Die出现损坏的问题。
[0005]如此在发现故障后只能将封装后的MCM多芯片进行整体的废弃,这样不仅间接提高了MCM多芯片制造的成本,同时也整体上降低了MCM多芯片的可靠性。

技术实现思路

[0006]为解决上述问题,本专利技术提供的多芯片模块故障识别处理方法及系统,通过从控制链路和数据链路的角度,对MCM多芯片中的故障芯片进行动态检测,能够有效的提高MCM多芯片的使用率,从而降低MCM多芯片制造的成本,提高MCM多芯片的可靠性。
[0007]第一方面,本专利技术提供一种多芯片模块故障识别处理方法,包括:
[0008]启动MCM多芯片,所述MCM多芯片包括至少一个单芯片;
[0009]通过检查所述MCM多芯片中控制链路的连通性,从所述至少一个单芯片中筛选出控制链路稳定连接的一级单芯片;
[0010]对所述一级单芯片的控制链路和数据链路进行重新规划和配置;
[0011]检查所述一级单芯片的数据链路;
[0012]将数据链路稳定连接的一级单芯片作为二级单芯片,并通过所述二级单芯片实现所述MCM多芯片的功能。
[0013]可选地,在所述对所述一级单芯片的控制链路和数据链路进行重新规划和配置之前,所述方法还包括:
[0014]重复执行所述通过检查所述MCM多芯片中控制链路的连通性,从所述至少一个单芯片中筛选出控制链路稳定连接的一级单芯片的步骤,并记录每次筛选出的一级单芯片的
数量;
[0015]选取筛选数量最少的那次所筛选出的一级单芯片作为一级优良单芯片;
[0016]所述对所述一级单芯片的控制链路和数据链路进行重新规划和配置包括:
[0017]对所述一级优良单芯片的控制链路和数据链路进行重新规划和配置;
[0018]所述检查所述一级单芯片的数据链路的步骤包括:
[0019]检查所述一级优良单芯片的数据链路;
[0020]所述将数据链路稳定连接的一级单芯片作为二级单芯片,并通过所述二级单芯片实现所述MCM多芯片的功能包括:
[0021]将数据链路稳定连接的一级优良单芯片作为二级单芯片,并通过所述二级单芯片实现所述MCM多芯片的功能。
[0022]可选地,所述方法还包括:
[0023]对所述至少一个单芯片中控制链路不稳定连接的单芯片进行屏蔽操作。
[0024]可选地,所述方法还包括:
[0025]对所述至少一个单芯片中控制链路不稳定连接的单芯片进行低功耗处理。
[0026]可选地,在所述检查所述一级单芯片的数据链路之前,所述方法还包括:
[0027]检查所述一级优良单芯片的控制链路,若存在至少一个一级优良单芯片的控制链路不稳定,则结束所述多芯片模块故障识别处理方法。
[0028]可选地,所述方法还包括:
[0029]对数据链路不稳定连接的一级优良单芯片进行屏蔽操作;
[0030]所述通过所述二级单芯片实现所述MCM多芯片的功能包括:
[0031]根据二级单芯片的数量和索引,对所述二级单芯片的控制链路和数据链路进行重新规划和配置;
[0032]检查所述二级单芯片的数据链路是否稳定连接,若否,则结束所述多芯片模块故障识别处理方法,若是,则根据所述二级单芯片的数量和MCM多芯片的工作状态,调整MCM多芯片的工作频率,以使所述二级单芯片实现所述MCM多芯片的功能。
[0033]可选地,所述方法还包括:
[0034]对数据链路不稳定连接的一级优良单芯片进行低功耗处理。
[0035]第二方面,本专利技术提供一种多芯片模块故障识别处理系统,包括:
[0036]启动模块,被配置为启动MCM多芯片,所述MCM多芯片包括至少一个单芯片;
[0037]筛选模块,被配置为通过检查所述MCM多芯片中控制链路的连通性,从所述至少一个单芯片中筛选出控制链路稳定连接的一级单芯片;
[0038]调整模块,被配置为对所述一级单芯片的控制链路和数据链路进行重新规划和配置;
[0039]第一检查模块,被配置为检查所述一级单芯片的数据链路;
[0040]处理模块,被配置为将数据链路稳定连接的一级单芯片作为二级单芯片,并通过所述二级单芯片实现所述MCM多芯片的功能。
[0041]可选地,所述系统还包括:
[0042]重复执行模块,被配置为在所述对所述一级单芯片的控制链路和数据链路进行重新规划和配置之前,重复执行所述通过检查所述MCM多芯片中控制链路的连通性,从所述至
少一个单芯片中筛选出控制链路稳定连接的一级单芯片的步骤,并记录每次筛选出的一级单芯片的数量;
[0043]选取模块,被配置为选取筛选数量最少的那次所筛选出的一级单芯片作为一级优良单芯片;
[0044]所述调整模块,进一步被配置为对所述一级优良单芯片的控制链路和数据链路进行重新规划和配置;
[0045]所述第一检查模块,进一步被配置为检查所述一级优良单芯片的数据链路;
[0046]所述处理模块,进一步被配置为将数据链路稳定连接的一级优良单芯片作为二级单芯片,并通过所述二级单芯片实现所述MCM多芯片的功能。
[0047]可选地,所述系统还包括:
[0048]第一屏蔽模块,被配置为对所述至少一个单芯片中控制链路不稳定连接的单芯片进行屏蔽操作。
[0049]可选地,所述系统还包括:
[0050]第一低功耗处理模块,被配置为对所述至少一个单芯片中控制链路不稳定连接的单芯片进行低功耗处理。
[0051]可选地,所述系统还包括:
[0052]第二检查模块,被配置为在检查所述一级单芯片的数据链路之前,检本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种多芯片模块故障识别处理方法,其特征在于,包括:启动MCM多芯片,所述MCM多芯片包括至少一个单芯片;通过检查所述MCM多芯片中控制链路的连通性,从所述至少一个单芯片中筛选出控制链路稳定连接的一级单芯片;对所述一级单芯片的控制链路和数据链路进行重新规划和配置;检查所述一级单芯片的数据链路;将数据链路稳定连接的一级单芯片作为二级单芯片,并通过所述二级单芯片实现所述MCM多芯片的功能。2.根据权利要求1所述的多芯片模块故障识别处理方法,其特征在于,在所述对所述一级单芯片的控制链路和数据链路进行重新规划和配置之前,所述方法还包括:重复执行所述通过检查所述MCM多芯片中控制链路的连通性,从所述至少一个单芯片中筛选出控制链路稳定连接的一级单芯片的步骤,并记录每次筛选出的一级单芯片的数量;选取筛选数量最少的那次所筛选出的一级单芯片作为一级优良单芯片;所述对所述一级单芯片的控制链路和数据链路进行重新规划和配置包括:对所述一级优良单芯片的控制链路和数据链路进行重新规划和配置;所述检查所述一级单芯片的数据链路的步骤包括:检查所述一级优良单芯片的数据链路;所述将数据链路稳定连接的一级单芯片作为二级单芯片,并通过所述二级单芯片实现所述MCM多芯片的功能包括:将数据链路稳定连接的一级优良单芯片作为二级单芯片,并通过所述二级单芯片实现所述MCM多芯片的功能。3.根据权利要求1所述的多芯片模块故障识别处理方法,其特征在于,所述方法还包括:对所述至少一个单芯片中控制链路不稳定连接的单芯片进行屏蔽操作。4.根据权利要求1所述的多芯片模块故障识别处理方法,其特征在于,所述方法还包括:对所述至少一个单芯片中控制链路不稳定连接的单芯片进行低功耗处理。5.根据权利要求2所述的多芯片模块故障识别处理方法,其特征在于,在所述检查所述一级单芯片的数据链路之前,所述方法还包括:检查所述一级优良单芯片的控制链路,若存在至少一个一级优良单芯片的控制链路不稳定,则结束所述多芯片模块故障识别处理方法。6.一种多芯片模块故障识别处理系统,其特征在于,包括:...

【专利技术属性】
技术研发人员:黄炜钟雨阳
申请(专利权)人:海光信息技术股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1