一种确定多核处理器中故障计算核的方法及电子设备技术

技术编号:27741183 阅读:20 留言:0更新日期:2021-03-19 13:34
本申请涉及电子设备故障器件检测技术,具体涉及一种确定多核处理器中故障计算核的方法及电子设备。该方法应用于配置有多核处理器的电子设备,所述多核处理器集成有多个计算核,所述多个计算核中的各计算核之间相互独立,所述多个计算核包括第一计算核;其中,在所述电子设备运行时,所述多个计算核中的至少一个计算核执行程序指令,所述程序指令是基于动态调度策略分配的;所述方法包括:确定N次运行异常中各运行异常对应的计算核,所述运行异常由在所述多个计算核中的任意计算核执行程序指令时出现的异常所导致;当所述N次运行异常中对应于所述第一计算核的运行异常的次数≥M时,确定所述第一计算核为故障计算核,M为预设值。

【技术实现步骤摘要】
一种确定多核处理器中故障计算核的方法及电子设备
本申请涉及电子设备故障器件检测技术,具体涉及一种确定多核处理器中故障计算核的方法及电子设备。
技术介绍
根据统计,发生自动重启等运行异常的概率约为300/百万。若一年的出货量为2亿台的话,则发生自动重启等运行异常的手机约为6万部。目前,手机已普遍采用集成了8个计算核(core)的处理器。尽管处理器是多核的,但该多核中任何一个核发生了可靠性故障,都会导致手机自动重启等运行异常。随着手机片上系统(systemonchip,SOC)制程工艺不断演进,一枚处理器中集成的计算核核越来越多,相应地,对于手机而言,其发生计算核的可靠性故障的机率也越来越高。这必将严重影响用户体验,提高返修率和退机率。手机的双倍数据率同步动态随机存取存储器(doubledataratesynchronousdynamicrandomaccessmemory,DDRSDRAM)以及通用闪存存储(universalflashstorage,UFS)等器件发生故障时,往往也表现为自动重启等运行异常。这导致检测计算核故障的难度较大。目前,手机的维修网点尚无法检测计算核核故障,需要返厂进行检查。而返厂检测需要专门工具协助并反复压测做实验,并由专业人员人工分析才能定位自动重启等运行异常的原因。
技术实现思路
本申请实施例提供了一种确定故障计算核方法及电子设备,可以自动、快速确定出具体故障计算核。第一方面,本申请实施例提供了一种确定多核处理器中故障计算核的方法,应用于配置有多核处理器的电子设备,所述多核处理器集成有多个计算核,所述多个计算核中的各计算核之间相互独立,所述多个计算核包括第一计算核;其中,在所述电子设备运行时,所述多个计算核中的至少一个计算核执行程序指令,所述程序指令是基于动态调度策略分配的;所述方法包括:确定N次运行异常中各运行异常对应的计算核,所述运行异常由在所述多个计算核中的任意计算核执行程序指令时出现的异常所导致;当所述N次运行异常中对应于所述第一计算核的运行异常的次数≥M时,确定所述第一计算核为故障计算核,M为预设值。结合第一方面,在第一方面第一种可能的实现方式中,所述多核处理器为中央处理器或图形处理器。在该实现方式中,可以确定故障CPU核,也可以确定故障GPU核。结合第一方面,在第一方面第二种可能的实现方式中,所述动态调度策略为完全公平调度策略。在该实现方式中,电子设备基于完全公平调度策略调度多核处理器中的计算核,可提高确定故障计算核的准确率。结合第一方面,在第一方面第三种可能的实现方式中,所述对应于所述第一计算核的运行异常为连续发生的对应于所述第一计算核的运行异常。在该实现方式中,通过判断某一计算核是否对应了连续发生的多次运行异常,来确定该计算核是否为故障核,可提高确定故障计算核的准确率。结合第一方面,在第一方面第四种可能的实现方式中,所述对应于所述第一计算核的运行异常的次数等于N。在该实现方式中,通过判断该电子设备已发生的多次运行异常是否对应于某一计算核,而确定该计算核为故障计算核,可提高故障计算核的准确率。结合第一方面,在第一方面第五种可能的实现方式中,所述对应于所述第一计算核的运行异常为发生在预设期间内的对应于所述第一计算核的运行异常。在该实现方式中,可以通过发生在预设期间内的运行异常来确定故障计算核,从而可以避免发生时间比较久远的运行异常对结果的影响。结合第一方面,在第一方面第六种可能的实现方式中,所述方法还包括:屏蔽所述第一计算核。在该实现方式中,在确定出故障计算核后,可以屏蔽该故障计算核,从而可避免在该故障计算核上运行程序指令而导致的异常运行,提高了用户体验。结合第一方面,在第一方面第七种可能的实现方式中,所述运行异常为电子设备的异常重启。在该实现方式中,通过异常重启这一故障计算核触发的运行异常中常见运行异常来确定故障计算核,可提高确定效率。结合第一方面,在第一方面第八种可能的实现方式中,所述电子设备包括第一文件和第二文件;其中,所述第一文件记录有所述N次运行异常中各运行异常的发生时间和产生原因;所述第二文件记录有计算核的标识和运行异常的发生时间;所述确定N次运行异常中各运行异常对应的计算核包括:根据第一文件记录的运行异常的产生原因,从第一文件中确定所述N次运行异常;根据第一文件中记录的运行异常的发生时间和所述第二文件记录的运行异常的发生时间,从所述第二文件中确定所述N次运行异常中各运行异常对应的计算核。在该实现方式中,通过第一文件记录运行异常的相关信息,通过第二文件记录运行异常对应的计算核信息,可通过运行异常的发生时间将运行异常和计算核信息关联,提高了确定故障计算核的效率。结合第一方面,在第一方面第九种可能的实现方式中,所述故障计算核的信息记录在第三文件中,所述第三文件可被调用和/或发送给其他电子设备。在该实现方式中,故障计算核的信息可以被记录的文件中,方便调用和发送给其他设备。第二方面,本申请实施例提高了一种确定多核处理器中故障计算核的方法,应用于第一电子设备;所述方法包括:获取第二电子设备的日志文件;其中,所述第二电子设备配置有多核处理器的电子设备,所述多核处理器集成有多个计算核,所述多个计算核中的各计算核之间相互独立,所述多个计算核包括第一计算核;其中,在所述电子设备运行时,所述多个计算核中的至少一个计算核执行程序指令,所述程序指令是基于动态调度策略分配的;所述日志文件记录有所述第二电子设备的N次运行异常,所述运行异常由在所述多个计算核中的任意计算核执行程序指令时出现的异常所导致;确定所述N次运行异常中各运行异常对应的计算核;当所述N次运行异常中对应于所述第一计算核的运行异常的次数≥M时,确定所述第一计算核为故障计算核,M为预设值。在该方案中,电子设备可以获取其他电子设备的日志文件,并根据日志文件中记录的运行异常,确定该其他电子设备的故障计算核。结合第二方面,在第二方面第一种可能的实现方式中,所述多核处理器为中央处理器或图形处理器。结合第二方面,在第二方面第二种可能的实现方式中,所述动态调度策略为完全公平调度策略。结合第二方面,在第二方面第三种可能的实现方式中,所述对应于所述第一计算核的运行异常为连续发生的对应于所述第一计算核的运行异常。结合第二方面,在第二方面第四种可能的实现方式中,所述对应于所述第一计算核的运行异常的次数等于N。结合第二方面,在第二方面第五种可能的实现方式中,所述对应于所述第一计算核的运行异常为发生在预设期间内的对应于所述第一计算核的运行异常。结合第二方面,在第二方面第六种可能的实现方式中,所述方法还包括:向所述第二电子设备发送所述第一计算核的标识信息,以使所述第二电子设备屏蔽所述第一计算核。结合第二方面,在第二方面第七种可能的实现方式中,所述运行异常为所述第二电子设备的异常重启。结合第二方面,在第二方面第八种可能的实现本文档来自技高网...

【技术保护点】
1.一种确定多核处理器中故障计算核的方法,其特征在于,应用于配置有多核处理器的电子设备,所述多核处理器集成有多个计算核,所述多个计算核中的各计算核之间相互独立,所述多个计算核包括第一计算核;其中,在所述电子设备运行时,所述多个计算核中的至少一个计算核执行程序指令,所述程序指令是基于动态调度策略分配的;所述方法包括:/n确定N次运行异常中各运行异常对应的计算核,所述运行异常由在所述多个计算核中的任意计算核执行程序指令时出现的异常所导致;/n当所述N次运行异常中对应于所述第一计算核的运行异常的次数≥M时,确定所述第一计算核为故障计算核,M为预设值。/n

【技术特征摘要】
1.一种确定多核处理器中故障计算核的方法,其特征在于,应用于配置有多核处理器的电子设备,所述多核处理器集成有多个计算核,所述多个计算核中的各计算核之间相互独立,所述多个计算核包括第一计算核;其中,在所述电子设备运行时,所述多个计算核中的至少一个计算核执行程序指令,所述程序指令是基于动态调度策略分配的;所述方法包括:
确定N次运行异常中各运行异常对应的计算核,所述运行异常由在所述多个计算核中的任意计算核执行程序指令时出现的异常所导致;
当所述N次运行异常中对应于所述第一计算核的运行异常的次数≥M时,确定所述第一计算核为故障计算核,M为预设值。


2.根据权利要求1所述的方法,其特征在于,所述多核处理器为中央处理器或图形处理器。


3.根据权利要求1所述的方法,其特征在于,所述动态调度策略为完全公平调度策略。


4.根据权利要求1所述的方法,其特征在于,所述对应于所述第一计算核的运行异常为连续发生的对应于所述第一计算核的运行异常。


5.根据权利要求1所述的方法,其特征在于,所述对应于所述第一计算核的运行异常的次数等于N。


6.根据权利要求1所述的方法,其特征在于,所述对应于所述第一计算核的运行异常为发生在预设期间内的对应于所述第一计算核的运行异常。


7.根据权利要求1所述的方法,其特征在于,所述方法还包括:屏蔽所述第一计算核。


8.根据权利要求1所述的方法,其特征在于,所述运行异常为电子设备的异常重启。


9.根据权利要求1所述的方法,其特征在于,所述电子设备包括第一文件和第二文件;其中,所述第一文件记录有所述N次运行异常中各运行异常的发生时间和产生原因;所述第二文件记录有计算核的标识和运行异常的发生时间;
所述确定N次运行异常中各运行异常对应的计算核包括:
根据第一文件记录的运行异常的产生原因,从第一文件中确定所述N次运行异常;
根据第一文件中记录的运行异常的发生时间和所述第二文件记录的运行异常的发生时间,从所述第二文件中确定所述N次运行异常中各运行异常对应的计算核。


10.根据权利要求1所述的方法,其特征在于,所述故障计算核的信息记录在第三文件中,所述第三文件可被调用和/或发送给其他电子设备。


11.一种确定多核处理器中故障计算核的方法,其特征在于,应用于第一电子设备;所述方法包括:
获取第二电子设备的日志文件;其中,所述第二电子设备配置有多核处理器的电子设备,所述多核处理器集成有多个计算核,所述多个计算核中的各计算核之间相互独立,所述多个计算核包括第一计算核;其中,在所述第二电子设备运行时,所述多个计算核中的至少一个计算核执行程序指令,所述程序指令是基于动态调度策略分配的;所述日志文件记录有所述第二电子设备的N次运行异常,所述运行异常由在所述多个计算核中的任意计算核执行程序指令时出现的异常所导致;
确定所述N次运行异常中各运行异常对应的计算核;
当所述N次运行异常中对应于所述第一计算核的运行异常的次数≥M时,确定所述第一计算核为故障计算核,M为预设值。


12.根据权利要求11所述的方法,其特征在于,所述多核处理器为中央处理器或图形处理器。


13.根据权利要求11所述的方法,其特征在于,所述动态调度策略为完全公平调度策略。


14.根据权利要求11所述的方法,其特征在于,所述对应于所述第一计算核的运行异常为连续发生的对应于所述第一计算核的运行异常。


15.根据权利要求11所述的方法,其特征在于,所述对应于所述第一计算核的运行异常的次数等于N。


16.根据权利要求11所述的方法,其特征在于,所述对应于所述第一计算核的运行异常为发生在预设期间内的对应于所述第一计...

【专利技术属性】
技术研发人员:张志斌张晓波
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1