用于错误报告和处理的系统和方法技术方案

技术编号:37226480 阅读:23 留言:0更新日期:2023-04-20 23:10
提供了一种用于错误报告和处理的系统和方法。该系统包括存储错误处理器的存储器、被配置为执行错误处理器的处理器以及缓冲器。错误处理器被配置为从片上系统(SOC)平台接收错误消息。错误消息指示SOC平台中已经发生了多个错误,并且缓冲器存储错误消息。此外,错误处理器被配置为使用单个中断来报告错误消息。此外,错误处理器被配置为使用单个中断来处理错误消息中的错误。误消息中的错误。误消息中的错误。

【技术实现步骤摘要】
用于错误报告和处理的系统和方法
[0001]相关申请的交叉引用
[0002]该专利申请要求于2021年8月4日在印度专利局提交的印度临时申请No.202141035134的优先权,其公开内容通过引用整体结合到本文中。


[0003]本文公开的实施例涉及一种错误处理方法和系统,尤其涉及一种用于错误报告和处理的方法和系统。

技术介绍

[0004]片上系统(SOC)是集成了计算机或其它电子系统的所有或大部数据包件的集成电路。这些组件通常包括中央处理单元(CPU)、存储器装置、存储器接口、片上输入/输出(I/O)装置和I/0接口。
[0005]由于诸如设计错误、定时问题和存储器错误的各种原因,在包括SOC的系统中可能发生致命错误。当致命错误发生时,系统立即停机。致命错误的可靠检测对于在系统中部署的要求非常高可靠性的存储器装置(例如,固态驱动器(SSD)等)是非常重要的。在复杂SOC中,可能存在数百个需要检测和报告的这种错误。一种检测致命错误的方法使用中断和相关上下文,其指定了关于错误的更多细节。然而,对于固件单元和硬件架构两者来说,针对每个错误维持一个中断位并针对每个错误提供附加状态寄存器是艰巨的任务。这增加了管理中断服务例程(ISR)以对每个错误进行解码的逻辑、设计复杂性以及固件代码。
[0006]图1示出了用于处理致命错误的现有方案。在现有方案中,一个中断位专用于每个错误,并且针对每个错误维护错误上下文。然而,该方案需要数百个中断位和数千个错误上下文寄存器。因此,固件单元将变得极其复杂以处理如此多的中断。

技术实现思路

[0007]本公开的示例实施例提供了一种用于错误报告和处理的系统。该系统包括存储错误处理器的存储器、被配置为执行错误处理器的处理器和缓冲器。错误处理器被配置用于从片上系统(SOC)平台接收错误消息。错误消息指示SOC平台中已经发生了多个错误,并且缓冲器存储错误消息。错误处理器被配置为使用单个中断来报告错误消息。此外,错误处理器被配置为使用单个中断来处理错误消息中的错误。
[0008]本公开的示例实施例提供了一种用于错误报告和处理的方法。该方法包括:由系统从SOC平台接收错误消息,其中该错误消息指示SOC平台中已经发生多个错误,并且该系统包括用于存储错误消息的缓冲器。该方法还包括:由系统使用单个中断报告错误消息,以及由系统使用单个中断处理错误消息中的多个错误。
[0009]在实施例中,该处理包括:检测在SoC平台中已经发生错误,引发与错误对应的中断,使用固件单元基于中断来处理错误消息,基于处理的错误消息来执行至少一个动作,清除中断,以及执行i)发送针对处理的错误消息的确认消息和ii)等待另一中断以进行处理
中的至少一者。
[0010]在实施例中,使用固件单元处理错误消息包括:确定错误消息包括两个错误,确定两个错误中的优先级,以及基于优先级处理两个错误中的一个。
[0011]在实施例中,错误处理器以一次一个的方式顺序地处理两个错误中的每一个。
[0012]在实施例中,该系统包括至少一个设计块,用于保持错误处理器的设计状态,直到所有错误都被固件单元处理。
[0013]在实施例中,错误消息包括设计块标识符(ID)、每个错误的操作码和每个错误的上下文信息中的至少一个。
[0014]在实施例中,错误中的一个是致命错误,其中该致命错误包括静态随机存取存储器(SRAM)读取错误、SRAM写入错误、高级可扩展接口(AXI)总线访问错误、AXI总线奇偶校验错误、计数器下溢错误、计数器上溢错误、先进先出(FIFO)上溢、FIFO下溢、数据包字段损坏错误、访问未初始化位置和不支持的配置中的至少一个。
[0015]根据本公开的示例实施例,一种用于错误处理的系统包括存储错误处理器的存储器、被配置为执行错误处理器的处理器以及缓冲器。错误处理器被配置为从片上系统的多个硬件块中的每一个接收多个错误请求,其中每个错误请求指示由于对应的硬件块而在SoC中已经发生错误,并且缓冲器存储包括关于错误的信息的错误消息。错误处理器使用单个中断来处理错误消息的错误。
[0016]在实施例中,每个错误请求包括标识对应硬件块的标识符和标识对应错误的类型的操作码。在实施例中,在处理与硬件块之一相关联的错误请求之后,错误处理器向该一个硬件块发送确认消息。确认消息可以包括标识符和操作码。在实施例中,每个错误请求还包括解释相应错误的上下文信息。
附图说明
[0017]在附图中示出了本文所公开的实施例,在所有附图中,相同的附图标记表示各个附图中的对应部分。参考附图,从以下描述中将更好地理解本文中的实施例,在附图中:
[0018]图1示出了用于处理致命错误的现有方案;
[0019]图2示出了根据本公开的示例实施例的用于错误报告和处理的系统的各种硬件组件;
[0020]图3是示出根据本公开的示例实施例的用于错误报告和处理的方法的流程图;
[0021]图4示出了根据本公开的示例实施例的用于处理致命错误的方案;以及
[0022]图5示出了根据本公开的示例实施例的示出处理致命错误的序列图。
具体实施方式
[0023]本公开的至少一个实施例提供了用于错误报告和处理的方法和系统。
[0024]本公开的至少一个实施例能够使用单个中断和单个窗口来报告SOC系统或平台中的所有致命错误事件,以报告错误的上下文。例如,在第一时间段期间发生的所有致命错误事件可以在发生于第一时间段之后的第二时间段期间使用单个中断一起报告。这可节省许多中断位(例如,多达800个中断位)和存储错误上下文信息的若干特殊功能寄存器(SFR)(例如,2000个或更多个SFR)。
[0025]参考在附图中示出并在以下描述中详细描述的非限制性实施例,更全面地解释本文的实施例及其各种特征和细节。本文所使用的示例仅旨在促进对可以实践本文的实施例的方式的理解,并且进一步使得本领域技术人员能够实践本文的实施例。因此,这些示例不应被解释为限制本文的实施例的范围。
[0026]本文描述的至少一个实施例实现了一种用于错误报告和处理的系统。该系统可以包括错误处理器(error handler)、存储器和缓冲器。错误处理器被配置为从SOC或包括SOC的系统(例如,SOC平台)接收错误消息。错误消息指示SOC平台中已经发生一个或多个错误,并且缓冲器存储错误消息。此外,错误处理器被配置为使用单个中断和单个窗口来报告错误消息,以报告错误消息的上下文。此外,错误处理器被配置为使用单个中断来处理错误消息中的多个错误。
[0027]所提出的方法可以利用单个中断来报告错误的上下文,从而可以一起报告SOC平台中的所有致命错误事件,以便节省更多的中断位(例如,多达800个中断位)和更多的存储错误上下文的功能寄存器(例如,2000个或更多个特殊功能寄存器)。错误的上下文可以提供关于每个错误的信息。
[0028]基于所提出的方法,节省了用于存储与错误相关的附加上本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于错误报告和处理的系统,包括:存储器,其存储错误处理器;处理器,其被配置为执行所述错误处理器;以及缓冲器,其中,所述错误处理器被配置为:从片上系统平台接收错误消息,其中,所述错误消息指示所述片上系统平台中已经发生了多个错误,并且所述缓冲器存储所述错误消息;使用单个中断报告所述错误消息;以及使用所述单个中断来处理所述错误消息中的所述多个错误。2.根据权利要求1所述的系统,其中对所述多个错误的处理包括:检测在所述片上系统平台中已经发生了所述多个错误;引发与所述多个错误相对应的中断;使用固件单元基于所述中断来处理所述错误消息;基于经处理的所述错误消息执行至少一个动作;清除所述中断;以及执行i)发送针对所述经处理的错误消息的确认消息,和ii)等待另一中断以处理中的至少一者。3.根据权利要求2所述的系统,其中,使用所述固件单元处理所述错误消息包括:确定所述错误消息包括两个错误;确定所述两个错误中的优先级;以及基于所述优先级来处理所述错误消息。4.根据权利要求2所述的系统,其中,所述错误处理器以一次一个的方式顺序地处理所述两个错误中的每一个。5.根据权利要求2所述的系统,其中,所述系统包括至少一个设计块,以保持所述错误处理器的设计状态,直到所有错误被所述固件单元处理。6.根据权利要求1所述的系统,其中,所述错误消息包括设计块标识符、针对所述多个错误中的每一个的操作码以及针对所述多个错误中的每一个的上下文信息中的至少一个。7.根据权利要求1所述的系统,其中所述多个错误之一是致命错误,其中,所述致命错误包括静态随机存取存储器读取错误、静态随机存取存储器写入错误、高级可扩展接口总线访问错误、高级可扩展接口总线奇偶校验错误、计数器下溢错误、计数器上溢错误、先进先出上溢、先进先出下溢、数据包字段损坏错误、访问未初始化位置和不支持的配置中的至少一个。8.一种用于错误报告和处理的方法,包括:由系统从片上系统平台接收错误消息,其中,所述错误消息指示在所述片上系统平台中已经发生了多个错误,并且所述系统包括用于存储所述错误消息的缓冲器;由所述系统使用单个中断来报告所述错误消息;以及由所述系统使用所述单个中断来处理所述错误消息中的所述多个错误。9.根据权利要求8所述的方法,其中,所述处理包括:
检测所述片上系统平台中已经发生了所述多个错误;引发与所述多个错误相对应的中断;使用固件单元基于所述中断来处理所述错误消息;基于经处理的所述错误消息执行至少一个动作;清除中断...

【专利技术属性】
技术研发人员:基兰
申请(专利权)人:三星电子株式会社
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1