一种PCIe错误的处理方法及装置、PCIe系统制造方法及图纸

技术编号:38558573 阅读:16 留言:0更新日期:2023-08-22 21:00
本发明专利技术提供了一种PCIe错误的处理方法及装置、PCIe系统,该PCIe错误的处理方法在监测并收集到PCIe重传计时器超时错误,并针对出现重传计时器超时错误的目标数据发送端和目标数据接收端,在不中止目标数据的传输链路的情况下,调减目标数据接收端向目标数据发送端的响应时间,和/或,调增触发目标数据发送端重传的容忍时间,实时监测PCIe链路中的重传计时器超时错误,并利用上述处理方法进行动态处理。相比于现有的解决方法,本申请能够在不移除原有目标数据的传输链路、不暂停相关模块工作、不影响原本PCIe链路的目标数据传输的情况下,解决PCIe链路传输中的重传计时器超时错误,避免因为该错误造成系统宕机问题。免因为该错误造成系统宕机问题。免因为该错误造成系统宕机问题。

【技术实现步骤摘要】
一种PCIe错误的处理方法及装置、PCIe系统


[0001]本专利技术涉及计算机
,尤其涉及一种PCIe错误的处理方法及装置、PCIe系统。

技术介绍

[0002]PCIe(Peripheral Component Interconnect Express,是一种高速串行计算机扩展总线标准,简称PCIe)是一种利用差分信号对进行点对点高速传输的一种数据传输方式,由于其具有高可靠性、高性能、高带宽和高可扩展性等优点,被广泛应用于各种服务器和计算机的数据传输中。Replay Timer Timeout错误(重传计时器超时错误)是PCIe传输中的发生的常见错误,当系统处于正常数据传输的过程中不会产生错误,如果一端发起连续的读写请求,对端如果一直不回复响应来应答,则发送端会发起重传操作,当重传次数达到一定次数后,请求端则会发生Replay Timer Timeout错误。如果该错误不及时解决,大量报错会造成系统宕机,给PCIe数据传输造成极大影响。
[0003]针对PCIe链路传输过程中出现的错误和故障,现有的专利技术主要集中于监测,统计错误后警告、直接暂停相关模块的工作、断开链路、重新初始化相关链路一类的方式解决问题,这些方式在处理错误期间PCIe不能正常工作,链路恢复后还会发生这种类型的错误,这些方法没有从根本上解决报错问题,只是将报错现场做了一次恢复,这样会极大地影响PCIe的传输速度和传输效率。

技术实现思路

[0004]本专利技术提供了一种PCIe错误的处理方法及装置、PCIe系统,便于在不移除原有目标数据的传输链路、不暂停相关模块工作、不影响原本PCIe链路的目标数据传输的情况下,解决PCIe链路传输中的重传计时器超时错误的发生。
[0005]第一方面,本专利技术提供了一种PCIe错误的处理方法,该PCIe错误的处理方法包括:监测并收集PCIe错误;从PCIe错误中筛选出重传计时器超时错误;获取发生重传计时器超时错误的目标数据发送端和目标数据接收端;在不中止目标数据的传输链路的情况下,调减目标数据接收端向目标数据发送端回复响应的时间,和/或,调增触发目标数据发送端重传的容忍时间。
[0006]在上述的方案中,在监测并收集到PCIe错误之后,还从PCIe错误中筛选出重传计时器超时错误,并针对出现重传计时器超时错误的目标数据发送端和目标数据接收端,在不中止目标数据的传输链路的情况下,调减目标数据接收端向目标数据发送端回复响应的时间,和/或,调增触发目标数据发送端重传的容忍时间,实时监测PCIe链路中的重传计时器超时错误,并利用上述处理方法进行动态处理。相比于现有的解决方法,本申请能够在不移除原有目标数据的传输链路、不暂停相关模块工作、不影响原本PCIe链路的目标数据传输的情况下,解决PCIe链路传输中的重传计时器超时错误,避免因重传计时器超时错误频繁发生导致用户无法正常使用,避免因为该错误造成系统宕机问题。由于本申请中,在整个
PCIe错误监测以及对重传计时器超时错误进行动态处理的过程中,PCIe传输链路可以正常地传输数据,能够最大程度降低对PCIe链路正常工作的影响。且本申请的PCIe错误的处理方法只对监测到的重传计时器超时错误进行处理,更有针对性。
[0007]在一个具体的实施方式中,该PCIe错误的处理方法还包括:在调减目标数据接收端向目标数据发送端回复响应的时间,和/或,调增触发目标数据发送端重传的容忍时间之后,检测重传计时器超时错误是否消除;如果检测结果为重传计时器超时错误未消除,则继续调减目标数据接收端向目标数据发送端回复响应的时间,和/或,调增触发目标数据发送端重传的容忍时间,直到重传计时器超时错误消除。通过在调整目标数据发送端回复响应的时间、或/和目标数据发送端重传的容忍时间之后,增加检测步骤,监测重传计时器超时错误是否消除。
[0008]在一个具体的实施方式中,如果检测结果为重传计时器超时错误消除,则清除在收集PCIe错误过程中记录的重传计时器超时错误,使错误信息监测模块继续检测。
[0009]在一个具体的实施方式中,目标数据接收端向目标数据发送端回复响应的时间调整范围包含有至少两个时间档位;每次调减目标数据接收端向目标数据发送端响应的时间时,至少调减一个时间档位,便于快速的调减目标数据接收端向目标数据发送端回复响应的时间,直到调节到不再检测出该错误为止。
[0010]在一个具体的实施方式中,触发目标数据发送端重传的容忍时间的调整范围包括第一调整范围和第二调整范围,其中,第二调整范围大于第一调整范围。调增触发目标数据发送端重传的容忍时间包括:先在第一调整范围内,调增触发目标数据发送端重传的容忍时间;在第一调整范围内调增触发目标数据发送端重传的容忍时间之后,仍然不能消除重传计时器超时错误时,在第二调整范围内调增触发目标数据发送端重传的容忍时间。先从调整范围较小的第一调整范围开始调,只有在第一调整范围调整后仍不能消除重传计时器超时错误时,才在第二调整范围内调增触发目标数据发送端重传的容忍时间,简化调整难度。
[0011]在一个具体的实施方式中,第一调整范围和第二调整范围的每个调整范围内均包含有至少两档容忍时间;每次在第一调整范围或第二调整范围内,调增触发目标数据发送端重传的容忍时间时,至少调增一档容忍时间,便于快速的调增目标数据发送端重传的容忍时间。
[0012]在一个具体的实施方式中,目标数据发送端和目标数据接收端分别为:根复合体、交换机、桥端或通讯设备端中,通过PCIe总线协议接口相连接的上游端口和下游端口;其中,在目标数据发送端为上游端口时,目标数据接收端为下游端口;在目标数据发送端为下游端口时,目标数据接收端为上游端口。使该PCIe错误的处理方法能够应用到PCIe系统中的各个通过PCIe总线协议接口相连接的上游端口和下游端口上。
[0013]在一个具体的实施方式中,在不中止目标数据的传输链路的情况下,调减目标数据接收端向目标数据发送端响应的时间,和/或,调增触发目标数据发送端重传的容忍时间,包括:获取目标数据发送端与目标数据接收端之间PCIe总线协议接口的速度、宽度和最大载荷;根据目标数据发送端与目标数据接收端之间PCIe总线协议接口的速度、宽度和最大载荷,确定目标数据发送端与目标数据接收端之间PCIe总线协议接口的最大响应延迟时间;根据最大响应延迟时间,在不中止目标数据的传输链路的情况下,调减目标数据接收端
向目标数据发送端回复响应的时间,和/或,调增触发目标数据发送端重传的容忍时间。便于快速且准确的调整目标数据接收端向目标数据发送端回复响应的时间,和/或,调增触发目标数据发送端重传的容忍时间,从而在较少的调整次数之后,即可消除重传计时器超时错误。
[0014]第二方面,本专利技术还提供了一种PCIe错误的处理装置,该PCIe错误的处理装置包括:错误信息监控模块、筛选模块、采集模块和动态调整模块。其中,错误信息监控模块用于监测并收集PCIe错误。筛选模块用于从PCIe错误信息中筛选出重传计时器超时错误。采集模块用于获取发本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种PCIe错误的处理方法,其特征在于,包括:监测并收集PCIe错误;从所述PCIe错误中筛选出重传计时器超时错误;获取发生所述重传计时器超时错误的目标数据发送端和目标数据接收端;在不中止所述目标数据的传输链路的情况下,调减目标数据接收端向所述目标数据发送端回复响应的时间,和/或,调增触发所述目标数据发送端重传的容忍时间。2.如权利要求1所述的处理方法,其特征在于,还包括:在调减所述目标数据接收端向所述目标数据发送端回复响应的时间,和/或,调增触发所述目标数据发送端重传的容忍时间之后,检测所述重传计时器超时错误是否消除;如果检测结果为所述重传计时器超时错误未消除,则继续调减所述目标数据接收端向所述目标数据发送端回复响应的时间,和/或,调增触发所述目标数据发送端重传的容忍时间,直到所述重传计时器超时错误消除。3.如权利要求2所述的处理方法,其特征在于,如果检测结果为所述重传计时器超时错误消除,则删除在收集PCIe错误过程中记录的的所述重传计时器超时错误。4.如权利要求1所述的处理方法,其特征在于,所述目标数据接收端向所述目标数据发送端回复响应的时间调整范围包含有N个时间档位;每次调减所述目标数据接收端向所述目标数据发送端回复响应的时间时,至少调减一个时间档位。5.如权利要求1所述的处理方法,其特征在于,触发所述目标数据发送端重传的容忍时间的调整范围包括第一调整范围和第二调整范围,其中,所述第二调整范围大于所述第一调整范围;所述调增触发所述目标数据发送端重传的容忍时间包括:先在所述第一调整范围内,调增触发所述目标数据发送端重传的容忍时间;在所述第一调整范围内调增触发所述目标数据发送端重传的容忍时间之后,仍然不能消除所述重传计时器超时错误时,在所述第二调整范围内调增触发所述目标数据发送端重传的容忍时间。6.如权利要求5所述的处理方法,其特征在于,所述第一调整范围和第二调整范围的每个调整范围内均包含有至少两档...

【专利技术属性】
技术研发人员:陈君张罗聂延举冯颖卢雪琴杨孟瑜
申请(专利权)人:成都海光集成电路设计有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1