基于Retimer的通用计算模块与异构计算模块的适配装置及方法制造方法及图纸

技术编号:22387285 阅读:15 留言:0更新日期:2019-10-29 06:29
本发明专利技术实施例公开了基于Retimer的通用计算模块与异构计算模块的适配装置及方法,包括互联的通用计算模块和异构计算模块,所述通用计算模块包括与通用计算节点连接的Retimer,所述Retimer通过选通单元连接若干配置文件存储单元,所述通用计算模块还包括第一控制单元,所述第一控制单元用于识别异构计算模块的异构拓扑,并根据所述异构拓扑控制所述选通单元选择与Retimer连接的配置文件存储单元。本发明专利技术为Retimer同时设置多个配置文件,通过第一控制单元识别当前异构计算模块的异构拓扑,选通与当前拓扑相适应的Retimer配置文件,在不需要拆卸机箱的情况下,实现通用计算模块与异构计算模块的快速适配。

Retimer based adaptive device and method for general computing module and heterogeneous computing module

【技术实现步骤摘要】
基于Retimer的通用计算模块与异构计算模块的适配装置及方法
本专利技术涉及异构计算
,具体地说是基于Retimer的通用计算模块与异构计算模块的适配装置及方法。
技术介绍
随着AI(ArtificialIntelligence,人工智能)、HPC(HighPerformanceComputing),高性能计算)、大数据等应用领域的飞速发展,对于计算性能的要求也越来越高,传统的CPU(CentralProcessingUnit,中央处理器)服务器难以满足新业务的性能需求,采用CPU、GPU(GraphicsProcessingUnit,图形处理器)、FPGA(Field-ProgrammableGateArray,即现场可编程门阵列)、ASIC(ApplicationSpecificIntegratedCircuit,特殊应用集成电路)等处理器组合而成的异构计算模式来进行数据训练或推理,逐渐成为主流。通用计算模块与异构计算模块采用PCIe总线互联,PCIe总线作为当今计算机体系结构的I/O局部总线标准,使用高速串行传送方式,能够支持更高传输速率和带宽要求的外部设备。随着信号传输速率的提高,由于PCB(PrintedCircuitBoard,印制电路板)、封装与介质损耗导致的信号衰减会对信号传输产生严重影响,而传输链路上的过孔、连接器、线缆与封装的不连续也会导致信号的衰减,而对于长距离走线,这种衰减会进一步恶化。Retimer(时间修正卡)把输入的模拟比特流转化为纯粹的数字信号存储在芯片内部,然后再重新发出信号,可以极大改善信号质量。在异构计算服务器架构中,Retimer作为通用计算模块与异构计算模块之间互联的桥梁,在PCIe信号的稳定传输中起着重要的作用。在实际应用中,不同业务场景对于异构计算的拓扑要求也不一样,因此以CPU为核心的一种通用计算模块可能与以GPU为核心的多种异构计算模块形成组合。由于不同异构计算模块之间在元器件的布局、高速信号走线长度、PCB材料间存在差异,因此当带有Retimer的通用计算模块搭配不同异构计算模块时,Retimer的配置文件也不一样。如图1所示,通用计算节点CPU与异构计算节点上的Device经过Retimer互联,Retimer通过I2C读取EEPROM(ElectricallyErasableProgrammablereadonlymemory,带电可擦可编程只读存储器)中配置文件来对自身寄存器进行配置,从而使PCIe信号传输质量达到最优。当因业务需求改变需更换异构计算节点时,为了使PCIe信号传输质量达到最优,通常需要对EEPROM中Retimer配置文件重新烧录。烧录时需要打开机箱盖甚至拆解机器,导致终端用户费时费力。
技术实现思路
本专利技术实施例中提供了基于Retimer的通用计算模块与异构计算模块的适配装置及方法,以解决改变异构计算节点时,重新烧录Retimer配置文件费时费力的问题。为了解决上述技术问题,本专利技术实施例公开了如下技术方案:本专利技术第一方面提供了一种基于Retimer的通用计算模块与异构计算模块的适配装置,包括互联的通用计算模块和异构计算模块,所述通用计算模块包括与通用计算节点连接的Retimer,所述Retimer通过选通单元连接若干配置文件存储单元,所述通用计算模块还包括第一控制单元,所述第一控制单元用于识别异构计算模块的异构拓扑,并根据所述异构拓扑控制所述选通单元选择与Retimer连接的配置文件存储单元。进一步地,所述异构计算模块包括标识单元,所述标识单元用于标识当前异构计算模块的异构拓扑。进一步地,所述标识单元包括若干接线端,每个接线端的连接方式为接地或悬空,所述第一控制单元包括CPLD,所述CPLD连接所述接线端。进一步地,所述异构计算模块还包括第二控制单元,所述第二控制单元连接所述第一控制单元,用于为异构计算模块上电。本专利技术第二方面提供了一种基于Retimer的通用计算模块与异构计算模块的适配方法,所述方法包括:异构计算模块端配置与当前异构拓扑相适应的标识信号;通用计算模块端获取所述标识信号,识别当前异构计算模块的异构拓扑;第一控制单元控制选通单元选择与所述异构拓扑相适应的Retimer配置文件。进一步地,在所述步骤之后还包括:控制第二控制单元为异构计算模块上电。进一步地,所述异构计算模块端配置与当前异构拓扑相适应的标识信号的具体过程为:异构计算模块端设置若干接线端;配置异构计算模块的异构拓扑;根据所述异构拓扑,将每个接线端接地或悬空,接线端的连接方式形成标识信号,所述标识信号与异构拓扑构成对应关系。本专利技术第三方面提供了一种异构计算模块,包括若干GPU形成的异构拓扑,所述异构计算模块还包括与所述异构拓扑相对应的识别单元,所述识别单元包括若干接线端,每个接线端的连接方式为接地或悬空,接线端的连接方式形成异构拓扑的标识信号。
技术实现思路
中提供的效果仅仅是实施例的效果,而不是专利技术所有的全部效果,上述技术方案中的一个技术方案具有如下优点或有益效果:为Retimer同时设置多个配置文件,通过第一控制单元识别当前异构计算模块的异构拓扑,选通与当前拓扑相适应的Retimer配置文件,实现通用计算模块与异构计算模块的快速适配。在异构计算模块改变异构拓扑时,不需要拆卸机箱,对Retimer配置文件重新烧录,节约终端用户使用成本,避免重新烧录出现的错误。在异构计算模块端设置与当前拓扑相对应的识别信号,便于通用计算模块的快速识别适配。附图说明为了更清楚地说明本专利技术实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是现有通用计算模块与异构计算模块的适配结构示意图;图2是本专利技术所述适配装置的结构示意图;图3是本专利技术异构计算拓扑实施例1的结构示意图;图4是本专利技术异构计算拓扑实施例2的结构示意图;图5是本专利技术异构计算拓扑实施例3的结构示意图;图6是本专利技术所述适配装置实施例的结构示意图;图7是图3所示拓扑对应的接线组合方式;图8是图4所示拓扑对应的接线组合方式;图9是图5所示拓扑对应的接线组合方式;图10是本专利技术所述方法的流程示意图。具体实施方式为能清楚说明本方案的技术特点,下面通过具体实施方式,并结合其附图,对本专利技术进行详细阐述。下文的公开提供了许多不同的实施例或例子用来实现本专利技术的不同结构。为了简化本专利技术的公开,下文中对特定例子的部件和设置进行描述。此外,本专利技术可以在不同例子中重复参考数字和/或字母。这种重复是为了简化和清楚的目的,其本身不指示所讨论各种实施例和/或设置之间的关系。应当注意,在附图中所图示的部件不一定按比例绘制。本专利技术省略了对公知组件和处理技术及工艺的描述以避免不必要地限制本专利技术。如图2所示,本专利技术基于Retimer的通用计算模块与异构计算模块的适配装置,包括互联的通用计算模块和异构计算模块,通用计算模块包括Retimer、第一控制单元、选通单元和与选通单元连接的配置存储文件,异构计算模块包括标识单元、第二控制单元和异构拓扑。Retimer通过选通单元连接配置文件存储单元,配置文件存储单元根本文档来自技高网
...

【技术保护点】
1.一种基于Retimer的通用计算模块与异构计算模块的适配装置,包括互联的通用计算模块和异构计算模块,所述通用计算模块包括与通用计算节点连接的Retimer,其特征是,所述Retimer通过选通单元连接若干配置文件存储单元,所述通用计算模块还包括第一控制单元,所述第一控制单元用于识别异构计算模块的异构拓扑,并根据所述异构拓扑控制所述选通单元选择与Retimer连接的配置文件存储单元。

【技术特征摘要】
1.一种基于Retimer的通用计算模块与异构计算模块的适配装置,包括互联的通用计算模块和异构计算模块,所述通用计算模块包括与通用计算节点连接的Retimer,其特征是,所述Retimer通过选通单元连接若干配置文件存储单元,所述通用计算模块还包括第一控制单元,所述第一控制单元用于识别异构计算模块的异构拓扑,并根据所述异构拓扑控制所述选通单元选择与Retimer连接的配置文件存储单元。2.根据权利要求1所述的基于Retimer的通用计算模块与异构计算模块的适配装置,其特征是,所述异构计算模块包括标识单元,所述标识单元用于标识当前异构计算模块的异构拓扑。3.根据权利要求2所述的基于Retimer的通用计算模块与异构计算模块的适配装置,其特征是,所述标识单元包括若干接线端,每个接线端的连接方式为接地或悬空,所述第一控制单元包括CPLD,所述CPLD连接所述接线端。4.根据权利要求1所述的基于Retimer的通用计算模块与异构计算模块的适配装置,其特征是,所述异构计算模块还包括第二控制单元,所述第二控制单元连接所述第一控制单元,用于为异构计算模块上电。5.一种基于Retimer...

【专利技术属性】
技术研发人员:戴金锐孔祥涛
申请(专利权)人:苏州浪潮智能科技有限公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1