一种加速设备、异构计算架构及数据处理方法技术

技术编号:40638606 阅读:31 留言:0更新日期:2024-03-13 21:21
本发明专利技术公开了一种加速设备、异构计算架构及数据处理方法,涉及数据处理领域,为解决异构计算架构中各个加速设备交互效率低的问题,该加速设备包括:存储模组、至少一个本地光口、与各个本地光口连接的外部路由模组、内部路由模组、计算模组。本发明专利技术能够同时进行多个加速设备之间的数据传输,光口的数据传输带宽较高,利用光口进行数据传输可以提高计算任务的协同完成效率。

【技术实现步骤摘要】

本专利技术涉及数据处理领域,特别涉及一种加速设备、异构计算架构及数据处理方法


技术介绍

1、随着人工智能的不断发展,cpu(central processing unit,中央处理器)能够提供的算力与ai(artificial intelligence,人工智能)领域对于算力的需求之间的矛盾日益突出。传统单cpu计算架构存在算力不足的问题,异构计算架构应运而生,异构计算架构为cpu与gpu(graphics processing unit,图形处理器)、fpga(field programmable gatearray,现场可编程逻辑门阵列)、asic(application specific integrated circuit,专用集成电路)中任一项或多项的组合。

2、为了获得足够的算力,通常在一台服务器上配备多张加速卡来共同完成计算任务,乃至扩展到多台服务器共同完成ai大模型的推理和计算任务。在多卡乃至多服务之间实现高效的数据传输是目前面临的一个比较重大的难题。目前加速卡之间的通信可以以主机内存为桥梁来实现,即当加速卡a的数据需要传输到本文档来自技高网...

【技术保护点】

1.一种加速设备,其特征在于,包括:

2.根据权利要求1所述的加速设备,其特征在于,所述本地光口的数量为多个,所述外部路由模组包括与多个所述本地光口一一对应的外部路由模块,多个所述外部路由模块依次连接;

3.根据权利要求2所述的加速设备,其特征在于,每个所述外部路由模块均包括第一接收端口、第二接收端口、第一转发端口和第二转发端口,所述第一转发端口及所述第一接收端口与自身一一对应的本地光口连接,所述第二转发端口与所述下级路由模块的第二接收端口连接,所述第二接收端口与所述上级路由模块的第二转发端口连接;

4.根据权利要求2所述的加速设备,其特征在于,所述外...

【技术特征摘要】

1.一种加速设备,其特征在于,包括:

2.根据权利要求1所述的加速设备,其特征在于,所述本地光口的数量为多个,所述外部路由模组包括与多个所述本地光口一一对应的外部路由模块,多个所述外部路由模块依次连接;

3.根据权利要求2所述的加速设备,其特征在于,每个所述外部路由模块均包括第一接收端口、第二接收端口、第一转发端口和第二转发端口,所述第一转发端口及所述第一接收端口与自身一一对应的本地光口连接,所述第二转发端口与所述下级路由模块的第二接收端口连接,所述第二接收端口与所述上级路由模块的第二转发端口连接;

4.根据权利要求2所述的加速设备,其特征在于,所述外部路由模块还用于对所述待处理数据帧进行解析,得到路由信息,基于所述路由信息判断所述待处理数据帧是否满足所述向外转发条件,和/或基于所述路由信息判断所述待处理数据帧是否满足所述向内转发条件,和/或基于所述路由信息判断所述待处理数据帧是否满足所述向内写入条件。

5.根据权利要求4所述的加速设备,其特征在于,基于所述路由信息判断所述待处理数据帧是否满足所述向外转发条件的过程包括:

6.根据权利要求4所述的加速设备,其特征在于,基于所述路由信息判断所述待处理数据帧是否满足所述向内转发条件的过程包括:

7.根据权利要求4所述的加速设备,其特征在于,基于所述路由信息判断所述待处理数据帧是否满足所述向内写入条件的过程包括:

8.根据权利要求2-7任意一项所述的加速设备,其特征在于,所述外部路由模块包括:

9.根据权利要求8所述的加速设备,其特征在于,基于匹配结果确定转发信息的过程包括:

10.根据权利要求1所述的加速设备,其特征在于,将所述待处理数据帧中的待计算数据写入所述存储模组并生成第一触发指令的过程包括...

【专利技术属性】
技术研发人员:刘伟邓子为郭巍张德闪
申请(专利权)人:浪潮电子信息产业股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1