【技术实现步骤摘要】
支持多卡并行的嵌入式智能计算装置
[0001]本专利技术涉及一种支持多卡并行的嵌入式智能计算系统设计方法及装置,属于计算机体系结构中嵌入式系统并行计算
技术介绍
[0002]随着人工智能技术迅速发展,通过执行深度学习网络算法完成计算机视觉和自然语言处理大数据自动识别分析,实现数据处理智能化升级和有效利用,给诸如安防、人脸识别、物品检测、智能家居、智慧城市等应用领域带来了显著的经济效益和业务增长。而传统以CPU、FPGA、DSP硬件计算架构为核心的数字信号处理平台在新型基于深度学习神经网络算法为代表的人工智能算法加速计算应用中面临着计算能力(以下简称算力)不足、计算效能比低、计算结果实时性无法满足等问题,为此新型人工智能专用加速处理器应运而生,比如寒武纪的MLU系列深度学习处理器、华为的昇腾系列深度学习处理器、瑞芯微RK3399系列等,但受限于单个芯片面积、功耗、成本等因素,单个智能处理器芯片集成的计算资源和计算能力有限,同时单块嵌入式计算系统板卡受限于PCB电路面积、功耗有限等苛刻约束条件,导致可集成的智能处理器芯片数量和提供系统级算力也有限,在处理大规模数据和复杂智能算法网络时,单卡形式的嵌入式智能计算系统装置仍存在计算能力不足、数据处理流程“端到端”时延无法满足实时性的问题。
技术实现思路
[0003]为了克服上述问题,本专利技术的目的是提供一种支持多卡并行的嵌入式智能计算系统设计方法及装置,该方法采用高速RapidIO分布式对等网络,并采用标准VPX嵌入式智能计算系统多卡并行计算、标准 ...
【技术保护点】
【技术特征摘要】
1.一种支持多卡并行的嵌入式智能计算装置,其特征在于,包括多个嵌入式智能计算板卡、一个主控与IO板卡和一个RapidIO交换板卡;该嵌入式智能计算板卡,采用嵌入式ARM处理器和深度学习处理器的异构计算架构,集成RapidIO转PCIE的高速总线桥片模块;该嵌入式智能计算板卡通过该异构计算架构和该高速总线桥片模块,负责运行嵌入式Linux操作系统、嵌入式智能算法应用程序和深度学习算法网络模型终端部署,实现高速RapidIO总线图像/视频数据流的实时接收与缓存,和基于卷积神经网络的深度学习算法的高性能推理加速;该主控与IO板卡,采用FPGA和DDR内存的设计架构,用于根据该设计架构提供FPGA硬件逻辑编程和外部数据流缓存、数据预处理以及根据图像数据类型或帧号分发数据至各嵌入式智能计算板卡进行并行推理计算;FPGA的IO通信接口对外实现与外部诸如图像/视频等设备通信接口的接入,对内实现RapidIO总线通信互联;该RapidIO交换板卡,用于提供多路RapidIO总线通信端口和各端口内部Mesh全连接交换网络,实现该主控及IO单元板卡与所有该嵌入式智能计算板卡间点对点RapidIO网络互联。2.如权利要求1所述的支持多卡并行的嵌入式智能计算装置,其特征在于,包括电源板卡,用于为该嵌入式智能计算板卡、该主控及IO板卡、该IO交换板提供工作电源。3.如权利要求2所述的支持多卡并行的嵌入式智能计算装置,其特征在于,采用垂直插卡方式将所有该嵌入式智能计算板卡、该主控与IO板卡、该RapidIO交换板卡和该电源卡通过VPX连接器安装固定在VPX背板上。4.如权利要求3所述的支持多卡并行的嵌入式智能计算装置,其特征在于,该嵌入式智能计算板卡包括该嵌入式ARM处理器单元、该深度学习处理器、RapidIO总线通信单元、电源模块、VPX连接器;其中该嵌入式ARM处理器单元为主控单元,采用PCIe与该深度学习处理器、该高速RapidIO总线通信单元互联,该嵌入式ARM处理器单元作为PCIE RC节点,该深度学习处理器单元和该高速RapidIO总线通信单元均作为PCIE EndPoint节点;该深度学习处理器则作为深度学习算法网络模型推理计算加速专用部件,由专用深度学习智能处理芯片、DDR显存电路与PCIe接口电路互联构成;该高速RapidIO总线通信单元,用于提供基于PCIe总线ARM处理器架构的嵌入式智能计算系统与RapidIO交换板卡或其它RapidIO功能板卡之间高带宽、低时延基于RapidIO包交换的高速数据传输通道和RapidIO网络系统级别互联功能,该高速RapidIO总线通信单元采用RapidIO
‑
to
‑
PCIe桥片专用集成芯片,实现RapidIO互联和RapidIO总线协议转PCIe总线协议的相互转换;该电源模块与该VPX连接器上输入电源互联,提供该嵌入式智能计算板卡整板工作电源电压网络;该VPX连接器,用于提供高速RapidIO总线通信接口单元差分传输线与VPX背板互联和VPX供电输入,物理端口构成包括端口P0、端口P1、端口P2组成,其中端口P0主要用于电源输入,端口P1主要用于RapidIO X4高速信号互联,端口P2则用于对外引出硬件调试通信接口到VPX背板。5.如权利要求3所述的支持多卡并行的嵌入式智能计算装置,其特征在于,该主控与IO
板卡,包括FP...
【专利技术属性】
技术研发人员:徐勇军,吴济文,赵二虎,安竹林,
申请(专利权)人:中国科学院计算技术研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。