一种基于高性能可重构计算的超级计算机制造技术

技术编号:22166562 阅读:17 留言:0更新日期:2019-09-21 10:26
本发明专利技术涉及一种基于高性能可重构计算的超级计算机,包括:机器感知机,用于获取可重构数据;RPU阵列,用于对输入的可重构数据进行计算;主控系统,用于控制将可重构数据传输至RPU阵列;机器行为器,用于输出计算结果和/或执行超级计算机指令;编译系统,用于将应用任务进行标记和预处理,并分解为主控系统执行代码和RPU执行代码,并最终生成主控系统的控制码、弹性连接控制信息和RPU阵列的各项配置信息;以便在控制码的控制下,形成机器感知机与RPU阵列的数据通路,以及形成机器行为器与RPU阵列的数据通路;以及弹性连接控制信息使得RPU阵列形成弹性的计算架构;以及RPU阵列的各项配置信息对RPU阵列中的RPU进行配置,用于对可重构数据进行计算。

A Supercomputer Based on High Performance Reconfigurable Computing

【技术实现步骤摘要】
一种基于高性能可重构计算的超级计算机
本专利技术涉及可重构计算领域,尤其是涉及一种基于高性能可重构计算的AI超级计算机。
技术介绍
随着科技的进步,人工智能(artificialintelligence,AI)的发展突飞猛进。但是其运行的平台绝大部分仍然是基于中央处理器(centralprocessingunit,CPU)、图形处理器(graphicsprocessingunit,GPU)、现场可编程门阵列(fieldprogrammablegatearray,FPGA)和专用集成电路(applicationspecificintegratedcircuit,ASIC)及其组合形成的平台。目前,上述运行平台在AI产品部署的时候给开发者和用户依旧造成了很多困扰。例如CPU的灵活度最高,但是对于AI等需要大量并行计算的场景下,其效能比非常的低。GPU和FPGA的使用解决了一部分并行计算的问题,但是功耗和成本仍然是影响其部署的重要原因。对于ASIC来说,具有很好的效能比,但是AISC只能适应固定的算法,对算法的演进却无能为力。其次,由CPU、GPU、FPGA和ASIC的一种或多种组成的平台在系统架构的复杂性、算力的可扩充性、系统的功耗和成本等方面都不尽人意。对于现有的X86架构下通过高速串行计算机扩展总线标准(peripheralcomponentinterconnectexpress,PCIE)扩展AI算力的产品在实际应用中对快速迭代AI算法的支持,以及对算力部署的灵活性均受到较大的制约。如今运行平台已经成为限制AI部署的最大制约因素。
技术实现思路
本专利技术基于AI计算的特点,以X86架构为基础,通过主处理器的PCIE接口连接一个或多个可重构计算单元(reconfigurableprocessingunit,RPU)阵列,可根据产品需求和使用环境弹性部署算力,可支持边缘计算、大规模计算以及极大规模计算,还可支持无需指令驱动的各种神经网络计算、支持在线训练与在线算法迭代,并且具备极高的通用性、灵活性和能效比。为实现上述目的,本专利技术一方面提供了一种基于高性能可重构计算的超级计算机,包括:至少一个机器感知机,用于获取环境感知信息和/或设备输入信息作为可重构数据;至少一个可重构计算单元RPU阵列,用于对输入的可重构数据进行计算;主控系统,用于控制将可重构数据传输至至少一个RPU阵列;至少一个机器行为器,用于输出计算结果和/或执行超级计算机指令;编译系统,用于将应用任务进行标记和预处理,并分解为主控系统执行代码和RPU执行代码;根据至少一个RPU阵列对RPU执行代码进行代码变换和优化,最终生成主控系统的控制码、弹性连接控制信息和RPU阵列的各项配置信息;以便在控制码的控制下,形成至少一个机器感知机与至少一个RPU阵列的数据通路,以及形成至少一个机器行为器与至少一个RPU阵列的数据通路;以及弹性连接控制信息使得至少一个RPU阵列形成弹性的计算架构;以及RPU阵列的各项配置信息对至少一个RPU阵列中的RPU进行配置,用于对可重构数据进行计算。优选地,主控系统包括:平台控制中心PCH和基于X86/AMD64架构的主控制器;PCH与主控制器通过直接媒体接口DMI相连接;PCH与至少一个机器感知机相连接,用于将环境感知信息和/或设备输入信息传输至基于X86/AMD64架构的主控制器;基于X86/AMD64架构的主控制器通过PCIE接口与至少一个RPU阵列相连接,用于将可重构数据传输至至少一个RPU阵列,以便进行计算;PCH与至少一个机器行为器相连接,用于将计算结果从基于X86/AMD64架构的主控制器传输至至少一个机器行为器。优选地,RPU阵列包括:弹性连接系统HEC_link;一个或多个RPU;HEC_link在弹性连接控制信息的控制下,连接一个或多个RPU;一个或多个RPU通过HEC_link获取相应的配置信息;以及一个或多个RPU通过HEC_link从主控系统或其它RPU获取可重构数据;以及通过HEC_link将计算结果传输至主控系统或其它RPU。优选地,至少一个RPU阵列与主控系统通过PCIE接口相连接,HEC_link包括:PCIE协议转换器,用于将PCIE接口信息与至少一个RPU阵列中的配置总线和可重构数据总线进行协议转换。优选地,HEC_link根据弹性连接控制信息对至少一个RPU阵列中的一个或多个RPU进行计算深度和计算宽度的扩展;以及对至少一个RPU阵列中的一个或多个RPU分组,用于分别输入不同的可重构数据并执行不同任务;或分别输入不同的可重构数据并执行相同任务;或分别输入相同的可重构数据并执行不同任务;或分别输入相同的可重构数据并执行相同任务。优选地,编译系统对已经确定的至少一个RPU阵列,通过HEC_link进行宽度和/或深度的调整,以改变一个或多个RPU的连接关系。优选地,还包括:操作系统,用于管理超级计算机的软件和硬件资源以及外设资源,以及执行编译系统输出的编译文件,以及获取来自机器感知机的信息,以及控制机器行为器执行计算结果,以及根据RPU阵列的各项配置信息驱动至少一个RPU阵列,以及控制编译系统执行在线编译。优选地,编译系统为离线编译模式,将编译完成的编译文件传递至操作系统;或编译系统为在线编译模式,用于操作系统实时进行编译并部署。优选地,机器感知机包括:终端传感器,用于采集周边环境信息及自身状态信息;传感器模组,用于对终端传感器采集到的周边环境信息及自身状态信息进行二次分析计算,生成环境感知信息和/或设备输入信息作为可重构数据。优选地,机器行为器包括:通讯单元、人机接口、伺服机构和控制单元。优选地,终端传感器包括:图像传感器、毫米波雷达、超声波雷达、激光雷达、惯性测量单元、麦克风、全球卫星导航系统、触摸屏和应力感应器;传感器模组包括:RGB-D深度相机、双目深度相机和VIO三维重建相机。优选地,环境感知信息包括:视觉、听觉、触觉、味觉、地理位置和位置变化。本专利技术实现了以X86架构为基础,通过主处理器与机器感知机、机器行为器相连,并且通过PCIE接口连接一个或多个RPU阵列,可根据产品需求和使用环境弹性地部署算力。同时还可支持边缘计算、大规模计算以及极大规模计算,可支持无需指令驱动的各种神经网络计算、支持在线训练与在线算法迭代,并且具有极高的通用性、灵活性和能效比。附图说明图1为本专利技术实施例提供的基于高性能可重构计算的超级计算机架构示意图;图2为本专利技术实施例提供的一种弹性部署算力示意图;图3为本专利技术实施例提供的另一种弹性部署算力示意图;图4a为本专利技术实施例提供的一种弹性调节算力执行多任务示意图;图4b为本专利技术实施例提供的另一种弹性调节算力执行多任务示意图。具体实施方式下面通过附图和实施例,对本专利技术的技术方案做进一步的详细描述。图1为本专利技术实施例提供的基于高性能可重构计算的超级计算机架构示意图。本专利技术中涉及到的超级计算机可以是AI超级计算机。如图1所示,在一个实施例中,本专利技术供了一种基于高性能可重构计算的超级计算机,包括:至少一个机器感知机,用于获取环境感知信息和/或设备输入信息作为可重构数据。至少一个可重构计算单元RPU阵列,用于对输入的可重构数据进行计算。主控系统,用于控制将可重构数据传本文档来自技高网...

【技术保护点】
1.一种基于高性能可重构计算的超级计算机,其特征在于,包括:至少一个机器感知机,用于获取环境感知信息和/或设备输入信息作为可重构数据;至少一个可重构计算单元RPU阵列,用于对输入的可重构数据进行计算;主控系统,用于控制将所述可重构数据传输至所述至少一个RPU阵列;至少一个机器行为器,用于输出计算结果和/或执行超级计算机指令;编译系统,用于将应用任务进行标记和预处理,并分解为主控系统执行代码和RPU执行代码;根据所述至少一个RPU阵列对所述RPU执行代码进行代码变换和优化,最终生成主控系统的控制码、弹性连接控制信息和RPU阵列的各项配置信息;以便在所述控制码的控制下,形成至少一个机器感知机与所述至少一个RPU阵列的数据通路,以及形成至少一个机器行为器与所述至少一个RPU阵列的数据通路;以及所述弹性连接控制信息使得所述至少一个RPU阵列形成弹性的计算架构;以及所述RPU阵列的各项配置信息对所述至少一个RPU阵列中的RPU进行配置,用于对所述可重构数据进行计算。

【技术特征摘要】
1.一种基于高性能可重构计算的超级计算机,其特征在于,包括:至少一个机器感知机,用于获取环境感知信息和/或设备输入信息作为可重构数据;至少一个可重构计算单元RPU阵列,用于对输入的可重构数据进行计算;主控系统,用于控制将所述可重构数据传输至所述至少一个RPU阵列;至少一个机器行为器,用于输出计算结果和/或执行超级计算机指令;编译系统,用于将应用任务进行标记和预处理,并分解为主控系统执行代码和RPU执行代码;根据所述至少一个RPU阵列对所述RPU执行代码进行代码变换和优化,最终生成主控系统的控制码、弹性连接控制信息和RPU阵列的各项配置信息;以便在所述控制码的控制下,形成至少一个机器感知机与所述至少一个RPU阵列的数据通路,以及形成至少一个机器行为器与所述至少一个RPU阵列的数据通路;以及所述弹性连接控制信息使得所述至少一个RPU阵列形成弹性的计算架构;以及所述RPU阵列的各项配置信息对所述至少一个RPU阵列中的RPU进行配置,用于对所述可重构数据进行计算。2.根据权利要求1所述的超级计算机,其特征在于,所述主控系统包括:平台控制中心PCH和基于X86/AMD64架构的主控制器;所述PCH与所述主控制器通过直接媒体接口DMI相连接;所述PCH与所述至少一个机器感知机相连接,用于将所述环境感知信息和/或设备输入信息传输至所述基于X86/AMD64架构的主控制器;所述基于X86/AMD64架构的主控制器通过所述PCIE接口与所述至少一个RPU阵列相连接,用于将所述可重构数据传输至所述至少一个RPU阵列,以便进行计算;所述PCH与所述至少一个机器行为器相连接,用于将计算结果从所述基于X86/AMD64架构的主控制器传输至所述至少一个机器行为器。3.根据权利要求1所述的超级计算机,其特征在于,所述RPU阵列包括:弹性连接系统HEC_link;一个或多个RPU;所述HEC_link在所述弹性连接控制信息的控制下,连接所述一个或多个RPU;所述一个或多个RPU通过所述HEC_link获取相应的配置信息;以及所述一个或多个RPU通过所述HEC_link从所述主控系统或其...

【专利技术属性】
技术研发人员:向志宏吴君安杨延辉
申请(专利权)人:北京超维度计算科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1