一种云端平台计算系统及其应用方法技术方案

技术编号:19489117 阅读:230 留言:0更新日期:2018-11-17 12:03
本发明专利技术涉及一种云端平台计算系统及其应用方法,包括:服务端和节点端。服务端由接入服务器构成,用于该云端平台计算系统的用户及计算资源的管理和调度;节点端由多个计算节点及辅助硬件构成,为云端平台计算系统提供异构计算资源;计算节点通过局域网与接入服务器进行交互。每个计算节点包含SoC主控模块和异构计算处理模块;SoC主控模块可运行操作系统,为用户提供相应异构计算处理模块的使用环境和管理功能;异构计算处理模块用于逻辑功能或加速算法的实现与部署。用户通过登录接入服务器,申请和使用计算节点。使用内容包括:用户通过接入服务器进入SoC主控模块的操作系统,对异构计算处理模块进行使用、管理、配置、调试及监控等操作。

【技术实现步骤摘要】
一种云端平台计算系统及其应用方法
本专利技术涉及计算机体系结构以及异构处理系统领域,特别涉及一种云端平台计算系统及其应用方法。
技术介绍
随着云计算、大数据、物联网等概念的兴起,异构计算系统逐渐成为产业发展的必然选择。相比于单一的CPU系统,在特定的应用场景下(如人工智能等),异构计算系统往往能够达到几十甚至上百倍的性能提升。然而开发、部署一个异构计算系统往往需要高成本和长周期的投入,为了追求经济与效益的最优化,异构计算云平台应用而生。常见的异构计算云平台主要有FPGA云平台、GPU云平台以及谷歌公司的TPU云平台等。以FPGA云为例,由于半导体工艺的发展速度逐渐成为制约计算机系统性能的瓶颈,传统的串行处理技术已经不能满足人们的需求,人们开始把注意力放在可并行计算的FPGA上。FPGA以其高能效和可多次编程的优势,逐渐成为突破现有系统性能瓶颈的解决方案之一。在媒体压缩、加解密、人工智能(AI)及大数据处理等领域,FPGA方案较传统CPU和GPU往往可达到几倍甚至几十倍的能效提升。然而FPGA开发的技术门槛较高,搭建FPGA硬件平台更是高成本、长周期。为了追求经济与效益的最优化,FPGA云平台应运而生。运营商为用户提供稳定的FPGA硬件平台以及一整套的开发环境,用户支付相对较低的价格就可以使用到高端的FPGA资源,快速的开始项目开发工作。最近几年,FPGA云的发展尤为迅猛,2017年4月美国亚马逊公司的FPGAEC2实例F1正式上线,同年国内互联网公司也纷纷宣布开展FPGA云加速器业务。目前商用的FPGA云平台、GPU云平台以及TPU云平台等,都是基于X86服务器加FPGA/GPU/TPU架构,后文将主要以FPGA云平台进行对比说明。现有的主要运营商的FPGA云平台基本框架如图2所示,主要分三部分:客户端、服务端和FPGA节点端。客户端安装在用户的本地PC上,用于登录和使用云平台(也可以通过网页或SSH工具登录和使用云平台)。服务端由一台或多台X86服务器组成,服务端集成了应用程序开发、FPGA加速逻辑开发所需的全套开发工具。节点端由一个或多个FPGA节点构成,并部署在服务端的X86服务器机箱里。客户端与服务端通过互联网进行数据交互,服务端与节点端通过PCIe接口进行数据交互。服务端与FPGA节点通过PCIe接口进行数据交互。受限于接口形式,FPGA节点需部署在X86服务器机箱里。一台X86服务器根据自身机箱尺寸以及主板PCIe的接口数量,可部署的FPGA节点数量通常不会超过8个。如亚马逊的FPGAEC2实例F1,每个F1实例计算池上最多可配置8个FPGA节点。即使阿里云F3实例中也最多有16片FPGA芯片(双芯片板卡)。在现有的云框架下,FPGA节点很难进行高密度的部署,如果进行大量部署,需要大量的X86服务器,部署成本高,且占用大量的物理空间。现有FPGA云计算平台将X86服务器与FPGA节点作为一种资源提供给用户,这种使用模式偏商业化,针对不同的用户群体,这种模式并不是最优的,如果用户使用FPGA云平台的目的仅仅是想学习或者使用FPGA可编程逻辑资源进行相关的逻辑设计、验证(比如教学领域),对X86服务器并没有太大的需求,在这种场景下,X86服务器加FPGA节点这种架构显然存在性能上的浪费。此外,在X86服务器加FPGA节点这种架构下,FPGA资源的部署和管理并不灵活。比如FPGA节点必须要满足X86服务器PCIe设备的物理尺寸,X86服务器很难对多个PCIe接口上的FPGA节点进行动态的上电和下电。综上所述,现有的FPGA云平台很难高密度的部署FPGA节点;针对特定的用户群体,会造成X86服务器资源的浪费;在现有框架下部署和管理FPGA节点并不灵活。
技术实现思路
为了解决上述技术问题,本专利技术目的在于提供一种高密度、低部署成本、低功耗、管理灵活的基于接入服务器、SoC主控模块、异构计算处理模块的云端平台计算系统的搭建方法。本专利技术可用于构建FPGA云平台,但并不局限于FPGA云平台。具体地说,本专利技术公开了一种云端平台计算系统,其中包括:服务端和节点端,其中该服务端由接入服务器构成,用于管理和调度该云端平台计算系统的用户及计算资源;该节点端由多个计算节点以及辅助硬件构成,该计算节点包含SoC主控模块和异构计算处理模块,该SoC主控模块为用户提供该异构计算处理模块辅助软件的使用部署及开发环境,该异构计算处理模块用于逻辑功能或加速算法的实现与部署;该节点端通过该云端平台计算系统内部局域网与该服务端进行信息交互。该云端平台计算系统,其中该SoC主控模块运行操作系统,结合该接入服务器,为用户提供异构计算处理模块的使用环境和管理功能。该云端平台计算系统,其中该辅助硬件包括:交换机,用于构成该云端平台计算系统内部的局域网;电源控制单元,受该服务端的控制,用于动态的对该计算节点进行上电和下电。该云端平台计算系统,其中该SoC主控模块与该异构计算处理模块为同一个芯片上的两个不同部分,或为同一电路板卡上的两个芯片,或分别为两块不同的电路板卡;该SoC主控模块与该异构计算处理模块之间通过片内总线、PCIe、以太网或定制总线协议进行通信。该云端平台计算系统,其中该SoC主控模块与该异构计算处理模块间还配备逻辑或物理通路,用于对该异构计算处理模块进行配置和调试,并对该异构计算处理模块的工作状态以及性能参数进行监控。该云端平台计算系统,其中该计算节点间通过PCIe、以太网、定制总线协议进行通信,将多个计算节点相连以建立一个组合计算节点为用户提供服务。该云端平台计算系统,其中将每个该计算节点虚拟化为多个,以分给不同的用户使用。该云端平台计算系统,其中该SoC主控模块为ARM或RISC-V等RISC体系架构的硬核处理器;该异构计算处理模块为ASIC、TPU、GPU和/或FPGA可编程逻辑资源。本专利技术还提供了一种该云端平台计算系统的应用方法,其中用户通过互联网访问该服务端,以使用该节点端的计算节点,使用内容包括:用户通过接入服务器进入SoC主控模块的操作系统,对异构计算处理模块进行使用、管理、配置、调试及监控等操作,以及对SoC主控模块上的辅助软件进行开发和使用等操作。该云端平台计算系统的应用方法,其中用户访问该服务端过程具体包括:当该服务端接收到用户的访问请求时,检测当前该节点端是否有空闲的计算节点,如果有,则该服务端对空闲的计算节点实施上电、初始化操作,完成后将其分配给用户使用,待用户使用完成后,对相应节点进行状态检测、断电操作。本专利技术的技术优势包括:本专利技术中的云计算平台,可将异构计算资源高密度、低成本的部署在云端的定制机箱中。本专利技术集成了平台管理、维护软件,以及多种在云端技术开发中所需的软硬件支持,为用户提供一个方便快捷的云端计算资源使用环境。以FPGA云平台为例,区别于国内外互联网公司近两年开始提供的FPGA异构加速云平台,在本专利技术框架下构建的FPGA云平台(后文称SoCFPGA云平台,用以区分现有的商用FPGA云平台)将SoCFPGA(即含有硬核处理器和可编程逻辑资源的FPGA器件)作为计算节点,具有总线扩展互连和资源虚拟、池化等技术,并且基于SoCFPGA中的处理器硬核进行FPGA逻辑资源的使用、管理、配置、调试本文档来自技高网
...

【技术保护点】
1.一种云端平台计算系统,其特征在于,包括:服务端和节点端,其中该服务端由接入服务器构成,用于管理和调度该云端平台计算系统的用户及计算资源;该节点端由多个计算节点以及辅助硬件构成,该计算节点包含SoC主控模块和异构计算处理模块,该SoC主控模块为用户提供该异构计算处理模块辅助软件的使用部署及开发环境,该异构计算处理模块用于逻辑功能或加速算法的实现与部署;该节点端通过该云端平台计算系统内部局域网与该服务端进行信息交互。

【技术特征摘要】
1.一种云端平台计算系统,其特征在于,包括:服务端和节点端,其中该服务端由接入服务器构成,用于管理和调度该云端平台计算系统的用户及计算资源;该节点端由多个计算节点以及辅助硬件构成,该计算节点包含SoC主控模块和异构计算处理模块,该SoC主控模块为用户提供该异构计算处理模块辅助软件的使用部署及开发环境,该异构计算处理模块用于逻辑功能或加速算法的实现与部署;该节点端通过该云端平台计算系统内部局域网与该服务端进行信息交互。2.如权利要求1所述的云端平台计算系统,其特征在于,该SoC主控模块运行操作系统,结合该接入服务器,为用户提供异构计算处理模块的使用环境和管理功能。3.如权利要求1或2所述的云端平台计算系统,其特征在于,该辅助硬件包括:交换机,用于构成该云端平台计算系统的内部局域网;电源控制单元,受该服务端的控制,用于动态的对该计算节点进行上电和下电。4.如权利要求1或2所述的云端平台计算系统,其特征在于,该SoC主控模块与该异构计算处理模块为同一个芯片上的两个不同部分,或为同一电路板卡上的两个芯片,或分别为两块不同的电路板卡;该SoC主控模块与该异构计算处理模块之间通过片内总线、PCIe、以太网或定制总线协议进行通信。5.如权利要求4所述的云端平台计算系统,其特征在于,该SoC主控模块与该异构计算处理模块间还配备逻辑或物理通路,用于对该异构计算处...

【专利技术属性】
技术研发人员:张科常轶松于磊陈明宇包云岗赵然张钊张红霞
申请(专利权)人:中国科学院计算技术研究所
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1