面向云端深度学习推理的FPGA虚拟化方法技术

技术编号：24167854 阅读：106 留言：0更新日期：2020-05-16 02:00

本发明专利技术公开了一种面向云端深度学习推理的FPGA虚拟化方法，该方法包括以下步骤：通过向基于指令集架构的深度神经网络加速器架构引入两级指令调度器和硬件资源池，构建基于指令集架构的深度神经网络加速器虚拟化架构；根据基于指令集架构的深度神经网络加速器虚拟化架构，将完整编译流程划分为静态编译和动态编译；在静态编译第一次部署时生成细粒度指令包，当动态编译重配置时，对细粒度指令包进行整合，快速生成需求指令文件。该方法在确保最大化硬件资源利用率的多任务算力资源共享下，实现运行时的快速动态重配置。

FPGA virtualization method for deep learning reasoning in the cloud

全部详细技术资料下载

【技术实现步骤摘要】
面向云端深度学习推理的FPGA虚拟化方法
本专利技术涉及人工智能虚拟化
，特别涉及一种面向云端深度学习推理的FPGA虚拟化方法。
技术介绍
当前正处于人工智能快速发展的时代，深度学习在各种领域扮演着越来越重要的角色。其中，深度神经网络(DNN)的推理任务占据了云端数据中心的大部分深度学习任务负载。在数据中心中使用传统的通用处理器CPU(中央处理器)已无法满足深度学习巨大的算力需求。因此，现在通常使用专用的硬件平台，比如GPU、FPGA(现场可编程门阵列)和ASIC(特定应用集成电路)，来加速深度学习算法。得益于FPGA对于可编程性、性能和功耗的良好平衡，越来越多的云端服务商，如亚马逊、阿里巴巴和百度等，都开始在数据中心中部署FPGA来提供面向DNN推理任务的解决方案。由于云端的DNN应用具有多任务和动态负载的特点，为了提供灵活可重配置的算力资源来匹配云端的应用特性以最大化整体性能和最小化服务成本，一种常用的方法是实现数据中心算力资源的虚拟化。目前面向神经网络应用的虚拟化方案主要有三种：一是多任务共享一块FPGA，通过时分复用的方式在不同任务之间切换。大多数基于指令集架构(ISA)的DNN加速器架构都可以通过这种方式实现计算资源的共享。基于ISA的DNN加速器通过编译器生成不同任务的指令，在运行时切换指令以在同一个硬件架构上实现多任务的时分复用；二是多任务共享一块FPGA，通过空分复用的方式实现多任务的并行。目前基于模板的DNN加速器可以支持空分复用，通过部分重配置的方式将不同的任务加载到FPGA的不同区...

【技术保护点】
1.一种面向云端深度学习推理的FPGA虚拟化方法，其特征在于，包括以下步骤：/n向基于指令集架构的深度神经网络加速器架构引入两级指令调度器和硬件资源池，以构建基于指令集架构的深度神经网络加速器虚拟化架构；/n根据所述基于指令集架构的深度神经网络加速器虚拟化架构，将完整编译流程划分为静态编译和动态编译；以及/n在所述静态编译第一次部署时生成细粒度指令包，当所述动态编译重配置时，对所述细粒度指令包进行整合，快速生成需求指令文件。/n

【技术特征摘要】
1.一种面向云端深度学习推理的FPGA虚拟化方法，其特征在于，包括以下步骤：
向基于指令集架构的深度神经网络加速器架构引入两级指令调度器和硬件资源池，以构建基于指令集架构的深度神经网络加速器虚拟化架构；
根据所述基于指令集架构的深度神经网络加速器虚拟化架构，将完整编译流程划分为静态编译和动态编译；以及
在所述静态编译第一次部署时生成细粒度指令包，当所述动态编译重配置时，对所述细粒度指令包进行整合，快速生成需求指令文件。

2.根据权利要求1所述的面向云端深度学习推理的FPGA虚拟化方法，其特征在于，所述两级指令调度器包括第一级指令调度器和第二指令调度器。

3.根据权利要求2所述的面向云端深度学习推理的FPGA虚拟化方法，其特征在于，所述第一级指令调度器用于负责任务级的指令缓存与调度、上下文切换的任务级信息收发，并控制管理所述第二级指令调度器。

4.根据权利要求2所述的面向云端深度学习推理的FPGA虚拟化方法，其特征在于，所述第二级指令调度器用于负责所述硬件资...

【专利技术属性】
技术研发人员：曾书霖，戴国浩，汪玉，杨华中，
申请(专利权)人：清华大学，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人