一种轻量化通用图形处理器的实现方法技术

技术编号:41920336 阅读:16 留言:0更新日期:2024-07-05 14:20
本发明专利技术涉及通用图形处理器技术领域,特别涉及一种轻量化通用图形处理器的实现方法。该轻量化通用图形处理器的实现方法,基于开放计算语言OpenCL编程框架与RISC‑V第五代精简指令集,采用单指令多线程SIMT计算模型,同时采用高带宽存储器HBM高速缓存作为全局内存,实现轻量化的通用图形处理器的快速部署。该轻量化通用图形处理器的实现方法,采用此流水线模式,最大限度的降低了内存的使用率和软件的复杂度,提高了硬件资源利用率、降低了能耗,实现了更高的能效比;同时,基于RISC‑V指令集更易部署开发,具有灵活的可裁剪性及适配性。

【技术实现步骤摘要】

本专利技术涉及通用图形处理器,特别涉及一种轻量化通用图形处理器的实现方法


技术介绍

1、近年来随着人工智能的兴起,其中涉及大量的数据处理和模型训练。深度学习作为人工智能中常用的方法,需要对大量数据进行矩阵运算,因此涉及大量的并行化、向量化运算。

2、与传统中央处理器cpu相比,通用图形处理器(gpgpu)是一种利用处理器众核结构、多线程和高访存带宽的特点来处理高性能计算任务的处理器,具有更多的计算单元和更高的带宽来执行并行化、向量化运算。然而,大量的计算核心也意味着高功耗,如何平衡性能与功耗已逐渐成为当前通用图形处理器的主要优化方向。

3、针对主流通用图形处理器能效比低的问题,本专利技术提出了一种轻量化通用图形处理器的实现方法。


技术实现思路

1、本专利技术为了弥补现有技术的缺陷,提供了一种简单高效的轻量化通用图形处理器的实现方法。

2、本专利技术是通过如下技术方案实现的:

3、一种轻量化通用图形处理器的实现方法,基于开放计算语言opencl(opencomp本文档来自技高网...

【技术保护点】

1.一种轻量化通用图形处理器的实现方法,其特征在于:基于开放计算语言OpenCL编程框架与RISC-V第五代精简指令集,采用单指令多线程SIMT计算模型,同时采用高带宽存储器HBM高速缓存作为全局内存高带宽存储器HBM;

2.根据权利要求1所述的轻量化通用图形处理器的实现方法,其特征在于:所述主机端负责实现数据交互、资源分配和设备管理;

3.根据权利要求1或2所述的轻量化通用图形处理器的实现方法,其特征在于:所述通用图形处理器内核在设备端执行时的每个实例称为一个工作项或一个线程,若干实例组织为一个线程束,同一个线程束中的线程并行执行。

<p>4.根据权利要求...

【技术特征摘要】

1.一种轻量化通用图形处理器的实现方法,其特征在于:基于开放计算语言opencl编程框架与risc-v第五代精简指令集,采用单指令多线程simt计算模型,同时采用高带宽存储器hbm高速缓存作为全局内存高带宽存储器hbm;

2.根据权利要求1所述的轻量化通用图形处理器的实现方法,其特征在于:所述主机端负责实现数据交互、资源分配和设备管理;

3.根据权利要求1或2所述的轻量化通用图形处理器的实现方法,其特征在于:所述通用图形处理器内核在设备端执行时的每个实例称为一个工作项或一个线程,若干实例组织为一个线程束,同一个线程束中的线程并行执行。

4.根据权利要求1所述的轻量化通用图形处理器的实现方法,其特征在于:所述risc-v第五代精简指令处理器单元采用经典五级流水线,包括线程调度子单元、取指子单元、译码子单元、派遣子单元和写回子单元。

5.根据权利要求3所述的轻量化通用图形处理器的实现方法,其特征在于:所述主机端产生并行计算任务,通过调用开放计算语言opencl编程框架集成的通用图形处理器内核应用程序编程接口api函数,将指令参数通过直接内存访问xdma技术传输给设备端上部署的通用图形处理器内核,并将待运算压缩数据从主机内存传输到全局内存高带宽存储器hbm,并通过赛灵思运行时应用程序编程接口xilinx runtime api生成启动信号,运行通用图形处理器内核。

6.根据权利要求5所述的轻量化通用图形处理器的...

【专利技术属性】
技术研发人员:李乐乐郭鑫斐王帅赵鑫鑫姜凯
申请(专利权)人:山东浪潮科学研究院有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1