加速器体系结构的编程方法和系统技术方案

技术编号:24454575 阅读:43 留言:0更新日期:2020-06-10 15:10
本申请提供了一种加速器体系结构的编程方法和系统,该方法包括以下步骤:将结构化数据对象输入到输入数据通道;将输入数据通道内的结构化数据对象拆分为计算核可执行的多个输入原子数据元素,并基于加速器设备内可执行计算任务的计算核数目和计算核之间的数据依赖关系形成包含第一数目的输入原子数据元素的工作组;由可执行所述计算任务的计算核针对所述工作组内所有输入原子数据元素执行运算,得到一组输出原子数据元素;基于所述输出原子数据元素得到输出结构化数据对象,经与计算核连接的输出数据通道输出。本发明专利技术实施例能够更高效地利用专用加速器的硬件资源,提升运算任务的执行效率。

Programming method and system of accelerator architecture

【技术实现步骤摘要】
加速器体系结构的编程方法和系统
本申请涉及计算机体系结构的编程方法和计算机体系结构设计,更具体地涉及一种支持专用计算核的加速器体系结构的编程方法和系统。
技术介绍
在大数据时代下,随着物联网、云计算和互联网等技术的发展,在各类应用场景下产生的大量数据,正在以惊人的规模持续增长和积累。根据国际数据公司(IDC:InternationalDataCooperation)的报告显示,到2020年,全球的数据总量将超过35ZB。大数据背后所蕴含的信息,能够极大地支持人类的科学研究和行业发展。以数据为中心的应用,如何快速从海量数据中挖掘有效信息,成为大数据应用的一大挑战。随着晶体管工艺的提升,量子隧穿效应将成为无法避免的限制,近年来,学界和产业界开始意识到“摩尔定律“即将失效。为解决面向大数据计算的算力问题,高性能计算的研究开始逐渐的转向更为高效的专用并行计算架构,例如半定制的现场可编程门阵列(Field-ProgrammableGateArray,FPGA);专为执行复杂的数学和几何计算的图形处理器(GraphicsProcessingUnit本文档来自技高网...

【技术保护点】
1.一种加速器体系结构的编程方法,其特征在于,该方法包括以下步骤:/n将结构化数据对象输入到输入数据通道;/n将输入数据通道内的结构化数据对象拆分为计算核可执行的多个输入原子数据元素,并基于加速器设备内可执行计算任务的计算核数目和计算核之间的数据依赖关系形成包含第一数目的输入原子数据元素的工作组;/n由可执行所述计算任务的计算核针对所述工作组内所有输入原子数据元素执行运算,得到一组输出原子数据元素;/n基于所述输出原子数据元素得到输出结构化数据对象,经与计算核连接的输出数据通道输出。/n

【技术特征摘要】
1.一种加速器体系结构的编程方法,其特征在于,该方法包括以下步骤:
将结构化数据对象输入到输入数据通道;
将输入数据通道内的结构化数据对象拆分为计算核可执行的多个输入原子数据元素,并基于加速器设备内可执行计算任务的计算核数目和计算核之间的数据依赖关系形成包含第一数目的输入原子数据元素的工作组;
由可执行所述计算任务的计算核针对所述工作组内所有输入原子数据元素执行运算,得到一组输出原子数据元素;
基于所述输出原子数据元素得到输出结构化数据对象,经与计算核连接的输出数据通道输出。


2.根据权利要求1所述的方法,其特征在于,
所述结构化数据对象是能够被加速器直接操作的基本数据单元;
所述输入原子数据元素为计算核执行的计算任务的最小数据单元。


3.根据权利要求1所述的方法,其特征在于,所述方法采用流水线操作,不同计算任务对应工作组内的不同输入原子数据元素,由计算核并行执行。


4.根据权利要求3所述的方法,其特征在于,
在加速器设备内可执行计算任务的计算核之间不存在数据依赖的情况下,所述第一数目等于所述加速器设备内可执行计算任务的计算核的数目。


5.根据权利要求3所述的方法,其特征在于,

【专利技术属性】
技术研发人员:鄢贵海吴婧雅
申请(专利权)人:中科驭数北京科技有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1