调度器、操作调度器的方法以及包括调度器的加速器设备技术

技术编号：31229325 阅读：18 留言：0更新日期：2021-12-08 09:57

公开了调度器、操作调度器的方法以及包括调度器的加速器设备。一种操作调度器以对将在加速器中执行的模型执行调度的方法，所述方法包括：接收对在加速器中彼此独立地执行的第一模型和第二模型的至少一个执行请求；以及基于第一模型和第二模型的工作负载特性，对第一模型和第二模型执行以层为单位的调度。型和第二模型执行以层为单位的调度。型和第二模型执行以层为单位的调度。

全部详细技术资料下载

【技术实现步骤摘要】
调度器、操作调度器的方法以及包括调度器的加速器设备
[0001]本申请要求于2020年6月1日在韩国知识产权局提交的第10
‑
2020
‑
0065626号韩国专利申请的权益，所述韩国专利申请的全部公开出于所有目的通过引用包含于此。

[0002]下面的描述涉及调度器、操作调度器的方法以及包括调度器的加速器设备。

技术介绍

[0003]随着人工智能(AI)技术的发展，对仅用于AI的执行推断和学习的独立硬件的需求正在增加。因此，正在开发各种装置作为专用于实现AI的硬件。
[0004]这样的用于AI的专用硬件可由例如可被改变用途的中央处理器(CPU)、图形处理器(GPU)、现场可编程门阵列(FPGA)和专用集成电路(ASIC)来实现。

技术实现思路

[0005]提供本
技术实现思路
以便以简化的形式介绍将在下面的具体实施方式中进一步描述的构思的选择。本
技术实现思路
不意在确定要求权利的主题的关键特征或必要特征，也不意在用于帮助确定要求权利的主题的范围。
[0006]在一个总体方面，提供了一种调度加速器的方法，所述方法包括：接收对在加速器中彼此独立地执行的第一模型和第二模型的至少一个执行请求；以及基于第一模型和第二模型的工作负载特性，对第一模型和第二模型执行以层为单位的调度。
[0007]执行以层为单位的调度的步骤可包括：独立于所述至少一个执行请求被接收的顺序，对第一模型和第二模型执行以层为单位的调度。
[0008]第一模型和第二模型中的一个...

【技术保护点】

【技术特征摘要】
1.一种调度加速器的方法，所述方法包括：接收对在加速器中彼此独立地执行的第一模型和第二模型的至少一个执行请求；以及基于第一模型和第二模型的工作负载特性，对第一模型和第二模型执行以层为单位的调度。2.根据权利要求1所述的方法，其中，执行以层为单位的调度的步骤包括：独立于所述至少一个执行请求被接收的顺序，对第一模型和第二模型执行以层为单位的调度。3.根据权利要求1所述的方法，其中，第一模型和第二模型中的一个具有计算成本大于存储器访问成本的工作负载特性，并且第一模型和第二模型中的另一个具有存储器访问成本大于计算成本的工作负载特性。4.根据权利要求1所述的方法，其中，执行以层为单位的调度的步骤包括：响应于第一模型和第二模型具有相同的工作负载特性，执行以层为单位的调度，使得包括在第一模型中的层和包括在第二模型中的层以预定时间差或以包括在第一模型中的层与包括在第二模型中的层之间的时间间隔被处理。5.根据权利要求1至权利要求4中任意一项所述的方法，其中，执行以层为单位的调度的步骤包括：将第一模型和第二模型中的每个中的层之中的具有不同工作负载特性的两个层分别分配给加速器的计算资源和加速器的存储器访问资源。6.根据权利要求1至权利要求4中任意一项所述的方法，其中，执行以层为单位的调度的步骤包括：响应于第一模型的第n层被分配给加速器的计算资源，将第一模型中的第n层之后的第n+1层或第二模型中的随后将被处理的第m层分配给加速器的存储器访问资源，其中，n和m为正整数。7.根据权利要求6所述的方法，其中，被分配给加速器的计算资源的第n层具有与被分配给加速器的存储器访问资源的第n+1层或第m层的工作负载特性不同的工作负载特性。8.根据权利要求1至权利要求4中任意一项所述的方法，其中，执行以层为单位的调度的步骤包括：基于第一模型和第二模型的每个层的工作负载特性以及加速器的硬件资源，对第一模型和第二模型执行以层为单位的调度。9.根据权利要求1至权利要求4中任意一项所述的方法，其中，执行以层为单位的调度的步骤包括：通过使用加速器的内部存储器中的重用的第一模型和第二模型中的每个的中间数据，来对第一模型和第二模型执行以层为单位的调度。10.根据权利要求1至权利要求4中任意一项所述的方法，其中，执行以层为单位的调度的步骤包括：通过在搜索路径的处理中基于直到前一步骤中的最优调度结果确定当前步骤中的最优调度结果，来对第一模型和第二模型执行以层为单位的调度，所述路径指示从包括在第一模型和第二模型中的每个中的输入层到包括在第一模型和第二模型中的每个中的输出层的执行顺序。
11.根据权利要求1至权利要求4中任意一项所述的方法，其中，第一模型和第二模型在加速器中被执行时彼此不具有数据依赖性。12.根据权利要求1至权利要求4中任意一项所述的方法，其中，加速器的硬件资源包括：基于包括在加速器中的至少一个处理元件的计算资源和基于加速器的内部存储器和/或外部存储器的存储器访问资...

【专利技术属性】
技术研发人员：李承昱，李宰旭，吴永皖，金成学，咸台俊，
申请(专利权)人：首尔大学校产学协力团，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人