【技术实现步骤摘要】
一种晶圆级架构AI加速芯片的任务调度方法及介质
[0001]本专利技术涉及云计算
,特别涉及一种晶圆级架构
AI
加速芯片的任务调度方法及介质
。
技术介绍
[0002]大语言模型是一种基于神经网络的自然语言处理技术,其可以理解
、
生成人类语言,进而实现智能对话
、
文本生成
、
翻译等功能
。
近年来,大语言模型如生成预训练模型
(GPT
‑3,
Generative Pretrained Transformer)
等获得了突破性进展,使得及其能够理解人类语言,甚至可以写成一些具有创造性的文本,引领人工智能进入了一个新的阶段
。
大语言模型基于深度学习技术,利用神经网络对大量文本数据进行训练,在训练过程中,模型会不断地学习语言的规律,包括词汇
、
语法
、
以及逻辑等,通过学习逐渐掌握人类语言的复杂性,从而可以生成符合语言规则的文本
。GPT
‑3的核心结构为“Transformer”,是一种基于自注意力机制的特殊神经网络架构,
GPT
‑3的参数量多达
1750
亿,因此其训练所需要的计算芯片数量可达上千块,且训练时长通常需要数月之久
。
[0003]为了提高训练效率,有研究提出了一种晶圆级架构
。
例如特斯拉公司开发的道场
(Dojo)
超级计
【技术保护点】
【技术特征摘要】 【专利技术属性】
1.
一种晶圆级架构
AI
加速芯片的任务调度方法,其特征在于,包括步骤:将计算任务转换为计算图;对所述计算图进行切分,以获取至少一个切分方案,每个切分方案包括对所述计算图进行切分得到的至少一个计算子图;对芯片的计算资源进行划分,以获取至少一个计算资源划分方案,每个计算资源划分方案包括对所述芯片的计算资源进行划分得到的至少一个子网格,且每个子网格包括至少一个计算核;将切分方案与计算资源划分方案进行匹配,以获取至少一个匹配方案,每个匹配方案包括切分方案中的各个计算子图及其对应的子网格;以及根据代价模块,获取效率最优的匹配方案
。2.
如权利要求1所述的任务调度方法,其特征在于,将所述计算图切分包括步骤:在计算图中插入标记节点,对所述计算图进行切分
。3.
如权利要求1所述的任务调度方法,其特征在于,对芯片的计算资源进行划分包括步骤:将所述芯片的计算核划分为至少一个矩形区域,其中每个矩形区域的尺寸相同或不同,且每个矩形区域中包括至少一个计算核
。4.
如权利要求1所述的任务调度方法,其特征在于,获取一个效率最优的匹配方案包括步骤:根据代价模型,遍历计算每个匹配方案的代价,并选取代价最小的一个匹配方案执行所述计算任务
。5.
如权利要求1所述的任务调度方法,其特征在于,获取一个效率最优的匹配方案包括步骤:训练启发式搜索模型;以及采用所述启发式搜索模型,基于所述切分方案
、
计算资源划分方案
、
匹配方案构成的解空间,获取最优匹配方案
。6.
如权利要求1所述的任务调度方法,其特征在于,还包括步骤:在所述最优匹配方案的每个子网格内对计算子图进行张量切分,以获取至少一个任务调度方案,并根据代价模型确定效率最优的任务调度方案
技术研发人员:代旭,姜申飞,胡杨,韩慧明,王磊,郝培霖,
申请(专利权)人:清华大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。