处理器制造技术

技术编号:39506668 阅读:12 留言:0更新日期:2023-11-25 18:41
本披露公开了一种处理器

【技术实现步骤摘要】
处理器、芯片、板卡及方法


[0001]本披露一般地涉及处理器领域

更具体地,本披露涉及一种支持融合运算的处理器

芯片

板块及利用处理器执行融合运算的方法


技术介绍

[0002]传统的处理器,例如中央处理器
(CPU)、
图形处理器
(GPU)、
数字信号处理器
(DSP)
等,在进行数据运算时,一条指令只能够完成一个操作运算

例如,加法指令完成一次加法运算
result

a+b
,乘法指令完成一次乘法运算
result

a*b。
当需要进行复杂运算时,例如
result

(a+b)*c
,那么就需要两条运算指令才能完成上述运算,即第一条指令完成
tmp

a+b
,第二条指令完成
result

tmp*c。
[0003]上述解决方案在处理融合运算时,将导致频繁的存储器读写问题

此外,一条指令只能利用一种运算单元,无法充分利用运算单元的资源,导致算力浪费

因此,亟需一种能够有效地支持融合运算的处理器


技术实现思路

[0004]为了至少部分地解决
技术介绍
中提到的一个或多个技术问题,本披露的方案提供了一种支持融合运算的处理器

>芯片

板块及利用处理器执行融合运算的方法

[0005]在第一方面中,本披露公开一种处理器,包括存储器

控制器和运算器,其中:所述存储器用于存储运算所需的源数据和最终运算结果;所述控制器用于对融合运算指令进行译码,以及控制所述存储器和所述运算器执行所述融合运算指令,其中所述融合运算指令至少指示对源数据执行包括多个算子的融合运算;以及所述运算器用于在所述控制器的控制下,获取来自所述存储器的源数据以执行所述融合运算,并将最终运算结果写回到所述存储器,其中在所述融合运算中,算子所需的运算数据包括来自所述运算器的中间运算结果

[0006]在第二方面中,本披露提供一种芯片,包括前述第一方面任一实施例的处理器

[0007]在第三方面中,本披露提供一种板卡,包括前述第二方面任一实施例的芯片

[0008]在第四方面中,本披露提供一种由前述第一方面任一实施例的处理器执行融合运算的方法

[0009]通过如上所提供的处理器

芯片

板卡和方法,本披露实施例提供了一种有效支持融合运算的硬件架构及在其上执行融合运算的方案,其能够减少对存储器的读写操作,降低读写存储器的功耗

进一步地,在某些场景下,可以采用流水方式调度处理器中的运算电路,从而充分利用运算电路的资源,通过并行运算提高机器的处理效率

附图说明
[0010]通过参考附图阅读下文的详细描述,本披露示例性实施方式的上述以及其他目的

特征和优点将变得易于理解

在附图中,以示例性而非限制性的方式示出了本披露的若
干实施方式,并且相同或对应的标号表示相同或对应的部分,其中:
[0011]图1示出本披露实施例的板卡的结构图;
[0012]图2示出本披露实施例的组合处理装置的结构图;
[0013]图3示出本披露实施例的计算装置的内部结构示意图;
[0014]图4示出根据本披露另一实施例的处理器的示意性结构框图;
[0015]图5示出了融合运算中的链式运算结构和多分支运算结构的示例;
[0016]图
6a


6b
示出根据本披露实施例的处理器针对链式运算结构的处理流程;以及
[0017]图7示出根据本披露实施例的处理器采用流水控制融合运算处理的示例性过程

具体实施方式
[0018]下面将结合本披露实施例中的附图,对本披露实施例中的技术方案进行清楚

完整地描述,显然,所描述的实施例是本披露一部分实施例,而不是全部的实施例

基于本披露中的实施例,本领域技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本披露保护的范围

[0019]应当理解,本披露的权利要求

说明书及附图中可能出现的术语“第一”、“第二”、“第三”和“第四”等是用于区别不同对象,而不是用于描述特定顺序

本披露的说明书和权利要求书中使用的术语“包括”和“包含”指示所描述特征

整体

步骤

操作

元素和
/
或组件的存在,但并不排除一个或多个其它特征

整体

步骤

操作

元素

组件和
/
或其集合的存在或添加

[0020]还应当理解,在本披露说明书中所使用的术语仅仅是出于描述特定实施例的目的,而并不意在限定本披露

如在本披露说明书和权利要求书中所使用的那样,除非上下文清楚地指明其它情况,否则单数形式的“一”、“一个”及“该”意在包括复数形式

还应当进一步理解,在本披露说明书和权利要求书中使用的术语“和
/
或”是指相关联列出的项中的一个或多个的任何组合以及所有可能组合,并且包括这些组合

[0021]如在本说明书和权利要求书中所使用的那样,术语“如果”可以依据上下文被解释为“当
...
时”或“一旦”或“响应于确定”或“响应于检测到”。
[0022]下面结合附图来详细描述本披露的具体实施方式

[0023]图1示出本披露实施例的一种板卡
10
的结构示意图

如图1所示,板卡
10
包括芯片
101
,其是一种系统级芯片
(System on Chip

SoC)
,或称片上系统,集成有一个或多个组合处理装置,组合处理装置是一种人工智能运算单元,用以支持各类深度学习和机器学习算法,满足计算机视觉

语音

自然语言处理

数据挖掘等领域复杂场景下的智能处理需求

特别是深度学习技术大量应用在云端智能领域,云端智能应用的一个显著特点是输入数据量大,对平台的存储能力和计算能力有很高的要求,此实施例的板卡
10
适用在云端智能应用,具有庞本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.
一种处理器,包括存储器

控制器和运算器,其中:所述存储器用于存储运算所需的源数据和最终运算结果;所述控制器用于对融合运算指令进行译码,以及控制所述存储器和所述运算器执行所述融合运算指令,其中所述融合运算指令至少指示对源数据执行包括多个算子的融合运算;以及所述运算器用于在所述控制器的控制下,获取来自所述存储器的源数据以执行所述融合运算,并将最终运算结果写回到所述存储器,其中在所述融合运算中,算子所需的运算数据包括来自所述运算器的中间运算结果
。2.
根据权利要求1所述的处理器,其中所述运算器包括多个运算电路,所述多个运算电路之间以及所述多个运算电路和所述存储器之间通过连接电路进行数据交互,所述运算电路用于执行所述融合运算中的算子
。3.
根据权利要求2所述的处理器,其中所述融合运算包括多个算子构成的链式运算结构,在所述运算器中,执行所述链式运算结构中的中间算子的运算电路用于:经由所述连接电路接收用于对应算子的对应源数据,从执行前一算子的运算电路接收其中间运算结果,对所述对应源数据和所述中间运算结果执行所述对应算子的运算,并将运算结果发送给执行下一算子的运算电路
。4.
根据权利要求3所述的处理器,其中当所述融合运算为对
T
批数据执行所述融合运算,并且所述融合运算分配在
N
个运算电路上执行时,
T>1

N>1
,所述控制器进一步用于:控制所述存储器发送所述
T
批数据中的对应源数据以支持所述
N
个运算电路同时针对不同批的数据执行相应的算子
。5.
根据权利要求4所述的处理器,其中所述控制器用于在当前运算周期,控制执行第
i
个算子的第
i
个运算电路针对第
j
批对应源数据以及来自第
i
‑1个运算电路上一运算周期的中间运算结果,执行针对第
j
批对应源数据的第
i
个算子的运算,其中
...

【专利技术属性】
技术研发人员:请求不公布姓名
申请(专利权)人:上海寒武纪信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1