人工智能加速方法及器件、芯片、电子设备、存储介质技术

技术编号:38819798 阅读:17 留言:0更新日期:2023-09-15 19:59
本申请实施例公开了一种人工智能加速器,人工智能加速器布局规则,包括:控制器、k级数据调度单元和第一直接存储器访问DMA接口;控制器、k级数据调度单元中第k级数据调度单元至第一级数据调度单元,依次纵向排列;第一DMA接口部署在第k级数据调度单元上,第一DMA接口与控制器连接,用于接收控制器发送的数据调度命令;k级数据调度单元之间建立有第一传播链路,用于将数据调度命令从第k级数据调度单元反向传播至第一级数据调度单元,再将数据调度命令从第一级数据调度单元正向传播至第k级数据调度单元;k级数据调度单元的每级数据调度单元,用于在数据调度命令正向传播至单元内的情况下,按照数据调度命令中对应的子命令,执行数据调度操作。据调度操作。据调度操作。

【技术实现步骤摘要】
人工智能加速方法及器件、芯片、电子设备、存储介质


[0001]本申请实施例涉及数据处理
,尤其涉及一种人工智能加速方法及器件、芯片、电子设备、存储介质。

技术介绍

[0002]目前,人工智能加速器的架构主要包含了卷积处理阵列,数据调度单元,控制器等。
[0003]对于人工智能加速器而言,如图1所示,为了实现数据高效流动,例如,对于卷积处理阵列的运算单元E而言,其可以在自身根据第二级数据调度单元D提供的图像数据产生对应的运算结果的同时,接收到运算单元C的运算结果,必须将控制器设计在右下方,与第一级数据调度单元B连接,从而导致整个人工智能加速器的布局并不规则,这样,部署人工智能加速器的芯片后端的布局布线难度较大,面积利用率低。

技术实现思路

[0004]本申请实施例提供一种人工智能加速方法及器件、芯片、电子设备、存储介质。
[0005]本申请实施例的技术方案是这样实现的:
[0006]本申请实施例提供了一种人工智能加速器,所述人工智能加速器布局规则,包括:控制器、k级数据调度单元和第一直接存储器访问DMA接口,k为大于1的自然数;
[0007]所述控制器、所述k级数据调度单元中第k级数据调度单元至第一级数据调度单元,依次纵向排列;
[0008]所述第一DMA接口部署在所述第k级数据调度单元上,所述第一DMA接口与所述控制器连接,用于接收所述控制器发送的数据调度命令;
[0009]所述k级数据调度单元之间建立有第一传播链路,用于将所述数据调度命令从所述第k级数据调度单元反向传播至所述第一级数据调度单元,再将所述数据调度命令从所述第一级数据调度单元正向传播至所述第k级数据调度单元;
[0010]所述k级数据调度单元的每级数据调度单元,用于在所述数据调度命令正向传播至单元内的情况下,按照所述数据调度命令中对应的子命令,执行数据调度操作。
[0011]在上述人工智能加速器中,还包括:卷积处理阵列;
[0012]所述卷积处理阵列包括k行运算单元,每行运算单元与所述k级数据调度单元中一级数据调度单元并排;
[0013]所述k级数据调度单元的每级数据调度单元,与并排的一行运算单元中相邻的一个运算单元相连,具体用于按照所述数据调度命令中对应的子命令,读取对应的图像数据,并将对应的图像数据传播至相连的运算单元;每个数据调度单元对应的图像数据,为特征图像在一个输入通道上的数据;
[0014]所述k行运算单元的每行运算单元中,与数据调度单元相连的运算单元,用于将获得的图像数据依次横向传播至同一行的每个运算单元中,以实现同一行的运算单元获得同
一图像数据。
[0015]在上述人工智能加速器中,还包括:累加器;
[0016]所述k行运算单元中,与第一级数据调度单元并排的为第一行运算单元,与第k级数据调度单元并排的为第k行运算单元;
[0017]所述累加器,与所述控制器并排,且与所述第k行运算单元相邻;所述第k行运算单元的每个运算单元与所述累加器相连;
[0018]所述第一行运算单元的每个运算单元,用于对获得的图像数据进行乘累加运算,并将运算得到的运算结果输出至下一行同一列的运算单元;
[0019]所述k行运算单元中,所述第一行运算单元和所述第k行运算单元之间的每行运算单元的每个运算单元,用于对获得的图像数据进行乘累加运算,并将运算得到的运算结果与上一行同一列的运算单元输出的运算结果累加后,输出至下一行同一列的运算单元;
[0020]所述第k行运算单元的每个运算单元,用于对获得的图像数据进行乘累加运算,并将运算得到的运算结果与上一行同一列的运算单元输出的运算结果累加后,输出至所述累加器。
[0021]在上述人工智能加速器中,还包括:k个存储器;
[0022]所述k个存储器中,每个存储器与所述k级数据调度单元中一级数据调度单元并排且相连;
[0023]所述k级数据调度单元的每级数据调度单元,具体用于从相连的存储器中读取对应的图像数据。
[0024]在上述人工智能加速器中,所述第一DMA接口,还用于接收初始化信息;
[0025]所述第一传播链路,还用于将所述初始化信息从所述第k级数据调度单元反向传播至所述第一级数据调度单元;
[0026]所述k级数据调度单元的每级数据调度单元,还用于在所述初始化信息反向传播至单元内的情况下,针对相连的存储器,利用所述初始化信息中对应的子信息进行初始化。
[0027]在上述人工智能加速器中,还包括:第二DMA接口;
[0028]所述第二DMA接口部署在所述第k级数据调度单元上,用于接收初始化信息;
[0029]所述k级数据调度单元之间建立有第二传播链路,所述第二传播链路,用于将所述初始化信息从所述第k级数据调度单元反向传播至所述第一级数据调度单元;
[0030]所述k级数据调度单元的每级数据调度单元,还用于在所述初始化信息反向传播至单元内的情况下,针对相连的存储器,利用所述初始化信息中对应的子信息进行初始化。
[0031]本申请实施例提供了一种人工智能加速方法,应用于人工智能加速器,所述人工智能加速器布局规则,包括:控制器、k级数据调度单元和第一直接存储器访问DMA接口,k为大于1的自然数;所述控制器、所述k级数据调度单元中第k级数据调度单元至第一级数据调度单元,依次纵向排列,所述第一DMA接口部署在所述第k级数据调度单元上,所述第一DMA接口与所述控制器连接,所述k级数据调度单元之间建立有第一传播链路,所述方法包括:
[0032]利用所述第一DMA接口,接收所述控制器发送的数据调度命令;
[0033]利用所述第一传播链路,将所述数据调度命令从所述第k级数据调度单元反向传播至所述第一级数据调度单元,再将所述数据调度命令从所述第一级数据调度单元正向传播至所述第k级数据调度单元;
[0034]利用所述k级数据调度单元的每级数据调度单元,在所述数据调度命令正向传播至单元内的情况下,按照所述数据调度命令中对应的子命令,执行数据调度操作。
[0035]本申请实施例提供了一种芯片,包括上述人工智能加速器。
[0036]本申请实施例提供了一种电子设备,包括:人工智能加速器、用于存储能够在所述人工智能加速器上运行的计算机程序的存储器和通信总线;
[0037]所述通信总线,用于实现所述人工智能加速器与所述存储器之间的通信连接;
[0038]所述人工智能加速器,用于执行所述存储器中存储的所述计算机程序,以实现上述人工智能加速方法。
[0039]本申请实施例提供了一种计算机可读存储介质,其上存储有计算机程序,其特征在于,该计算机程序被处理器执行时实现上述人工智能加速方法。
[0040]本申请实施例提供了一种人工智能加速方法及器件、芯片、电子设备、存储介质,人工智能加速器布局规则,包括:控制器、k级数据调度单元和第一直接存储器访问DMA接口,k为大于1的自本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种人工智能加速器,其特征在于,所述人工智能加速器布局规则,包括:控制器、k级数据调度单元和第一直接存储器访问DMA接口,k为大于1的自然数;所述控制器、所述k级数据调度单元中第k级数据调度单元至第一级数据调度单元,依次纵向排列;所述第一DMA接口部署在所述第k级数据调度单元上,所述第一DMA接口与所述控制器连接,用于接收所述控制器发送的数据调度命令;所述k级数据调度单元之间建立有第一传播链路,用于将所述数据调度命令从所述第k级数据调度单元反向传播至所述第一级数据调度单元,再将所述数据调度命令从所述第一级数据调度单元正向传播至所述第k级数据调度单元;所述k级数据调度单元的每级数据调度单元,用于在所述数据调度命令正向传播至单元内的情况下,按照所述数据调度命令中对应的子命令,执行数据调度操作。2.根据权利要求1所述的人工智能加速器,其特征在于,还包括:卷积处理阵列;所述卷积处理阵列包括k行运算单元,每行运算单元与所述k级数据调度单元中一级数据调度单元并排;所述k级数据调度单元的每级数据调度单元,与并排的一行运算单元中相邻的一个运算单元相连,具体用于按照所述数据调度命令中对应的子命令,读取对应的图像数据,并将对应的图像数据传播至相连的运算单元;每个数据调度单元对应的图像数据,为特征图像在一个输入通道上的数据;所述k行运算单元的每行运算单元中,与数据调度单元相连的运算单元,用于将获得的图像数据依次横向传播至同一行的每个运算单元中,以实现同一行的运算单元获得同一图像数据。3.根据权利要求2所述的人工智能加速器,其特征在于,还包括:累加器;所述k行运算单元中,与第一级数据调度单元并排的为第一行运算单元,与第k级数据调度单元并排的为第k行运算单元;所述累加器,与所述控制器并排,且与所述第k行运算单元相邻;所述第k行运算单元的每个运算单元与所述累加器相连;所述第一行运算单元的每个运算单元,用于对获得的图像数据进行乘累加运算,并将运算得到的运算结果输出至下一行同一列的运算单元;所述k行运算单元中,所述第一行运算单元和所述第k行运算单元之间的每行运算单元的每个运算单元,用于对获得的图像数据进行乘累加运算,并将运算得到的运算结果与上一行同一列的运算单元输出的运算结果累加后,输出至下一行同一列的运算单元;所述第k行运算单元的每个运算单元,用于对获得的图像数据进行乘累加运算,并将运算得到的运算结果与上一行同一列的运算单元输出的运算结果累加后,输出至所述累加器。4.根据权利要求2所述的人工智能加速器,其特征在于,还包括:k个存储器;所述k个存储器中,每个存储器与所述k级数据调度单元中一级数据调度...

【专利技术属性】
技术研发人员:祝叶华孙炜
申请(专利权)人:OPPO广东移动通信有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1