深度学习加速方法及器件、芯片、计算设备、存储介质技术

技术编号:31748643 阅读:28 留言:0更新日期:2022-01-05 16:29
本申请实施例公开了一种深度学习加速方法及器件、芯片、计算设备、存储介质,深度学习加速器包括:至少一个数据生成模块;至少一个数据消费模块;邮箱群组,包括多个邮箱模块;数据缓冲群组,包括多个数据缓冲区,邮箱群组中每个邮箱模块,与数据缓冲群组中一个数据缓冲区对应;其中,基于在深度学习加速器上执行的预设神经网络的网络结构确定的管理配置信息,邮箱群组被配置成:邮箱群组中的每个邮箱模块与对应的数据生成模块、数据消费模块和数据缓冲区分别连接;以及,数据缓冲群组中每个数据缓冲区,还与对应同一邮箱模块的数据生成模块和数据消费模块分别连接。和数据消费模块分别连接。和数据消费模块分别连接。

【技术实现步骤摘要】
深度学习加速方法及器件、芯片、计算设备、存储介质


[0001]本申请实施例涉及数据缓存
,尤其涉及一种深度学习加速方法及器件、芯片、计算设备、存储介质。

技术介绍

[0002]随着人工智能网络探索越来越深入,算法网络的结构也变得更加多样化,从算法层面来说,人工智能网络由多个计算节点构成,对于每个计算层,其输入来自于上一个计算层的输出结果,计算层包括卷积,池化,激活,尺寸缩放等运算。
[0003]目前,随着算法网络中各个算法层之间的数据交互更加复杂,基于现有的单一计算层之间的同步机制,构建深度学习加速器,布局较为复杂,配置的灵活性较差且效率较低。

技术实现思路

[0004]本申请实施例提供一种深度学习加速方法及器件、芯片、计算设备、存储介质。
[0005]本申请实施例的技术方案是这样实现的:
[0006]本申请实施例提供了一种深度学习加速器,包括:
[0007]至少一个数据生成模块;
[0008]至少一个数据消费模块;
[0009]邮箱群组,包括多个邮箱模块
[001本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种深度学习加速器,其特征在于,包括:至少一个数据生成模块;至少一个数据消费模块;邮箱群组,包括多个邮箱模块;数据缓冲群组,包括多个数据缓冲区,所述邮箱群组中每个邮箱模块,与所述数据缓冲群组中一个数据缓冲区对应;其中,基于在所述深度学习加速器上执行的预设神经网络的网络结构确定的管理配置信息,所述邮箱群组被配置成:所述邮箱群组中的每个邮箱模块与对应的数据生成模块、数据消费模块和数据缓冲区分别连接,用于与对应的数据生成模块和数据消费模块,交互对应的数据缓冲区的相关信息;以及所述数据缓冲群组中每个数据缓冲区,还与对应同一邮箱模块的数据生成模块和数据消费模块分别连接,支持对应同一邮箱模块的数据生成模块的数据写入操作,以及数据消费模块的数据读取操作。2.根据权利要求1所述的深度学习加速器,其特征在于,还包括:数据总线;所述邮箱群组、所述邮箱群组中每个邮箱模块对应的数据生成模块和数据消费模块、以及所述数据缓冲群组之间,均通过所述数据总线连接。3.根据权利要求2所述的深度学习加速器,其特征在于,所述数据缓冲群组中每个数据缓冲区,通过所述数据总线,接收对应同一邮箱模块的数据生成模块传输的数据,并进行存储;所述数据缓冲群组中每个数据缓冲区,通过所述数据总线,为对应同一邮箱模块的数据消费模块提供可读取的数据。4.根据权利要求2所述的深度学习加速器,其特征在于,还包括:数据辅线;所述邮箱群组、以及所述邮箱群组中,每个邮箱模块对应的数据生成模块和数据消费模块,分别与所述数据辅线连接。5.根据权利要求4所述的深度学习加速器,其特征在于,所述邮箱群组中每个邮箱模块,通过所述数据总线,接收对应的数据生成模块发送的针对对应的数据缓冲区的写入通知信号,并响应于所述写入通知信号,通过所述数据辅线,将对应的数据缓冲区的...

【专利技术属性】
技术研发人员:孙炜祝叶华
申请(专利权)人:OPPO广东移动通信有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1