基于数据流架构的加速器、加速器的数据存取方法及设备技术

技术编号:33031750 阅读:28 留言:0更新日期:2022-04-15 09:08
本发明专利技术实施例公开了一种基于数据流架构的加速器、加速器的数据存取方法及设备。该加速器包括:存储单元、读写地址生成单元及计算单元;其中,存储单元包括多个存储库;读写地址生成单元用于根据预设读写并行度生成存储单元读写地址,以根据存储单元读写地址确定存储单元中的目标存储库,并从目标存储库中读取待处理数据到计算单元进行运算;计算单元包括多个数据通路,用于根据预设计算并行度确定目标数据通路,以使用目标数据通路对待处理数据进行运算得到处理后数据,并根据存储单元读写地址将处理后数据存储至目标存储库中,从而减少了加速器的带宽需求、数据存储需求和运行时间,同时也降低了加速器的功耗。同时也降低了加速器的功耗。同时也降低了加速器的功耗。

【技术实现步骤摘要】
基于数据流架构的加速器、加速器的数据存取方法及设备


[0001]本专利技术实施例涉及数据处理
,尤其涉及一种基于数据流架构的加速器、加速器的数据存取方法及设备。

技术介绍

[0002]近年来的研究表明,与传统的特征提取算法相比,神经网络算法在计算机视觉领域具有很大的优势。神经网络在图像、语音、视频识别等领域得到了广泛的应用,但是神经网络算法的计算和存储复杂性给其应用带来了很大的困难。CPU平台很难提供足够的计算能力,GPU平台是神经网络处理的首选平台,其运算能力强,开发框架简单易用,但是,GPU处理神经网络时,对计算资源利用率低,很大一部分时间内,计算单元处于空闲状态。为提高计算资源的利用率,基于数据流架构的加速器被提出,此架构中,数据传输和计算可并行,不同的计算单元也可并行执行。
[0003]为获得更大的算力,基于数据流架构的加速器需要增加取数和计算的并行度。在传统的基于数据流架构的加速器中,取数和计算的并行度固定。当数据没有对齐到固定的并行度时,需填充部分零,将数据对齐到固定并行度。进行零填充后,将会增加需传输的数据量,进而增本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于数据流架构的加速器,其特征在于,包括:存储单元、读写地址生成单元及计算单元;其中,所述存储单元包括多个存储库;所述读写地址生成单元用于根据预设读写并行度生成存储单元读写地址,以根据所述存储单元读写地址确定所述存储单元中的目标存储库,并从所述目标存储库中读取待处理数据到所述计算单元进行运算;所述计算单元包括多个数据通路,用于根据预设计算并行度确定目标数据通路,以使用所述目标数据通路对所述待处理数据进行运算得到处理后数据,并根据所述存储单元读写地址将所述处理后数据存储至所述目标存储库中。2.根据权利要求1所述的基于数据流架构的加速器,其特征在于,所述存储库的数量为所述预设读写并行度的整数倍。3.根据权利要求1所述的基于数据流架构的加速器,其特征在于,所述读写地址生成单元还用于生成所述目标存储库的使能信号,以使所述目标存储库读写使能开启。4.根据权利要求1所述的基于数据流架构的加速器,其特征在于,所述计算单元还用于生成所述目标数据通路的使能信号,以使所述目标数据通路使能开启。5.根据权利要求1所述的基于数据流架构的加速器,其特征在于,所述预设读写并行度包括预设读取并行度和预设写入并行度;相应的,所述存储单元读写地址包括存储单元读地址和存储单元写地址,所述目标存储库包括目标读存储库和目标写存储库;所述读写地址生成单元具体用于根据所述预设读取并行度生成所述存储单元读地址,以及根据所述预设写入并行度生成所述存储单元写地址,以根据所述存储单元读地址确定所述目标读存储库,并从所述目标读存储库中读取待处理数据到所述计算单元进行运算;所述计算单元具体用于使用所述目标数据通路对所述待处理数据进行运算得到所述处理后数据,并根据所述存储单元写...

【专利技术属性】
技术研发人员:曾成龙蔡权雄牛昕宇
申请(专利权)人:深圳鲲云信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1