基于神经网络反向传播的硬件加速器数据流设计优化方法技术

技术编号：38139671 阅读：8 留言：0更新日期：2023-07-08 09:53

本发明专利技术涉及一种基于神经网络反向传播的硬件加速器数据流设计优化方法，属于神经网络应用中的硬件加速器优化设计，用于减轻设计数据流时的人工工作量。技术方案具体为：将硬件加速器数据流及其伴随的DNN层配置采用编码表示，获取初始数据流代码；将训练好的神经网络预测器的权重固定，将初始数据流代码输入训练好的神经网络预测器，根据设置的目标性能指标，执行可微分的反向传播来搜索优化的数据流代码；所述神经网络预测器采用神经网络模型建立，能够评估所有采样的硬件加速器数据流及其伴随的DNN层配置性能，并形成了具有统一输入的数据集编码表示和性能度量输出。的数据集编码表示和性能度量输出。的数据集编码表示和性能度量输出。

全部详细技术资料下载

【技术实现步骤摘要】
基于神经网络反向传播的硬件加速器数据流设计优化方法

[0001]本专利技术涉及神经网络应用，硬件加速器优化设计，尤其涉及基于神经网络反向传播的硬件加速器数据流设计优化方法。

技术介绍

[0002]深度神经网络(DNN)在许多领域取得了显著突破，如视觉和语言、自动驾驶和生物科学。然而，指数级增长的模型大小通常会增加DNN应用程序的延迟和能耗。与通用硬件处理器相比，DNN加速器在执行DNN时可以实现更高的效率和更低的能量。这是通过设计更合适的微架构和优化DNN的硬件映射策略(称为数据流)来实现的，包括执行DNN层计算的顺序以及这些计算如何映射到硬件资源(例如，处理元件和存储器)。
[0003]设计数据流以实现最佳的片上性能和效率是一项基本但繁琐且具有挑战性的任务。但现有的DNN加速器通常过于专业化，数据流设计不足，阻碍了DNN执行的通用化和效率。

技术实现思路

[0004]为了减轻设计数据流时的人工工作量，也为了能够为DNN应用设计更好的数据流，本专利技术的目的在于提出基于神经网络反向传播的硬件加速器数据流设计优化方法。
[0005]为了实现上述专利技术目的，本专利技术的技术方案如下。
[0006]第一方面，一种基于神经网络反向传播的硬件加速器数据流设计优化方法，所述方法包括下述步骤：
[0007]将硬件加速器数据流及其伴随的DNN层配置采用编码表示，获取初始数据流代码；
[0008]将训练好的神经网络预测器的权重固定，将初始数据流代码输入训练好的神经网络预测器，根...

【技术保护点】

【技术特征摘要】
1.一种基于神经网络反向传播的硬件加速器数据流设计优化方法，其特征在于，所述方法包括下述步骤：将硬件加速器数据流及其伴随的DNN层配置采用编码表示，获取初始数据流代码；将训练好的神经网络预测器的权重固定，将初始数据流代码输入训练好的神经网络预测器，根据设置的目标性能指标，执行可微分的反向传播来搜索优化的数据流代码；所述神经网络预测器采用神经网络模型建立，用于评估所有采样的硬件加速器数据流及其伴随的DNN层配置性能，并形成了具有统一输入的数据集编码表示和性能度量输出。2.根据权利要求1所述的方法，其特征在于，DNN层配置对七个维度进行编码表示，需要编码表示的七个维度分别是输入行/列(Y/X)、滤波器行/列(R/S)、输出/输入通道(K/C)和描述DNN层类型的额外维度(T)。3.根据权利要求1所述的方法，其特征在于，硬件加速器数据流的编码格式为(M，N，2)，共M
×
N
×
2维；M表示设定的硬件加速器的内存级别数，N表示DNN层配置维度数，“2”表示DNN加速器各部分上的编码具有2个方面，一个表示索引相应维度的数字，另一个是索引相应维度对应的伴随数字；索引维度包括输入行/列(Y/X)、滤波器行/列(R/S)、输出/输入通道(K/C)。4.根据...

【专利技术属性】
技术研发人员：许鹏，邵文琪，丁明宇，罗平，乔宇，
申请(专利权)人：上海人工智能创新中心，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人