深度学习加速器性能建模系统、性能测试方法、生成方法技术方案

技术编号:42780791 阅读:20 留言:0更新日期:2024-09-21 00:41
本申请提供了深度学习加速器性能建模系统、性能测试方法、生成方法,其中,深度学习加速器性能建模系统包括:第一输入接口,用于使用统一网络模型描述格式将初始网络模型文件转换为中间网络模型文件,并根据深度学习加速器DLA性能建模框架支持的网络描述自动化解析中间网络模型文件,得到适配DLA性能建模框架的目标网络建模文件;第二输入接口,用于输入硬件架构配置文件,在得到虚拟DLA硬件架构后,使用虚拟DLA硬件架构处理目标网络建模文件所对应的网络模型;分析模型,用于根据虚拟DLA硬件架构处理网络模型的结果,对虚拟DLA硬件架构对应的DLA性能进行分析,解决了相关技术中硬件加速器设计周期长,试错成本高等问题。

【技术实现步骤摘要】

本申请涉及建模领域,尤其涉及深度学习加速器性能建模系统、性能测试方法、生成方法


技术介绍

1、随着人工智能技术的不断发展,以深度学习为代表的神经网络算法逐渐被广泛的应用到人工智能设备内。目前,由于人工智能在模型训练与推理中需要大量的计算,但受限于其算法和计算本身的特性,传统的计算芯片已经无法满足计算需求,需要通过加速器对神经网络进行加速,提高神经网络的计算能力。深度学习加速器(deep learningaccelerator,简称为dla)通常使用专门定制的高度并行化计算单元去处理特定的网络模型,同时使用相关的内存技术和微架构技术使得整个加速器的处理效率最优。但是在神经网络模型发展极为迅速的今天,设计专用领域的硬件加速器周期太长,试错成本高,产品迭代速度慢,针对该技术问题,相关技术中尚未提出有效地解决方案。


技术实现思路

1、本申请实施例提供了深度学习加速器性能建模系统、性能测试方法、生成方法,以解决上述一个或多个技术问题。

2、第一方面,本申请实施例提供了一种深度学习加速器建模系统,包括:第一本文档来自技高网...

【技术保护点】

1.一种深度学习加速器性能建模系统,包括:

2.根据权利要求1所述系统,其中,所述第一输入接口包括:

3.根据权利要求2所述系统,其中,所述定义模块还用于使用Json文件,按照划分的网络层的层级结构描述从整个网络模型到算子的信息,其中,所述Json文件的第一级包括输入特征图的名称列表、整个网络模型的网络层列表。

4.根据权利要求3所述系统,其中,所述整个网络模型的网络层列表中的一个网络层包括:

5.根据权利要求4所述系统,其中,所述网络模型解析器包括:初始化模块、解析模块、第一遍历模块、第二遍历模块、更新模块,其中,p>

6.根据权...

【技术特征摘要】

1.一种深度学习加速器性能建模系统,包括:

2.根据权利要求1所述系统,其中,所述第一输入接口包括:

3.根据权利要求2所述系统,其中,所述定义模块还用于使用json文件,按照划分的网络层的层级结构描述从整个网络模型到算子的信息,其中,所述json文件的第一级包括输入特征图的名称列表、整个网络模型的网络层列表。

4.根据权利要求3所述系统,其中,所述整个网络模型的网络层列表中的一个网络层包括:

5.根据权利要求4所述系统,其中,所述网络模型解析器包括:初始化模块、解析模块、第一遍历模块、第二遍历模块、更新模块,其中,

6.根据权利要求5所述系统,所述解析模块还用于

7.根据权利要求5所述系统,所述第一遍...

【专利技术属性】
技术研发人员:贺健恒李思成陈峰范虎李知勇李玉东刘涛陆彦珩尚云海
申请(专利权)人:阿里巴巴达摩院杭州科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1