一种针对多芯粒的存内计算数模混合DNN加速器的优化方法技术

技术编号:43566487 阅读:46 留言:0更新日期:2024-12-06 17:37
本发明专利技术属于深度神经网络技术领域,公开了一种针对多芯粒的存内计算数模混合DNN加速器的优化方法,包括:步骤1、模型预处理:对进行计算的DNN模型进行预处理,根据多芯粒的存内计算数模混合DNN加速器中的数字芯粒和存内运算芯粒确认深度神经网络DNN模型每一层的计算方式;步骤2、任务图谱的构建与优化:根据计算资源和存储资源的资源约束,将DNN模型的任务负载划分为计算和存储任务,构成任务图谱;步骤3、将步骤2构成的任务图谱转换为实际运算的执行图谱,并对执行图谱进行优化。本发明专利技术可以有效减少单个推理的延迟,同时提高整体运算的吞吐量,减少整体通信量,减少片上网络拥塞,提高运算性能。

【技术实现步骤摘要】

本专利技术属于深度神经网络,具体的说是涉及一种针对多芯粒的存内计算数模混合dnn加速器的优化方法。


技术介绍

1、神经网络技术通过不断扩大自身规模和优化自身网络结构为人工智能的发展带来了巨大突破,而随着这些技术在感知和识别等任务中展现出突破性的成果,其应用也已经扩展到无人驾驶汽车、医疗图像检测、自然语言处理等众多领域。但这些层出不穷的创新同时也带来了不断膨胀的计算规模,日益复杂的计算模式,以及存储和计算映射设计方面的更大挑战。

2、为了进一步的支撑机器学习技术的发展,需要能够处理各种大小的深度神经网络模型的dnn加速器实现高能效计算,并缓解随着模型增大而带来的内存瓶颈问题。目前,现有技术人员主要从两个技术方向尝试解决相关问题,一是存内运算(cim)技术,另一个是基于芯粒的集成技术。在可以预见的未来, dnn模型将进一步复杂化,所以使用芯粒技术将存内运算芯粒即cim芯粒也就是模拟芯粒与传统数字芯粒集成在一起来加速dnn模型计算是合理的思路与解决方向,如中国专利申请cn118070858a公开了一种基于多芯粒的存内计算数模混合dnn加速器,但同时,本文档来自技高网...

【技术保护点】

1.一种针对多芯粒的存内计算数模混合DNN加速器的优化方法,其特征在于:所述优化方法具体包括如下步骤:

2.根据权利要求1所述的一种针对多芯粒的存内计算数模混合DNN加速器的优化方法,其特征在于:在所述步骤2中,任务图谱的构建具体包括以下步骤:

3.根据权利要求1所述的一种针对多芯粒的存内计算数模混合DNN加速器的优化方法,其特征在于:步骤2.1.1任务图谱初始化具体包括以下步骤:

4.根据权利要求3所述的一种针对多芯粒的存内计算数模混合DNN加速器的优化方法,其特征在于:步骤2.1.2中,计算任务包括数字计算任务和存内运算任务,其中:

5...

【技术特征摘要】

1.一种针对多芯粒的存内计算数模混合dnn加速器的优化方法,其特征在于:所述优化方法具体包括如下步骤:

2.根据权利要求1所述的一种针对多芯粒的存内计算数模混合dnn加速器的优化方法,其特征在于:在所述步骤2中,任务图谱的构建具体包括以下步骤:

3.根据权利要求1所述的一种针对多芯粒的存内计算数模混合dnn加速器的优化方法,其特征在于:步骤2.1.1任务图谱初始化具体包括以下步骤:

4.根据权利要求3所述的一种针对多芯粒的存内计算数模混合dnn加速器的优化方法,其特征在于:步骤2.1.2中,计算任务包括数字计算任务和存内运算任务,其中:

5.根据权利要求1所述的一种针对多芯粒的存内计算数模混合dnn加速器的优化方法,其特征在于:在所述步骤2.1.3中,

6.根据权利要求5所述的一种针对多芯粒的存内计算数模混合dnn加速器的优化方法,其特征在于:任务图谱拆分时按照深度遍历的顺序进行,保证让该层中一条输入输出的通路在一个子层中,保证放入到一个子层的任务的数据依赖关系的正确性,具体包括以下步骤:

7.根据权利要求1所述的一种针对多芯粒的存内计算数模混合dnn加速器的优化方法,其...

【专利技术属性】
技术研发人员:尹捷明张海帅李朋阳陈小柏田逸非
申请(专利权)人:南京邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1