【技术实现步骤摘要】
本专利技术属于深度神经网络,具体的说是涉及一种针对多芯粒的存内计算数模混合dnn加速器的优化方法。
技术介绍
1、神经网络技术通过不断扩大自身规模和优化自身网络结构为人工智能的发展带来了巨大突破,而随着这些技术在感知和识别等任务中展现出突破性的成果,其应用也已经扩展到无人驾驶汽车、医疗图像检测、自然语言处理等众多领域。但这些层出不穷的创新同时也带来了不断膨胀的计算规模,日益复杂的计算模式,以及存储和计算映射设计方面的更大挑战。
2、为了进一步的支撑机器学习技术的发展,需要能够处理各种大小的深度神经网络模型的dnn加速器实现高能效计算,并缓解随着模型增大而带来的内存瓶颈问题。目前,现有技术人员主要从两个技术方向尝试解决相关问题,一是存内运算(cim)技术,另一个是基于芯粒的集成技术。在可以预见的未来, dnn模型将进一步复杂化,所以使用芯粒技术将存内运算芯粒即cim芯粒也就是模拟芯粒与传统数字芯粒集成在一起来加速dnn模型计算是合理的思路与解决方向,如中国专利申请cn118070858a公开了一种基于多芯粒的存内计算数模混合d
...【技术保护点】
1.一种针对多芯粒的存内计算数模混合DNN加速器的优化方法,其特征在于:所述优化方法具体包括如下步骤:
2.根据权利要求1所述的一种针对多芯粒的存内计算数模混合DNN加速器的优化方法,其特征在于:在所述步骤2中,任务图谱的构建具体包括以下步骤:
3.根据权利要求1所述的一种针对多芯粒的存内计算数模混合DNN加速器的优化方法,其特征在于:步骤2.1.1任务图谱初始化具体包括以下步骤:
4.根据权利要求3所述的一种针对多芯粒的存内计算数模混合DNN加速器的优化方法,其特征在于:步骤2.1.2中,计算任务包括数字计算任务和存内运算任务,其
5...
【技术特征摘要】
1.一种针对多芯粒的存内计算数模混合dnn加速器的优化方法,其特征在于:所述优化方法具体包括如下步骤:
2.根据权利要求1所述的一种针对多芯粒的存内计算数模混合dnn加速器的优化方法,其特征在于:在所述步骤2中,任务图谱的构建具体包括以下步骤:
3.根据权利要求1所述的一种针对多芯粒的存内计算数模混合dnn加速器的优化方法,其特征在于:步骤2.1.1任务图谱初始化具体包括以下步骤:
4.根据权利要求3所述的一种针对多芯粒的存内计算数模混合dnn加速器的优化方法,其特征在于:步骤2.1.2中,计算任务包括数字计算任务和存内运算任务,其中:
5.根据权利要求1所述的一种针对多芯粒的存内计算数模混合dnn加速器的优化方法,其特征在于:在所述步骤2.1.3中,
6.根据权利要求5所述的一种针对多芯粒的存内计算数模混合dnn加速器的优化方法,其特征在于:任务图谱拆分时按照深度遍历的顺序进行,保证让该层中一条输入输出的通路在一个子层中,保证放入到一个子层的任务的数据依赖关系的正确性,具体包括以下步骤:
7.根据权利要求1所述的一种针对多芯粒的存内计算数模混合dnn加速器的优化方法,其...
【专利技术属性】
技术研发人员:尹捷明,张海帅,李朋阳,陈小柏,田逸非,
申请(专利权)人:南京邮电大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。