【技术实现步骤摘要】
本专利技术属于计算机科学,尤其涉及一种深度学习模型计算图拆分方法及编译系统。
技术介绍
1、片上系统(soc)通过集成异构多核深度学习加速器(dpu),实现了对深度学习模型的边缘端高效低功耗的推理。多核深度学习加速器为深度学习模型多分支结构的并行执行提供了可能,每个核独立处理一个分支任务,多核协同工作可以提高计算平台的整体性能和能效。
2、然而,目前的深度学习编译器(如xilinxvitisai和tvm等)不支持深度学习模型的多分支自动拆分,将整个深度学习模型编译为一个计算图,放到加速器上执行,将导致无法充分利用加速器的多核计算资源。因此,迫切需要一个技术能够进行多分支模型的计算图自动拆分和编译。
3、中国专利“cn117667389a一种计算图的自动划分方法”提供了一种深度学习计算图自动拆分方法。此专利采用计算图中的分支信息,针对转换后的计算图进行划分,得到多个子图节点集合,并且根据每一子图节点集合以及计算图中节点之间的依赖关系,构建出与该子图节点集合所对应的子图。
4、然而,中国专利“cn1176
...【技术保护点】
1.一种深度学习模型计算图拆分方法,其特征在于:包括以下步骤:
2.根据权利要求1所述的一种深度学习模型计算图拆分方法,其特征在于:
3.根据权利要求1所述的一种深度学习模型计算图拆分方法,其特征在于:
4.根据权利要求3所述的一种深度学习模型计算图拆分方法,其特征在于:所述步骤2包括以下步骤:
5.根据权利要求4所述的一种深度学习模型计算图拆分方法,其特征在于:所述步骤3包括以下步骤:
6.根据权利要求5所述的一种深度学习模型计算图拆分方法,其特征在于:所述步骤4包括以下步骤:
7.根据权利要求
...【技术特征摘要】
1.一种深度学习模型计算图拆分方法,其特征在于:包括以下步骤:
2.根据权利要求1所述的一种深度学习模型计算图拆分方法,其特征在于:
3.根据权利要求1所述的一种深度学习模型计算图拆分方法,其特征在于:
4.根据权利要求3所述的一种深度学习模型计算图拆分方法,其特征在于:所述步骤2包括以下步骤:
5.根据权利要求4所述的一种深度学习模型计算图拆分方法,其特征在于:所述步骤3包括以下步骤:
6.根据权利要求5所述的一种深度学习模型...
【专利技术属性】
技术研发人员:穆元震,姜徐,唐月,刘松冉,王义,
申请(专利权)人:东北大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。