基于TVM编译器的推理方法、装置、存储介质及设备制造方法及图纸

技术编号：36863114 阅读：15 留言：0更新日期：2023-03-15 18:42

本发明专利技术提供了一种基于TVM编译器的推理方法、装置、存储介质及设备，涉及人工智能技术领域，方法包括：分析TVM编译器在推理过程中的所有通信结构，并生成多个通信拓扑结构图，并为每个通信拓扑结构图构建通信算子；将待推理的神经网络模型输入TVM编译器中，并通过TVM编译器对神经网络模型进行转化，得到转化模型；分析转化模型的当前通信结构，并确定对应的通信拓扑结构图，并用对应的通信算子替换当前通信结构，并使用对应的通信算子实现张量并行方式推理。本发明专利技术加速了神经网络模型的推理速度，尤其对于大型神经网络模型，能极大缩短总的推理时间，提高推理效率。提高推理效率。提高推理效率。

全部详细技术资料下载

【技术实现步骤摘要】
基于TVM编译器的推理方法、装置、存储介质及设备

[0001]本专利技术涉及人工智能
，尤其涉及一种基于TVM编译器的推理方法、装置、存储介质及设备。

技术介绍

[0002]大型神经网络模型作为深度学习发展的一个热点，典型特征是模型参数量，通常一张计算卡无法容纳它的全部参数，因此需要将模型进行拆分，放到多张计算卡上完成推理任务。
[0003]流水并行和张量并行是拆分大模型进行并行计算，加速推理速度，缩短总的推理时间的常用方法。流水并行是指将模型按层剖分到多张计算卡上，各个计算卡只负责分配到该卡上的计算任务，只要有输入，就会持续进行计算。张量并行是指将模型中的算子剖分到多张计算卡上，多张卡共同完成一个算子的计算，可能需要在计算完成后进行一次信息同步，以得到该算子的计算结果。
[0004]目前的推理框架有TVM（Tensor Virtual Machine，一款开源的、端到端的深度学习模型编译框架）、Faster Transformer（英伟达针对Transformer推理提出的性能优化方案）等。FasterTransformer针对Transformer结构的模型推理提供了流水并行和张量并行的方式，但在模型编译优化方面有所欠缺，且缺乏对一般模型（非transformer）的支持。TVM作为深度学习编译器的典型代表，当前提供了流水并行的推理方式，但缺乏张量并行的支持。
[0005]因此，亟需一种基于TVM编译器的张量并行方式的推理方法。

技术实现思路

[0006]有鉴于此，本...

【技术保护点】

【技术特征摘要】
1.一种基于TVM编译器的推理方法，其特征在于，包括以下步骤：分析TVM编译器在推理过程中的所有通信结构，并生成多个通信拓扑结构图，并为每个通信拓扑结构图构建通信算子；将待推理的神经网络模型输入所述TVM编译器中，并通过所述TVM编译器对所述神经网络模型进行转化，得到转化模型；分析所述转化模型的当前通信结构，并确定对应的通信拓扑结构图，并用对应的通信算子替换所述当前通信结构，并使用所述对应的通信算子实现张量并行方式推理。2.根据权利要求1所述的方法，其特征在于，用对应的通信算子替换所述当前通信结构，并使用所述对应的通信算子实现张量并行方式推理包括：用对应的通信算子替换所述当前通信结构，得到所述对应的通信算子与关联的计算算子的组合，并将所述组合拆分为多个子函数，并使用所述多个子函数实现张量并行方式推理。3.根据权利要求2所述的方法，其特征在于，还包括：使每个子函数包括至少一个通信操作。4.根据权利要求2所述的方法，其特征在于，使用所述多个子函数实现张量并行方式推理包括：使所述多个子函数的部分或全部子函数并行执行，以实现张量并行方式推理。5.根据权利要求3所述的方法，其特征在于，使用所述多个子函数实现张量并行方式推理还包括：使所述每个子函数对应一个执行进程，并基于对应的执行进程将所述每个子函数传递至对应的计算卡进行编译；在编译过程中记录所述多个子函数之间的依赖逻辑，并根据所述依赖逻辑实现张量并行方式推理。6.根据权利要求1所述的方法，其特征在于，构建通信算子包括：利用所述TVM编译器提供的算子注册机制构建通信算子。7.根据权利要求1所述的方法，其特征在于，还包括：利用所述TVM编译器提供的接口将计算卡的通信库集成至所述TVM编译器中。8.根据权利要求7所述的方法，其特征在于，还包括：将所述通信库与所述对应的通信算子进行关联。9.根据权利要求7所述的方法，其特征在于，还包括：响应于所述计算卡为CPU，所述通信库为OpenMPI或mpi4py。10.根据权利要求7所述的方法，其特征在于，还包括：响应于所述计算卡为GPU，所述通信库为NCCL。11.根据权利要求1所述的方法，其特...

【专利技术属性】
技术研发人员：何也，
申请(专利权)人：苏州浪潮智能科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人