一种通用异构加速框架的构建方法技术

技术编号：32938840 阅读：15 留言：0更新日期：2022-04-07 12:29

本发明专利技术属于人工智能计算领域，具体涉及一种通用异构加速框架的构建方法。一种通用异构加速框架的构建方法，包括以下步骤：步骤S1：确定目标操作系统和异构智能硬件设备；步骤S2：所述目标操作系统加载所述异构智能硬件设备的驱动、计算库并选定计算框架及神经网络模型；步骤S3：通过所述神经网络模型和所述计算框架构建实例化的神经网络模型；步骤S4：使用深度学习编译器将所述实例化的神经网络模型编译为中间表示层IR；所述统一接口API是根据所述计算库编写；步骤S5：所述目标操作系统导入所述通用异构加速框架的核心组件，并将其编译成运行在异构智能硬件设备的软件模型。译成运行在异构智能硬件设备的软件模型。译成运行在异构智能硬件设备的软件模型。

全部详细技术资料下载

【技术实现步骤摘要】
一种通用异构加速框架的构建方法

[0001]本专利技术属于人工智能计算领域，具体涉及一种通用异构加速框架的构建方法。

技术介绍

[0002]随着人工智能技术及应用的发展，传统的CPU处理器已经无法满足机器学习、深度学习等人工智能计算对海量数据进行大量复杂运算的需求，因此需要将人工智能相关计算任务转移至人工智能加速卡和GPU、NPU、FPGA、DSP等智能芯片设备上进行高性能处理。
[0003]目前人工智能领域有大量复杂的神经网络模型和计算框架，每种计算框架都有各自的算子；在具体的人工智能应用中，需要选某个计算框架的算子来对神经网络模型进行实例化。目前主流的计算框架有tensorflow、pytorch、caffe2、mxnet等。常见的神经网络模型有resnet50、bert、vgg等。目前对神经网络模型实例进行训练和推理所使用的硬件加速方案单一，仅仅支持使用部分GPU作为硬件加速，而对其他智能硬件则缺乏支持。且目前和深度学习相关的硬件设计将变得更加多样化，由于硬件的多样性，如何将神经网络模型实例的训练和推理有效地映射到不同架构的智能硬件上进行加速计算，为人工智能应用的开发增加了难度。

技术实现思路

[0004]有鉴于此，本专利技术为了解决现有技术存在的缺陷和不足，提供了一种通用异构加速框架的构建方法，通过该方法构建的通用异构加速框架模型能够将实例化的神经网络模型编译转换成适合在各种智能硬件上进行并行加速运行的软件模型；且该软件模型提供的可扩展接口API能够完成对今后市场上新兴的异构智能设备的...

【技术保护点】

【技术特征摘要】
1.一种通用异构加速框架的构建方法，其特征在于，所述通用异构加速框架为软件模型，所述软件模型内包括通用异构加速框架的核心组件；核心组件包括深度学习编译器、统一接口API、计算库；构建方法包括以下步骤：步骤S1：确定目标操作系统和异构智能硬件设备；步骤S2：所述目标操作系统加载所述异构智能硬件设备的驱动、计算库并选定计算框架及神经网络模型；步骤S3：通过所述神经网络模型和所述计算框架构建实例化的神经网络模型；步骤S4：使用深度学习编译器将所述实例化的神经网络模型编译为中间表示层IR；根据所述计算库编写所述统一接口API，使统一接口API调用所述计算库；步骤S5：所述目标操作系统导入所述通用异构加速框架的核心组件，并将其编译成运行在异构智能硬件设备的软件模型。2.根据权利要求1所述的一种通用异构加速框架的构建方法，其特征在于，所述步骤S5包括以下步骤...

【专利技术属性】
技术研发人员：常涛，付正威，吴春光，刘步权，齐璇，魏立峰，顾郁莲，黄鑫，史晶，
申请(专利权)人：麒麟软件有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人