移动端CNN的CPU、GPU、NPU统一调度方法技术

技术编号：35498420 阅读：24 留言：0更新日期：2022-11-05 17:01

本发明专利技术公开了一种移动端CNN的CPU、GPU、NPU统一调度方法，本发明专利技术移动端CNN的CPU、GPU、NPU统一调度方法可实现在移动设备的SoC芯片中，在命令解析调度器的控制下，利用统一的指令来调度CPU、GPU、NPU。本发明专利技术通过对CPU的命令解析和调度任务进行卸载，实现CNN到命令转换过程与CPU上运行程序的解耦，提高命令响应速度。度。度。

全部详细技术资料下载

【技术实现步骤摘要】
移动端CNN的CPU、GPU、NPU统一调度方法

[0001]本专利技术涉及数据处理
，特别涉及一种移动端CNN（Convolutional Neural Networks，卷积神经网络）的CPU（CentralProcessing Unit，中央处理器）、GPU（Graphics ProcessingUnit，图形处理器）、NPU（Neural Processing Unit，神经处理器）统一调度方法。

技术介绍

[0002]中央处理器（Central Processing Unit，CPU）是计算机中负责运算和控制的部件。在移动设备中，考虑到功耗、面积及性能需求的原因，通常会对CPU的规模和频率等进行缩减，因此CPU也经常被称作微控制单元（Microcontroller Unit，MCU）。
[0003]图形处理器（Graphics Processing Unit，GPU）是计算机中专门用于处理图形相关计算任务的部件，相比于CPU，GPU将计算资源更多的分配在计算部分而非控制部分上，并且尽可能的利用了图形计算处理任务中的并行性，因此，在图形处理任务上能具有比CPU快很多的计算能力。
[0004]神经处理器（Neural Processing Unit，NPU）通常指能够对神经网络计算提供加速处理能力的计算部件。由于目前卷积神经网络是神经网络的主流，而神经网络又是近年来人工智能发展的主要领域，同时，神经网络又以具有多层网络结构的深度神经网络为主，因此，还同时存在着人工智能加速器（Artific...

【技术保护点】

【技术特征摘要】
1.移动端CNN的CPU、GPU、NPU统一调度方法，其特征在于，包括以下步骤：S1、将CPU、GPU、内存分别连接到总线，将命令解析调度器和NPU本地连接并共享总线，通过命令接口将所述命令解析调度器与GPU连接；S2、CPU解析神经网络镜像，并根据软件算子注册段的配置为每个软件算子槽注册软件算子函数；S3、CPU为命令解析调度器配置命令队列起始地址并启动命令解析调度器；S4、所述命令解析调度器将命令队列的一部分读取到自身的命令缓存中；S5、所述命令解析调度器对命令缓存中的命令队列进行解析，得到命令的类型；如果类型为NPU命令，则通过本地连接将解析得到的命令参数发送给NPU；如果类型为软件算子，则向CPU发送中断信号，并将解析得到的命令参数发送到寄存器接口等待CPU获取；如果类型为GPU命令，则通过命令接口向GPU发送解析得到的命令类型和命令参数；S6、NPU接收到NPU命令后，从命令中获取权重，并从命令参数指定的内存或片上缓存地址读取计算数据，完成相应硬件算子计算，并将计算结果发送到命令参数指定的内存或片上缓存地址；CPU接收到软件算子中断信号后，首先通过总线从所述命令解析调度器的寄存器接口获取命令类型和命令参数，从命令参数指定的内存或片上缓存地址获取权重、目标参数以及计算数据，完成相应软件算子计算，并将计算结果发送到命令参数指定的内存或片上缓存；GPU接收到GPU命令后，从命令参数指定的内存或片上缓存地址获取目标参数和计算数据，完成相应GPU算子计算，并将计算结果发送到命令参数指定的内存或片上缓存地址；S7、NPU完成当前硬件算子计算后，通过本地连接向所述命令解析调度器发送完成信号；CPU完成当前软件算子计算后，通过寄存器接口向命令解析调度器发送完成信号；GPU完成当前GPU算子计算后，通...

【专利技术属性】
技术研发人员：徐瑞，项天，
申请(专利权)人：苏州速显微电子科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人