【技术实现步骤摘要】
基于Cortex
‑
M处理器的卷积神经网络加速方法、系统和介质
[0001]本申请涉及深度学习
,特别是涉及一种基于Cortex
‑
M处理器的卷积神经网络加速方法、系统和介质。
技术介绍
[0002]随着科学技术的不断发展,人工智能技术正不断地融入到人们的日常生活当中,目标检测、语音识别等应用使社会运作得更加高效有序,例如应用于图像识别的ImageNet实现了高于人眼的物体识别正确率。卷积神经网络CNN作为人工神经网络中的一种,无需手动选取特征或是明确输入输出的关系,它能够自动获取原始数据的特征从而得到输入输出之间的映射关系。卷积神经网络中的基础运算包括卷积、池化、向量运算和Relu激活。
[0003]针对云计算中大量数据长距离传输的带宽成本以及延迟问题,越来越多的边缘设备开始支持卷积神经网络的相关运算(例如卷积、激活、池化等),除了直接利用MCU的中央处理器来进行运算外,各种配备在MCU上的卷积神经网络硬件加速器也被设计出来进行特定的运算加速。但是典型的微控制单元MCU无法 ...
【技术保护点】
【技术特征摘要】
1.一种基于Cortex
‑
M处理器的卷积神经网络加速方法,其特征在于,所述方法包括:根据卷积神经网络的共性基础算子设置MCR指令和CDP指令,其中,所述共性基础算子包括卷积算子、Relu激活算子、池化算子、查表算子和量化算子;通过所述MCR指令对卷积神经网络协处理器的内部寄存器进行配置,再通过所述CDP指令启动所述卷积神经网络的共性基础算子。2.根据权利要求1所述的方法,其特征在于,通过所述MCR指令对卷积神经网络协处理器的内部寄存器进行配置包括:通过所述MCR指令对卷积神经网络协处理器的内部寄存器进行数据地址的配置、跨步块信息的配置和格式信息的配置,其中,所述数据地址用于运算中数据的读写,所述跨步块信息用于运算中数据的分块,所述格式信息用于确认数据的运算格式和写回格式。3.根据权利要求1所述的方法,其特征在于,通过所述MCR指令配置内部寄存器,再通过所述CDP指令启动所述共性基础算子包括:通过第一MCR指令,配置卷积核的本地缓存地址到第一寄存器,配置特征数据的本地缓存地址到第二寄存器,配置跨步块信息到尺度寄存器,配置格式信息到控制寄存器;通过所述CDP指令启动所述卷积算子,根据所述跨步块信息确定每次运算中所述特征数据的预设通道数和预设组数;根据所述特征数据的总通道数和所述预设通道数,按通道方向依次执行所述特征数据和所述卷积核的乘累加运算;在所述特征数据的每一个通道中,根据所述特征数据的总组数、所述预设组数和所述格式信息,按预设方向依次对所述特征数据和所述卷积核进行乘累加运算,直到得出所有通道的卷积结果。4.根据权利要求1所述的方法,其特征在于,通过所述MCR指令配置内部寄存器,再通过所述CDP指令启动所述共性基础算子还包括:通过第二MCR指令,配置输入数据的本地缓存地址到第一寄存器,配置写回信息的本地缓存地址到第二寄存器,配置跨步块信息到尺度寄存器;通过所述CDP指令启动所述卷积神经网络的Relu激活算子,根据所述跨步块信息将所述输入数据输入到Relu激活函数中,返回结果值,其中,e为数学中的自然常数,x为输入数据;根据所述写回信息将所述结果值写回本地缓存。5.根据权利要求1所述的方法,其特征在于,通过所述MCR指令配置内部寄存器,再通过所述CDP指令启动所述共性基础算子还包括:通过第三MCR指令,配置第一向量组的本地缓存地址到第一寄存器,配置第二向量组的本地缓存地址到第二寄存器,配置写回信息的本地缓存地址到第三寄存器,配置跨步块信息到尺度寄存器;通过所述CDP指令启动所述卷积神经网络的池化算...
【专利技术属性】
技术研发人员:ꢀ七四专利代理机构,
申请(专利权)人:杭州万高科技股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。