【技术实现步骤摘要】
本申请实施例涉及深度学习,尤其涉及一种可变精度量化深度神经网络处理器及数据处理方法。
技术介绍
1、dnn(deep neural network,深度神经网络)通过构建深度卷积神经网络和采用样本数据作为输入,得到一个具有分析能力和识别能力的模型,被应用于语音识别、图像识别等领域。人工智能领域,如可穿戴设备、车载智能设备等极限边缘平台也可以应用dnn实现智能化分析和识别。
2、由于dnn模型的计算量及参数量大,导致模型在运行过程中需要占用大量内存,消耗算力,而可穿戴设备、车载智能设备等极限边缘平台的存储空间、功耗及硬件资源有限,难以满足dnn的需求。为了在能耗、内存空间和计算资源均有限的情况下实现不同种类的智能应用运行和定制化需求,可变精度量化dnn被部署到极限边缘平台。
3、然而,由于不同量化dnn的量化精度不同,极限边缘平台难以提高多种量化dnn的推理吞吐量和能效比,且极限边缘设备缺乏对浮点计算的支持,无法进行片上训练,只能在云端更新数据,数据安全性低。
技术实现思路
>1、本申请提本文档来自技高网...
【技术保护点】
1.一种可变精度量化深度神经网络处理器,其特征在于,包括:协处理器模块和微处理器集群模块;
2.根据权利要求1所述的可变精度量化深度神经网络处理器,其特征在于,所述微处理器集群模块还包括:微处理器核、外设互联单元、外部总线、直接内存存取单元、共享指令缓存单元、访存互联单元和协处理器接口;
3.根据权利要求2所述的可变精度量化深度神经网络处理器,其特征在于,所述微处理器核还被配置为:
4.根据权利要求1所述的可变精度量化深度神经网络处理器,其特征在于,所述协处理器模块还包括:数据流互联单元、控制单元、读单元、写单元和数据缓冲单元;
...【技术特征摘要】
1.一种可变精度量化深度神经网络处理器,其特征在于,包括:协处理器模块和微处理器集群模块;
2.根据权利要求1所述的可变精度量化深度神经网络处理器,其特征在于,所述微处理器集群模块还包括:微处理器核、外设互联单元、外部总线、直接内存存取单元、共享指令缓存单元、访存互联单元和协处理器接口;
3.根据权利要求2所述的可变精度量化深度神经网络处理器,其特征在于,所述微处理器核还被配置为:
4.根据权利要求1所述的可变精度量化深度神经网络处理器,其特征在于,所述协处理器模块还包括:数据流互联单元、控制单元、读单元、写单元和数据缓冲单元;
5.根据权利要求1所述的可变精度量化深度神经网络处理器,其特征在于,所述可变精度处理单元还包括:数据切分单元、选通与时序逻辑器件;
6.根据权利要求...
【专利技术属性】
技术研发人员:林军,黄龙威,方超,李琼,王中风,
申请(专利权)人:南京大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。