【技术实现步骤摘要】
本申请涉及算法硬件电路设计,具体涉及一种可复用的三维矩阵直连与对齐算子设计方法、电子设备和介质。
技术介绍
1、近年来,深度学习技术飞速发展,在图像分类、目标检测、自然语言处理、语音识别、游戏博弈等领域表现卓越。以cnn为代表的深度学习技术得到了学术界和工业界的广泛关注,一系列深度更深、精度更高的cnn模型相继被提出,如经典cnn网络vgg、googlenet等。为了解决模型加深带来的梯度消失问题,resnet,densenet等神经网络模型通过巧妙设计,将矩阵直连(shortcut)与拼接(concat)的思想引入模型,有效缓解了模型退化,进一步提升了深度神经网络性能。
2、由于cnn计算模式的并行特性,cpu作为一种串行标量计算引擎,其算力无法满足训练和推理的计算需求,需要设计专用的硬件架构提高计算效率。在硬件上进行模型部署时,通常采用量化方式,在精度无损或精度损失可接受范围内,将特征和权重数据从全精度浮点数量化低比特定点数,从而减小模型对计算、存储资源的消耗,提升处理性能。
技术实现思路
1本文档来自技高网...
【技术保护点】
1.一种可复用的三维矩阵直连与对齐算子设计方法,其特征在于,该方法包括如下步骤:
2.根据权利要求1所述的方法,其特征在于,在步骤1中,若选择shortcut流程,则根据预设量化策略获取各层量化位数Scalea、Scaleb、Scalec。
3.根据权利要求1所述的方法,其特征在于,在步骤1中,若选择concat流程,则根据预设量化策略获取跳连层a和输出层c量化位数Scalea、Scalec,层b量化参数Scaleb置0。
4.根据权利要求3所述的方法,其特征在于,在步骤1中,若选择concat流程,则还包括:在跳连层a的缓存中存放
...【技术特征摘要】
1.一种可复用的三维矩阵直连与对齐算子设计方法,其特征在于,该方法包括如下步骤:
2.根据权利要求1所述的方法,其特征在于,在步骤1中,若选择shortcut流程,则根据预设量化策略获取各层量化位数scalea、scaleb、scalec。
3.根据权利要求1所述的方法,其特征在于,在步骤1中,若选择concat流程,则根据预设量化策略获取跳连层a和输出层c量化位数scalea、scalec,层b量化参数scaleb置0。
4.根据权利要求3所述的方法,其特征在于,在步骤1中,若选择concat流程,则还包括:在跳连层a的缓存中存放待对齐数据ai,将跳连层b缓存中所有元素值bi置0。
5.根据权利要求1所述的方法,其特征在于,所述步骤2包括:根据预设的处理并行度n从预加载的缓存中读取跳连层a和跳连层b的量化矩阵{a1,a2...ai...an}和{b1,b2...bi...bn},并分别输入至n个移位寄存器。
6.根据权利要求1所述的方法,其特征在于,所述步骤3包括:对比两层量化位数scalea和scaleb,若scalea<scaleb,则将...
【专利技术属性】
技术研发人员:盖一帆,王晓峰,周辉,赵雄波,路坤锋,李悦,吴松龄,吴敏,赵冠杰,
申请(专利权)人:北京航天自动控制研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。