【技术实现步骤摘要】
执行Winograd卷积的装置与板卡
[0001]本专利技术一般地涉及神经网络领域。更具体地,本专利技术涉及执行Winograd卷积的计算装置、集成电路装置及板卡。
技术介绍
[0002]随着信息化时代的高速发展,人工智能与机器学习领域的研究炙手可热,相关产业蓬勃发展。卷积神经网络在计算机视觉、自动驾驶、机器翻译、语音识别、智能家居等各方面都有着广泛的作用。
[0003]卷积神经网络的参数量大,运算量大,使得卷积神经网络模型在便携移动终端有限面积和算力下被严重的限制其执行性能,同时非专用性设计的处理器在进行卷积运算时也会造成功耗的巨大开销。
[0004]Winograd卷积是一种基于多项式插值算法的卷积加速实现方式。它通过对卷积操作的两个输入:神经元及权值进行一定规模切分后,分别做线性变换,也就是Winograd正变换,再将变换后的神经元和权值进行对位乘法,把对位乘法结果再次进行线性变换,即Winograd逆变换,最后得到与原卷积操作等价的卷积结果。
[0005]由于在Winograd卷积操作的过程中 ...
【技术保护点】
【技术特征摘要】
1.一种执行Winograd卷积的计算装置,包括:正变换单元,包括2组正变换加法器组,用以执行Winograd卷积的正变换中的加法运算;以及逆变换单元,包括2组逆变换加法器组,用以执行Winograd卷积的逆变换中的加法运算。2.根据权利要求1所述的计算装置,接收神经元数据,其中每组正变换加法器组及逆变换加法器组分别包括16个加法器,在所述神经元数据的通道方向按照特定顺序进行加法运算。3.根据权利要求2所述的计算装置,其中所述特定顺序为先计算Winograd卷积的左乘矩阵的加法,再计算Winograd卷积的右乘矩阵的加法。4.根据权利要求2所述的计算装置,其中每个加法器为FB32加法器。5.根据权利要求1所述的计算装置,连接至片外内存,所述片外内存存储有神经元数据及Winograd权值,其中所述正变换加法器组对所述神经元数据执行所述正变换中的加法运算,以产生正变换数据。6.根据权利要求5所述的计算装置,还包括对位乘累加运算器,用以对所述正变换数据与所述Winograd权值进行对位乘累加运算,以产生对位乘数据。7.根据权利要求6所述的计算装置,其中所述逆变换加法器组对所述对位乘数据执行所述逆变换中的加法运算,以获得卷积结果。8.根据权利要求5所述的计算装置,其中所述正变换单元还包括:输入...
【专利技术属性】
技术研发人员:ꢀ七四专利代理机构,
申请(专利权)人:安徽寒武纪信息科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。