使用存储器内运算的卷积加速器制造技术

技术编号:24459021 阅读:41 留言:0更新日期:2020-06-10 16:25
本发明专利技术公开了一种用于加速核矩阵在输入矩阵上的卷积,以用于使用存储器内运算来计算输出矩阵的方法,上述方法涉及在存储单元阵列中的不同存储单元集合中储存核矩阵或多个核矩阵的元素的相应组合。为了执行卷积,将来自输入矩阵的输入向量的序列施加至阵列。将输入向量中的每一者并行施加至不同存储单元集合以在相同时间间隔期间进行计算。感测因应于每个输入向量而产生的来自不同存储单元集合中的每一者的输出,以产生表示所述输入向量对输出矩阵的多个元素的贡献的数据集合。使用在所述输入矩阵上产生的数据集合来产生输出矩阵。

Convolution accelerator using in memory operations

【技术实现步骤摘要】
使用存储器内运算的卷积加速器本申请主张于2018年11月30日提出申请的美国临时专利申请案第62/773,194号的权益,所述美国临时专利申请案并入本案供参考。
本专利技术是有关于存储器内运算装置(in-memorycomputingdevice),且更具体而言,是有关于被安排用于执行卷积的存储器内运算装置。
技术介绍
一种类型的神经网络被称为卷积神经网络(convolutionalneuralnetwork,CNN)。在卷积神经网络中,网络的一或多个层使用核矩阵(kernelmatrix)在输入矩阵(inputmatrix)上的卷积来生成输出矩阵(outputmatrix)。输入矩阵可包括高度为H、宽度为W且深度为C的图像文件案或特征图。此输入矩阵可被表征为在H-W平面中具有坐标的多个C位向量(C-bitvector)。核可包括具有与输入矩阵不同尺寸(高度R、宽度S、深度C)的滤波器的元素。输出矩阵可表示滤波后的影像或输出的特征图。输出矩阵也可具有与输入矩阵不同的尺寸(高度E、宽度F、深度M)。在一些系统中,将单个输入矩阵与不同的核(本文档来自技高网...

【技术保护点】
1.一种用于加速核矩阵在输入矩阵上的卷积的方法,包括:/n将所述核矩阵的元素的组合储存在一存储单元阵列中的相应一存储单元集合中;/n将来自所述输入矩阵的一输入向量的元素施加至储存所述核矩阵的所述元素的组合的所述存储单元集合;以及/n感测因应于所述输入向量的所述元素自所述存储单元集合的输出,以产生表示所述输入向量对所述输出矩阵的多个元素的贡献的数据。/n

【技术特征摘要】
20181130 US 62/773,194;20190624 US 16/450,3341.一种用于加速核矩阵在输入矩阵上的卷积的方法,包括:
将所述核矩阵的元素的组合储存在一存储单元阵列中的相应一存储单元集合中;
将来自所述输入矩阵的一输入向量的元素施加至储存所述核矩阵的所述元素的组合的所述存储单元集合;以及
感测因应于所述输入向量的所述元素自所述存储单元集合的输出,以产生表示所述输入向量对所述输出矩阵的多个元素的贡献的数据。


2.如权利要求1所述的方法,包括将来自包括所述首次提及的输入向量的序列中的所述输入矩阵的输入向量施加至储存所述核矩阵的所述元素的组合的所述存储单元集合,以及针对所述序列中的每个输入向量,感测来自所述存储单元集合的输出以产生表示对所述输出矩阵的贡献的输出数据,并且对表示所述序列中的所述输入向量中的每一者对所述输出矩阵的贡献的所述输出数据进行组合以产生所述输出矩阵。


3.如权利要求1所述的方法,其中所述存储单元集合设置在包括多行存储单元的存储单元阵列中,并且其中每一存储单元集合由所述多行中的单个行中的存储单元构成。


4.如权利要求1所述的方法,其中所述存储单元集合包括可编程电阻存储器存储单元。


5.如权利要求1所述的方法,其中所述存储单元集合包括电荷俘获存储器存储单元。


6.如权利...

【专利技术属性】
技术研发人员:林昱佑李峰旻
申请(专利权)人:旺宏电子股份有限公司
类型:发明
国别省市:中国台湾;71

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1