【技术实现步骤摘要】
使用存储器内运算的卷积加速器本申请主张于2018年11月30日提出申请的美国临时专利申请案第62/773,194号的权益,所述美国临时专利申请案并入本案供参考。
本专利技术是有关于存储器内运算装置(in-memorycomputingdevice),且更具体而言,是有关于被安排用于执行卷积的存储器内运算装置。
技术介绍
一种类型的神经网络被称为卷积神经网络(convolutionalneuralnetwork,CNN)。在卷积神经网络中,网络的一或多个层使用核矩阵(kernelmatrix)在输入矩阵(inputmatrix)上的卷积来生成输出矩阵(outputmatrix)。输入矩阵可包括高度为H、宽度为W且深度为C的图像文件案或特征图。此输入矩阵可被表征为在H-W平面中具有坐标的多个C位向量(C-bitvector)。核可包括具有与输入矩阵不同尺寸(高度R、宽度S、深度C)的滤波器的元素。输出矩阵可表示滤波后的影像或输出的特征图。输出矩阵也可具有与输入矩阵不同的尺寸(高度E、宽度F、深度M)。在一些系统中,将单个 ...
【技术保护点】
1.一种用于加速核矩阵在输入矩阵上的卷积的方法,包括:/n将所述核矩阵的元素的组合储存在一存储单元阵列中的相应一存储单元集合中;/n将来自所述输入矩阵的一输入向量的元素施加至储存所述核矩阵的所述元素的组合的所述存储单元集合;以及/n感测因应于所述输入向量的所述元素自所述存储单元集合的输出,以产生表示所述输入向量对所述输出矩阵的多个元素的贡献的数据。/n
【技术特征摘要】
20181130 US 62/773,194;20190624 US 16/450,3341.一种用于加速核矩阵在输入矩阵上的卷积的方法,包括:
将所述核矩阵的元素的组合储存在一存储单元阵列中的相应一存储单元集合中;
将来自所述输入矩阵的一输入向量的元素施加至储存所述核矩阵的所述元素的组合的所述存储单元集合;以及
感测因应于所述输入向量的所述元素自所述存储单元集合的输出,以产生表示所述输入向量对所述输出矩阵的多个元素的贡献的数据。
2.如权利要求1所述的方法,包括将来自包括所述首次提及的输入向量的序列中的所述输入矩阵的输入向量施加至储存所述核矩阵的所述元素的组合的所述存储单元集合,以及针对所述序列中的每个输入向量,感测来自所述存储单元集合的输出以产生表示对所述输出矩阵的贡献的输出数据,并且对表示所述序列中的所述输入向量中的每一者对所述输出矩阵的贡献的所述输出数据进行组合以产生所述输出矩阵。
3.如权利要求1所述的方法,其中所述存储单元集合设置在包括多行存储单元的存储单元阵列中,并且其中每一存储单元集合由所述多行中的单个行中的存储单元构成。
4.如权利要求1所述的方法,其中所述存储单元集合包括可编程电阻存储器存储单元。
5.如权利要求1所述的方法,其中所述存储单元集合包括电荷俘获存储器存储单元。
6.如权利...
【专利技术属性】
技术研发人员:林昱佑,李峰旻,
申请(专利权)人:旺宏电子股份有限公司,
类型:发明
国别省市:中国台湾;71
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。