【技术实现步骤摘要】
数据传递及合并的方法
[0001]本专利技术关于卷积神经网络加速器,特别是一种在平铺式处理的卷积运算中切割数据进行传递及合并数据的方法。
技术介绍
[0002]卷积神经网络(Convolution Neural Network,CNN)是目前被认为在电脑视觉及影像处理上最广泛被使用的机器学习技术之一。卷积神经网络的主要运算是卷积核(kernel)与特征图(feature map)之间的卷积,其通过乘积累加(Multiply Accumulate,MAC)运算而消耗大量功率。
[0003]比起冗余运算的能源浪费,如何提升数据存取能力以及减少数据传输频宽在未来的加速器设计中更加重要。一则因为存储器频宽成长速度慢于处理单元的运算速度,意味着相同的演算法可能受限于存储器及其架构;二则因为目前的神经网络多采用小卷积核配合更深的网络,这样减少了MAC运算但增加了存储器用量。据统计,随着神经网络的模型演进,在动态随机存取存储器(Dynamic Random Access Memory,DRAM)上存取特征图所消耗的功率比起其他运算 ...
【技术保护点】
【技术特征摘要】
1.一种数据传递及合并的方法,适用于通讯连接的一发送端及一接收端,其特征在于,所述方法包括:一发送端阶段,包含:以该发送端传送一第一区块数据、一第二区块数据及一第三区块数据至该接收端;以该发送端取得一第四区块数据及一第五区块数据;及以该发送端传送该第三区块数据、该第四区块数据及该第五区块数据至该接收端;以及一接收端阶段,包含:以该接收端接收该第一区块数据、该第二区块数据及该第三区块数据;以该接收端合并该第一区块数据、该第二区块数据及该第三区块数据以进行一卷积运算;以该接收端接收该第四区块数据、该第五区块数据;及以该接收端合并该第三区块数据、该第四区块数据及该第五区块数据以进行另一卷积运算。2.如权利要求1所述的数据传递及合并的方法,其特征在于,在以该发送端传送该第一区块数据、该第二区块数据及该第三区块数据至该接收端时,进一步包括:以该发送端传送一第一指标至该接收端,其中该第一指标用以指示该第一区块数据的起始地址,该第一数据区块的数据大小、该第二数据区块的数据大小及该第三数据区块的数据大小;以及在以该发送端传送该第三...
【专利技术属性】
技术研发人员:林裕盛,陈维超,陈佩君,
申请(专利权)人:英业达股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。