数据传递及合并的方法技术

技术编号：33538096 阅读：19 留言：0更新日期：2022-05-21 09:38

本发明专利技术公开了一种数据传递及合并的方法，适用于彼此通讯连接的发送端及接收端，所述方法包括：发送端阶段以及接收端阶段。发送端阶段包含：传送第一区块数据、第二区块数据及第三区块数据至接收端，取得第四区块数据及第五区块数据及传送第三区块数据、第四区块数据及第五区块数据至接收端。接收端阶段包含接收第一区块数据、第二区块数据及第三区块数据，合并第一区块数据、第二区块数据及第三区块数据以进行一卷积运算，接收第四区块数据、第五区块数据，及合并第三区块数据、第四区块数据及第五区块数据以进行另一卷积运算。第五区块数据以进行另一卷积运算。第五区块数据以进行另一卷积运算。

全部详细技术资料下载

【技术实现步骤摘要】
数据传递及合并的方法

[0001]本专利技术关于卷积神经网络加速器，特别是一种在平铺式处理的卷积运算中切割数据进行传递及合并数据的方法。

技术介绍

[0002]卷积神经网络(Convolution Neural Network，CNN)是目前被认为在电脑视觉及影像处理上最广泛被使用的机器学习技术之一。卷积神经网络的主要运算是卷积核(kernel)与特征图(feature map)之间的卷积，其通过乘积累加(Multiply Accumulate，MAC)运算而消耗大量功率。
[0003]比起冗余运算的能源浪费，如何提升数据存取能力以及减少数据传输频宽在未来的加速器设计中更加重要。一则因为存储器频宽成长速度慢于处理单元的运算速度，意味着相同的演算法可能受限于存储器及其架构；二则因为目前的神经网络多采用小卷积核配合更深的网络，这样减少了MAC运算但增加了存储器用量。据统计，随着神经网络的模型演进，在动态随机存取存储器(Dynamic Random Access Memory，DRAM)上存取特征图所消耗的功率比起其他运算...

【技术保护点】

【技术特征摘要】
1.一种数据传递及合并的方法，适用于通讯连接的一发送端及一接收端，其特征在于，所述方法包括：一发送端阶段，包含：以该发送端传送一第一区块数据、一第二区块数据及一第三区块数据至该接收端；以该发送端取得一第四区块数据及一第五区块数据；及以该发送端传送该第三区块数据、该第四区块数据及该第五区块数据至该接收端；以及一接收端阶段，包含：以该接收端接收该第一区块数据、该第二区块数据及该第三区块数据；以该接收端合并该第一区块数据、该第二区块数据及该第三区块数据以进行一卷积运算；以该接收端接收该第四区块数据、该第五区块数据；及以该接收端合并该第三区块数据、该第四区块数据及该第五区块数据以进行另一卷积运算。2.如权利要求1所述的数据传递及合并的方法，其特征在于，在以该发送端传送该第一区块数据、该第二区块数据及该第三区块数据至该接收端时，进一步包括：以该发送端传送一第一指标至该接收端，其中该第一指标用以指示该第一区块数据的起始地址，该第一数据区块的数据大小、该第二数据区块的数据大小及该第三数据区块的数据大小；以及在以该发送端传送该第三...

【专利技术属性】
技术研发人员：林裕盛，陈维超，陈佩君，
申请(专利权)人：英业达股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人