【技术实现步骤摘要】
一种膨胀卷积加速计算方法及装置
[0001]本专利技术属于深度学习领域,具体涉及膨胀卷积加速计算方法及装置。
技术介绍
[0002]本部分旨在为权利要求书中陈述的本专利技术的实施方式提供背景或上下文。此处的描述不因为包括在本部分中就承认是现有技术。
[0003]卷积神经网络(Convolutional Neural Networks,简称CNN)是一种深度前馈人工神经网络,已被应用于诸多领域,如图像识别。卷积神经网络在图像数据的处理过程中会进行较为复杂的计算,主要包括卷积计算、批标准化计算、激活计算等。
[0004]用CNN进行图像处理时,通常需要经过多次卷积和池化操作增大模型的感受野。池化可以减少图像的尺寸,再使用卷积核可以增大感受野;经过卷积和池化的特征图会比较小,这时可以传到全连接网络进行分类。但是在进行图像分割时,需要针对每个像素点进行预测,因此还要把减小尺寸后的特征图通过上采样的方法(如deconv反卷积)转回原始图像尺寸再进行预测。在这一过程的主要问题:(1)信息丢失,池化操作是不可逆转的,通过对 ...
【技术保护点】
【技术特征摘要】
1.一种膨胀卷积加速计算方法,其特征在于,所述方法包括:将R
×
S的膨胀卷积运算分解为S个R
×
1的子膨胀卷积运算,其中所述R为卷积核高度、所述S为卷积核宽度;针对每个R
×
1的子膨胀卷积运算,将多个权重值并行缓存至计算单元阵列中的多个计算单元;从输入图像数据中确定分别对应于所述多个权重值的多路输入数据流,将所述多路输入数据流并行输入所述多个计算单元;在所述多个计算单元内部,各自基于缓存的权重值和接收的输入数据流执行滑窗操作和乘法操作,并在所述多个计算单元之间执行累加操作,以输出所述子膨胀卷积运算的中间结果;叠加所述S个R
×
1的子膨胀卷积运算的中间结果,得到所述膨胀卷积运算的卷积结果。2.根据权利要求1所述的方法,其特征在于,根据所述膨胀卷积运算的膨胀率和卷积步长从输入图像数据中读取所需数据以拼接组成所述每个权重值对应的输入数据流。3.根据权利要求1所述的方法,其特征在于,根据所述膨胀卷积运算的膨胀率和卷积步长读取所述输入图像数据中的多行数据以拼接组成所述每个权重值对应的输入数据流。4.根据权利要求1所述的方法,其特征在于,所述滑窗操作的滑动步长根据所述膨胀卷积运算的所述卷积步长确定。5.根据权利要求1所述的方法,其特征在于,叠加所述S个R
×
1的子膨胀卷积运算的中间结果,包括:在所述S个R
×
1的子膨胀卷积运算中实时对所述S个R
×
1的子膨胀卷积运算的中间结果进行叠加,或者在所述S个R
×
1的子膨胀卷积运算执行完毕之后再进行多个中间结果的叠加。6.一种膨胀卷积加速计算装置,其特征在于,所述装置包括:逻辑控制单元...
【专利技术属性】
技术研发人员:徐兵,张楠赓,
申请(专利权)人:嘉楠明芯北京科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。