【技术实现步骤摘要】
一种卷积神经网络数据流切片尺寸的优化方法
[0001]本专利技术属于数据传输
,涉及一种卷积神经网络数据流切片尺寸的优化方法。
技术介绍
[0002]近年来,卷积神经网络在图像识别,对象检测,自然语言处理等方面的应用取得了显著的优势,为了进一步提升卷积神经网络的推理精准度,主流的做法倾向于加深卷积神经网络的卷积层深度与加大卷积核的尺寸以扩大模型的计算量,然而,这使得此类网络模型难以在边缘端设备上部署,不仅因为边缘端设备通常运算资源较少,难以快速完成推理过程,不满足大多数应用场景中的“实时性”要求,而且边缘端设备通常内部存储空间较少,难以缓冲大量计算所带来的大规模中间计算结果。
[0003]针对大尺寸卷积神经网络模型难以在边缘端设备部署的问题,有研究人员提出轻量化网络模型的概念,这其中,可分离卷积及神经网络如MobileNet系列,ShuffleNet系列等,在无人机避障,扫地机器人路线识别等移动计算应用场景中受到了大量的关注与应用。与常规的卷积神经网络不同,可分离卷积神经网络将常规的一层网络运算拆分为逐点卷积与深度卷积,此举可以有效的降低卷积神经网络模型的计算量。
[0004]图1展示了常规卷积一层内的层中的卷积操作,其主要由输入特征图,过滤器权重和输出特征图三个部分组成,他们都是由通道数
×
行数
×
列数组成的三维矩阵,其中输入特征的尺寸为N
×
H
×
W,它通过与尺寸为N
×
KH
×
KW的 ...
【技术保护点】
【技术特征摘要】
1.一种卷积神经网络数据流切片尺寸的优化方法,其特征在于:该方法包括:S1:利用平台计算强度模型为加速器进行性能建模,得到其计算强度阈值I
t
与计算墙CB的上限;S2:构建卷积神经网络模型切片尺寸与理论性能模型,得到不同切片尺寸Tn,Tm组合与理论算力TP之间的关系;S3:结合平台计算强度模型与切片尺寸与理论性能模型,在加速器平台计算资源与存储容量的约束下,以平台计算强度阈值I
t
作为评价基准,若一个卷积神经网络数据流切片尺寸的组合,在能够发挥出其部属的加速器平台的最大算力的同时,具有最小的缓冲存储空间消耗量,则该切片尺寸的被认为是最佳设计。2.根据权利要求1所述的一种卷积神经网络数据流切片尺寸的优化方法,其特征在于:所述S1具体为:根据所选加速器部署平台的运算能力与存储容量,利用所提出的平台计算强度模型进行计算分析,得到该运算平台的性能特点后,得到其计算强度阈值I
t
;根据所提出的切片尺寸与理论性能模型,得到不同切片规格下的理论性能分布情况与网络模型计算强度I
m
;根据所得到的平台计算强度阈值I
t
与网络模型计算强度I
m
,根据平台计算强度模型与切片尺寸与理论性能模型,推测出该切片规格下的卷积神经网络部署在指定计算平台上的实际性能,并对网络模型的切片尺寸进行优化,选择出最适配的切片尺寸规格以发挥出计算平台全部性能,避免算力与存储容量的浪费。3.根据权利要求2所述的一种卷积神经网络数据流切片尺寸的优化方法,其特征在于:所述S2具体为:分析平台计算强度阈值I
t
与网络模型计算强度I
m
,构建平台计算强度模型与切片尺寸与理论性能模型的具体过程为:根据存储器传输带宽计算公式,即:Bandwidth=Core_frp
×
Bus_bitwidth
×
Mult_factor/8bits得到存储器的传输带宽上限,此上限即为加速器平台的内存墙MB,而计算墙CB同样决定着加速器的性能特点,其计算方式为:CB=f
DSP
×
N
DSP
×
2其中f
DSP
代表目标平台的数字信号处理单元DSP的运行频率,而N
DSP
为DSP的数量;根据内存墙MB与计算墙CB,利用下式求得计算平台计算强度阈值I
t
:其代表计算平台内存墙与计算墙的分界点,当网络模型计算强度I
m
小于平台计算强度阈值I
t
时,表示此卷积神经网络模型的单位计算操作需要过多的内存交换,将导致加速器系统陷于计算平台的内存墙瓶颈区内,无法发挥出平台的全部算力;反之当网络模型计算强度I
m
大于平台计算强度阈值I
t
时,表示此模型的计算效率足够高,能够发挥出计算平台的全部算力;卷积神经网络网络模型部署在指定计算平台的实际性能AP用下式来描述:
此模型即为平台计算强度模型;对于平台计算强度阈值I
t
,其由加速器平台的传输带宽与峰...
【专利技术属性】
技术研发人员:张红升,甘济章,刘挺,张宇轩,黄奎,印鑫,
申请(专利权)人:重庆邮电大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。