【技术实现步骤摘要】
【国外来华专利技术】卷积神经网络的运算方法、装置、设备和存储介质
本专利技术涉及人工智能
,尤其涉及一种卷积神经网络的运算方法、装置、设备和存储介质。
技术介绍
图像的特征信息的提取一直是计算机视觉领域一个重要的研究方向,训练后的卷积神经网络(ConvolutionNeuralNetworks,简称为CNN)可以很准确地提取图像的特征信息,基于特征信息完成对图像的分类。CNN可以由不同类型的网络层构成,不同类型的网络层包括卷积层、池化层、激活层、全连接层、批量归一化(Batch-normalized,简称为BN)层、scale层等。在scale层中,主要是进行y=ax+b的运算处理,其中x表示scale层的输入数据即输入特征图像(InputFeatureMap,简称为IFM),y表示scale层的输出数据即输出特征图像(OutputFeatureMap,简称为OFM),a和b依次分别表示scale层的比例缩放系数和位移系数。scale层所涉及的数据的运算量较大,相关技术中的scale层的运算处理一般是由中央处理器(Cent ...
【技术保护点】
1.一种卷积神经网络的运算方法,其特征在于,应用于对卷积神经网络中的网络层进行计算的处理器,所述处理器包括读取单元、多个计算单元和写入单元,所述方法包括:/n通过所述读取单元从外部存储器中读取输入所述网络层的特征图像和计算参数;/n根据所述多个计算单元的计算能力对所述特征图像进行拆分,将拆分后得到的多组图像数据和所述计算参数传递至所述多个计算单元,以供所述多个计算单元对各自接收的图像数据进行计算;/n通过所述写入单元将所述多个计算单元的计算结果合并,并将合并后的计算结果存入所述外部存储器。/n
【技术特征摘要】
【国外来华专利技术】1.一种卷积神经网络的运算方法,其特征在于,应用于对卷积神经网络中的网络层进行计算的处理器,所述处理器包括读取单元、多个计算单元和写入单元,所述方法包括:
通过所述读取单元从外部存储器中读取输入所述网络层的特征图像和计算参数;
根据所述多个计算单元的计算能力对所述特征图像进行拆分,将拆分后得到的多组图像数据和所述计算参数传递至所述多个计算单元,以供所述多个计算单元对各自接收的图像数据进行计算;
通过所述写入单元将所述多个计算单元的计算结果合并,并将合并后的计算结果存入所述外部存储器。
2.根据权利要求1所述的方法,其特征在于,所述读取单元中包括第一存储单元,所述通过所述读取单元从外部存储器中读取输入所述网络层的特征图像和计算参数,包括:
从所述外部存储器中交替读取所述特征图像和所述计算参数,其中,每次从所述特征图像中读取预设数据量的图像数据;
将依次读取到的数据依次存储到所述第一存储单元中。
3.根据权利要求2所述的方法,其特征在于,所述读取单元中还包括第二存储单元,所述方法还包括:
所述第一存储单元将读取到的数据依次以设定的延时向所述第二存储单元传输。
4.根据权利要求2所述的方法,其特征在于,所述从所述外部存储器中交替读取所述特征图像和所述计算参数,包括:
根据所述特征图像的总数据量和所述预设数据量,确定所述特征图像对应的读取次数D;
通过一次读取操作,从所述外部存储器中读取所述预设数据量的图像数据;
通过一次读取操作,从所述外部存储器中读取所述计算参数;
通过D-1次读取操作,从所述外部存储器中依次读取D-1个所述预设数据量的图像数据。
5.根据权利要求2所述的方法,其特征在于,所述方法还包括:
获取所述特征图像和所述计算数据对应的配置信息,以使所述第一存储单元基于所述配置信息从所述外部存储器中读取所述特征图像和所述计算参数。
6.根据权利要求5所述的方法,其特征在于,所述特征图像对应的配置信息包括所述特征图像在所述外部存储器中的起始存储地址和存储地址长度;
所述计算参数对应的配置信息包括所述计算参数在所述存储器中的存储地址。
7.根据权利要求2所述的方法,其特征在于,所述外部存储器中包括多个存储地址,所述多个存储地址满足设定条件,所述多个存储地址中分别存储有所述特征图像中的所述预设数据量的图像数据。
8.根据权利要求2所述的方法,其特征在于,所述多个计算单元的计算能力反应了每个计算单元一次能够计算的数据量和所述多个计算单元的单元总数量,所述根据所述多个计算单元的计算能力对所述特征图像进行拆分,包括:
根据所述每个计算单元一次能够计算的数据量和所述单元总数量,确定是否对读取到的所述预设数据量的图像数据进行拆分;
如果确定对所述预设数据量的图像数据进行拆分,则根据所述每个计算单元一次能够计算的数据量和所述单元总数量,对所述预设数据量的图像数据进行拆分。
9.根据权利要求8所述的方法,其特征在于,所述根据所述每个计算单元一次能够计算的数据量和所述单元总数量,对所述预设数据量的图像数据进行拆分,包括:
确定所述每个计算单元一次能够计算的数据量与所述单元总数量的乘积;
将所述预设数据量除以所述乘积,得到拆分份数;
将所述预设数据量的图像数据按照所述拆分份数进行均等分拆分。
10.根据权利要求1-9中任一项所述的方法,其特征在于,所述网络层包括ELTWISE层或scale层。
11.一种卷积神经网络的运算装置,其特征在于,所述...
【专利技术属性】
技术研发人员:罗岚,韩峰,杨康,
申请(专利权)人:深圳市大疆创新科技有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。