数据流映射方法、装置、存储介质及电子设备制造方法及图纸

技术编号:36804029 阅读:14 留言:0更新日期:2023-03-09 00:03
本申请公开了一种数据流映射方法、装置、存储介质及电子设备。其中,该数据流映射方法采用接收片上网络发送的待处理数据流,待处理数据流包括特征数据和残差数据;将特征数据输入至计算单元阵列进行划窗处理和乘累加运算,得到第一子待输出数据;对第一子待输出数据进行激活和池化处理,得到第二子待输出数据;将第二子待输出数据和残差数据进行拼接或求和,得到目标待输出数据。本方案可以降低神经网络芯片的功耗。芯片的功耗。芯片的功耗。

【技术实现步骤摘要】
数据流映射方法、装置、存储介质及电子设备


[0001]本申请涉及神经网络
,具体涉及一种数据流映射方法、装置、存储介质及电子设备。

技术介绍

[0002]卷积神经网络(Convolutional Neural Networks,CNN)是一种深度前馈人工神经网络,目前已被应用于诸多领域,比如图像识别、无人机、手机等。卷积神经网络在处理过程中会进行较为复杂的计算,主要包括卷积计算、批标准化计算、激活计算等。为了满足卷积神经网络计算的高效需求,在芯片上规划专用于神经网络计算的架构应运而生。
[0003]目前大部分神经网络芯片(Neural

network Processing Units,NPU)大都采用的是纯数字设计,但是纯数字设计的NPU功耗太大,导致在手机或无人驾驶上基本无法使用,并且,纯数字设计的NPU尺寸也很大,会占据大量空间。

技术实现思路

[0004]本申请提供了一种数据流映射方法、装置、存储介质及电子设备,可以降低NPU的功耗。
[0005]第一方面,本申请提供一种数据流映射方法,包括:
[0006]接收片上网络发送的待处理数据流,所述待处理数据流包括特征数据和残差数据;
[0007]将所述特征数据输入至计算单元阵列进行划窗处理和乘累加运算,得到第一子待输出数据;
[0008]对所述第一子待输出数据进行激活和池化处理,得到第二子待输出数据;
[0009]将所述第二子待输出数据和所述残差数据进行拼接或求和,得到目标待输出数据。
[0010]在本申请提供的数据流映射方法中,所述特征数据包括若干特征图数据和若干权重数据,所述特征图数据和所述权重数据一一对应;
[0011]将所述特征数据输入至计算单元阵列进行划窗处理和乘累加运算,得到第一子待输出数据,包括:
[0012]将所述特征图数据和所述权重数据分别输入至对应的计算单元中;
[0013]分别对所述权重数据和所述特征图数据进行划窗处理,得到划窗权重数据和划窗特征图数据;
[0014]基于所述划窗权重数据和所述划窗特征图数据进行乘累加运算,得到第一子待输出数据。
[0015]在本申请提供的数据流映射方法中,所述基于所述划窗权重数据和所述划窗特征图数据进行乘累加运算,得到第一子待输出数据,包括:
[0016]对所述划窗权重数据和所述划窗特征图数据进行卷积处理,得到若干中间数据;
[0017]基于所述中间数据进行乘累加运算,得到第一子待输出数据。
[0018]在本申请提供的数据流映射方法中,在所述将所述第二子待输出数据和所述残差数据进行拼接或求和,得到目标待输出数据之前,还包括:
[0019]将所述残差数据输入至延时缓冲单元;
[0020]对所述残差数据进行融合处理,得到融合残差数据;
[0021]所述将所述第二子待输出数据和所述残差数据进行拼接或求和,得到目标待输出数据,包括:
[0022]将所述第二子待输出数据和所述融合残差数据进行拼接或求和,得到目标待输出数据。
[0023]在本申请提供的数据流映射方法中,在所述将所述第二子待输出数据和所述残差数据进行拼接或求和,得到目标待输出数据之后,还包括:
[0024]对所述目标待输出数据进行压缩处理;
[0025]将压缩处理后的所述目标待输出数据发送至所述片上网络进行存储。
[0026]在本申请提供的数据流映射方法中,所述计算单元为集存储能力和计算能力于一体的存内计算单元。
[0027]第二方面,本申请提供了一种数据流映射装置,包括:
[0028]数据接收单元,用于接收片上网络发送的待处理数据流,所述待处理数据流包括特征数据和残差数据;
[0029]第一处理单元,用于将所述特征数据输入至计算单元阵列进行划窗处理和乘累加运算,得到第一子待输出数据;
[0030]第二处理单元,用于对所述第一子待输出数据进行激活和池化处理,得到第二子待输出数据;
[0031]数据拼接单元,用于将所述第二子待输出数据和所述残差数据进行拼接或求和,得到目标待输出数据。
[0032]在本申请提供的数据流映射装置中,所述特征数据包括若干特征图数据和若干权重数据,所述特征图数据和所述权重数据一一对应;
[0033]所述第一处理单元用于:
[0034]将所述特征图数据和所述权重数据分别输入至对应的计算单元中;
[0035]分别对所述权重数据和所述特征图数据进行划窗处理,得到划窗权重数据和划窗特征图数据;
[0036]基于所述划窗权重数据和所述划窗特征图数据进行乘累加运算,得到第一子待输出数据。
[0037]第三方面,本申请提供了一种存储介质,所述存储介质存储有多条指令,所述指令适于处理器进行加载,以执行上述任一项所述的数据流映射方法。
[0038]第四方面,本申请实施例提供了一种电子设备,包括存储器,处理器及存储在存储器上并可在处理器上运行的计算机程序,其中,所述处理器执行所述计算机程序时实现如以上任一项所述的数据流映射方法。
[0039]综上,本申请提供的数据流映射方法采用接收片上网络发送的待处理数据流,所述待处理数据流包括特征数据和残差数据;将所述特征数据输入至计算单元阵列进行划窗
处理和乘累加运算,得到第一子待输出数据;对所述第一子待输出数据进行激活和池化处理,得到第二子待输出数据;将所述第二子待输出数据和所述残差数据进行拼接或求和,得到目标待输出数据。本方案可以降低NPU的功耗。
附图说明
[0040]为了更清楚地说明本申请实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0041]图1是本申请实施例提供的数据流映射方法的流程示意图。
[0042]图2是本申请实施例提供的数据流映射架构的结构示意图。
[0043]图3是本申请实施例提供的数据流映射装置的流程示意图。
[0044]图4是本申请实施例提供的电子设备的结构示意图。
具体实施方式
[0045]这里将详细地对示例性实施例进行说明,其示例表示在附图中。下面的描述涉及附图时,除非另有表示,不同附图中的相同数字表示相同或相似的要素。以下示例性实施例中所描述的实施方式并不代表与本申请相一致的所有实施方式。相反,它们仅是与如所附权利要求书中所详述的、本申请的一些方面相一致的装置和方法的例子。
[0046]需要说明的是,在本文中,术语“包括”、“包含”或者其任何其他变体意在涵盖非排他性的包含,从而使得包括一系列要素的过程、方法、物品或者装置不仅包括那些要素,而且还包括没有明确列出的其他要素,或者是还包括为这种过程、方法、物品或者装置所固有的要素。在没有更多限制的情况下,本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种数据流映射方法,其特征在于,包括:接收片上网络发送的待处理数据流,所述待处理数据流包括特征数据和残差数据;将所述特征数据输入至计算单元阵列进行划窗处理和乘累加运算,得到第一子待输出数据;对所述第一子待输出数据进行激活和池化处理,得到第二子待输出数据;将所述第二子待输出数据和所述残差数据进行拼接或求和,得到目标待输出数据。2.如权利要求1所述的数据流映射方法,其特征在于,所述特征数据包括若干特征图数据和若干权重数据,所述特征图数据和所述权重数据一一对应;将所述特征数据输入至计算单元阵列进行划窗处理和乘累加运算,得到第一子待输出数据,包括:将所述特征图数据和所述权重数据分别输入至对应的计算单元中;分别对所述权重数据和所述特征图数据进行划窗处理,得到划窗权重数据和划窗特征图数据;基于所述划窗权重数据和所述划窗特征图数据进行乘累加运算,得到第一子待输出数据。3.如权利要求2所述的数据流映射方法,其特征在于,所述基于所述划窗权重数据和所述划窗特征图数据进行乘累加运算,得到第一子待输出数据,包括:对所述划窗权重数据和所述划窗特征图数据进行卷积处理,得到若干中间数据;基于所述中间数据进行乘累加运算,得到第一子待输出数据。4.如权利要求1所述的数据流映射方法,其特征在于,在所述将所述第二子待输出数据和所述残差数据进行拼接或求和,得到目标待输出数据之前,还包括:将所述残差数据输入至延时缓冲单元;对所述残差数据进行融合处理,得到融合残差数据;所述将所述第二子待输出数据和所述残差数据进行拼接或求和,得到目标待输出数据,包括:将所述第二子待输出数据和所述融合残差数据进行拼接或求和,得到目标待输出数据。5.如权利要求1所述的数据流映射方法,其特...

【专利技术属性】
技术研发人员:陈乔乔
申请(专利权)人:深圳市九天睿芯科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1