【技术实现步骤摘要】
在三个或更多个维度中的加窗运算的硬件实施方式
[0001]本专利技术涉及在硬件加速器中执行加窗运算。
技术介绍
[0002]加窗运算诸如2
‑
D卷积和池化是众所周知的,并且广泛用于神经网络的上下文中—特别是卷积神经网络(CNN)。例如,这些2
‑
D运算支持将基于神经网络的算法应用于图像处理/分析/理解任务。硬件加速器是本领域中已知的,其被优化以用于执行这些2
‑
D运算。
[0003]在处理2
‑
D图像的CNN中使用的张量通常具有两个以上的维度数量。通过与每个图像相关联的输入信道的数量、待应用于每个信道的滤波器的数量等来添加附加的维度。示例性张量具有四个维度:批次、信道、高度和宽度。应用于该张量的对应的2
‑
D卷积内核还具有四个维度:输出信道的数量、输入信道的数量、内核高度和内核宽度。
[0004]值得注意的是,不管表示2
‑
D信号的张量的维度数量如何,所执行的加窗运算(例如,卷积或池化)本质上是二维的。也就是说,窗口(例如,内核)仅跨两个维度(即,高度维度和宽度维度)中的步幅移位。称这两个维度被窗口“遍历”。其他维度,诸如批次维度和信道维度,也可以存在。
技术实现思路
[0005]提供本
技术实现思路
是为了以简化的形式介绍下文在具体实施方式中进一步描述的一系列概念。本
技术实现思路
不旨在标识所要求保护的主题的关键特征或必要特征,也不旨在用于限制所要求保护的主题的范围。
[00
【技术保护点】
【技术特征摘要】
1.一种在至少三个遍历维度中实施加窗运算的方法,所述加窗运算包括将具有至少三个维度的窗口应用于具有至少三个遍历维度的数据,其中所述窗口在所有三个遍历维度中移位,所述方法包括:将所述加窗运算映射(720)到多个组成的2
‑
D加窗运算,每个2
‑
D加窗运算包括将所述窗口的切片施加到所述数据的切片,其中所述窗口的所述切片仅在两个维度中移位;由至少一个硬件加速器实施(730、731)所述多个2
‑
D加窗运算中的每一个运算,每个2
‑
D加窗运算产生相应的部分结果;以及汇编(740)所述部分结果以产生所述加窗运算的所述结果。2.如权利要求1所述的方法,包括选择(710)所述至少三个遍历维度的两个维度,以及将所述加窗运算映射(720)到所选择的两个维度中的多个组成的2
‑
D加窗运算。3.如前述权利要求中任一项所述的方法,其中所述数据包括零填充数据,并且其中将所述加窗运算映射到所述多个组成的2
‑
D加窗运算包括:从所述多个组成的2
‑
D加窗运算中排除(724)将应用于仅由零组成的所述零填充数据的切片的2
‑
D加窗运算。4.如前述权利要求中任一项所述的方法,还包括当在所述至少一个硬件加速器中实施所述多个2
‑
D加窗运算中的一个运算时,将所述数据的所述切片的至少一部分或所述窗口的所述切片的至少一部分存储(732)在所述至少一个硬件加速器的本地存储器中,以及当随后在所述至少一个硬件加速器中实施所述多个2
‑
D加窗运算中的一个运算时,重复使用(734)所存储的部分。5.如权利要求1至4中任一项所述的方法,其中所述加窗运算是以下运算中的一个运算:卷积运算,其中所述2
‑
D加窗运算中的每一个运算是2
‑
D卷积运算,并且其中汇编所述部分结果包括通过对所述部分结果求和来对它们进行组合;最大运算,其中所述2
‑
D加窗运算中的每一个运算是最大运算,并且其中汇编所述部分结果包括通过标识所述部分结果中的最大部分结果来对它们进行组合;最小运算,其中所述2
‑
D加窗运算中的每一个运算是最小运算,并且其中汇编所述部分结果包括通过标识所述部分结果中的最小部分结果来对它们进行组合;以及均值池化运算,其中所述2
‑
D加窗运算中的每一个运算是均值池化运算,并且其中组合所述部分结果包括通过计算所述部分结果的所述均值来对它们进行组合。6.如前述权利要求中任一项所述的方法,其中所述加窗运算包括偏置相加,其中将所述加窗运算映射(720a)到所述多个组成的2
‑
D加窗运算包括将所述偏置相加映射到所述2
‑
D加窗运算中的所选择的一个运算,其中所述偏置相加在所述至少一个硬件加速器中执行,作为所选择的2
‑
D加窗运算的一部分(730a)。7.如前述权利要求中任一项所述的方法,其中所述数据包括以下各项中的一项或其导数:视频数据,所述视频数据包括两个空间维度和一个时间维度;以及体积数据,所述体积数据包括三个空间维度。8.如前述权利要求中任一项所述的方法,其中所述加窗运算作为包括多个层的神经网络的一部分执行,
所述方法包括:在所述多个层中标识(705)至少三个遍历维度中的加窗运算,所述至少一个硬件加速器不支持所述加窗运算;将所述神经网络映射到重构的神经网络(720”);以及由所述至少一个硬件加速器实施(735)所述重构的神经网络,其中所述神经网络中的所标识的加窗运算在所述重构的神经网络中被产生部分结果的多个2
‑
D加窗运算和组合所述部分结果的多个逐元素运算替换。9.一种用于在至少三个遍历维度中实施加窗运算的数据处理系统(600),所述加窗运算包括:将具有至少三个维度的窗口应用于具有至少三个遍历维度的数据,其中所述...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。