用于加速操作的方法和加速器装置制造方法及图纸

技术编号：27193259 阅读：18 留言：0更新日期：2021-01-31 11:40

本公开涉及由加速器装置访问和处理数据的方法。所述方法包括：检索要由所述加速器装置处理的输入数据的至少一部分；将所述输入数据分割为多个相邻输入块，所述输入块具有预定大小；将所述多个相邻输入块中的至少一个输入块存储在所述加速器装置的数据缓冲器中；通过将输入窗口定位于存储在所述数据缓冲器中的多个相邻输入块中的所述至少一个输入块的数据元素上方，访问存储在所述数据缓冲器中的数据元素，以生成多个输入区域，其中，所述输入窗口能够根据一组参数进行调整；以及顺序地处理所述多个输入区域中的至少一个输入区域，以由所述加速器装置至少部分地处理所述多个相邻输入块中的所述至少一个输入块。加速器装置和相应的系统被公开。相应的系统被公开。相应的系统被公开。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】用于加速操作的方法和加速器装置

[0001]本专利技术涉及由加速器装置访问和处理数据的方法、加速器装置和系统。特别地，本专利技术可以涉及使用可调整输入窗口对相邻输入块进行操作的方法。

技术介绍

[0002]由于计算技术的最新发展，大多数设备、机器或基础设施的操作完全依赖于基于计算机的各种输入数据处理和/或基于计算机的处理状态评估，以便生成适合于控制设备、机器或基础设施的信息。通常，这种处理和相应的决策制定需要大量复杂的计算任务或操作，但是，这些计算任务或操作通常属于相似的类型。虽然可以由诸如处理设备的CPU或核之类的通用处理单元执行所述任务或操作，各种用于加速此类任务或操作的专用硬件仍被提出。这种专用硬件通常称为加速器。
[0003]例如，已经提出了各种数学协处理器来加速数学运算，诸如对浮点数的运算等等。作为加速器的另一示例，已经提出了视频或图形加速器来加速图形或视频对象的处理和渲染。加速器通常包括专用于所需任务或操作以及相应的数据格式的专用硬件。
[0004]在图像处理、计算机视觉和人工智能的领域，已经提出了用于卷积操作的加速器。在许多人工智能方法中都需要卷积操作来对输入数据进行分析和分类以实现决策过程。由于这种处理通常响应于所拍摄的传感器数据而在相应设备上本地执行，因此卷积操作的实时处理已成为例如脸部识别、交通标志检测以及与监视、安全应用、自动驾驶等相关的其他任务中的关键问题。卷积神经网络(CNN)是应用在计算机视觉和人工智能中的使用卷积操作的一种技术示例。CNN将特征提取和分类组合在一个灵活的模...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种利用加速器装置访问和处理数据的方法，包括：检索要由所述加速器装置处理的输入数据的至少一部分；将所述输入数据分割为多个相邻输入块，所述输入块具有预定大小；将所述多个相邻输入块中的至少一个输入块存储在所述加速器装置的数据缓冲器中；通过将输入窗口定位于存储在所述数据缓冲器的所述多个相邻输入块中的所述至少一个输入块的数据元素上方，访问存储在所述数据缓冲器的所述数据元素，以生成多个输入区域，其中，所述输入窗口能够根据一组参数进行调整；以及顺序地处理所述多个输入区域中的至少一个输入区域，以由所述加速器装置至少部分地处理所述多个相邻输入块中的所述至少一个输入块。2.根据权利要求1所述的方法，还包括：依序将所述多个相邻输入块中的另一输入块存储在所述数据缓冲器；以及使用所述输入窗口来访问所述多个相邻输入块中的所述另一输入块的数据。3.根据权利要求1或2所述的方法，其中，所述一组参数包括步长值和膨胀值，所述膨胀值定义所述输入窗口的两个连续位置之间的距离。4.根据权利要求3所述的方法，还包括确定所述加速器装置的处理模式，其中，在第一处理模式下，所述步长值定义由所述输入窗口采样的数据元素之间的间隔，在第二处理模式下，所述步长值定义由所述输入窗口的单个数据元素生成的数据元素的数量。5.根据前述权利要求中任一项所述的方法，其中，所述一组参数还包括到存储在系数缓冲器中的系数矩阵的映射，通过根据所述映射将所述系数矩阵中的至少一个元素应用于输入区域来处理所述输入区域。6.根据权利要求5所述的方法，还包括：与生成所述输入区域并行地检索所述系数矩阵中的所述至少一个元素；以及使用至少一个处理元件在所述输入区域上应用所述系数矩阵中的所述至少...

【专利技术属性】
技术研发人员：G，
申请(专利权)人：智动科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人