【技术实现步骤摘要】
【国外来华专利技术】多线程脉动阵列
技术介绍
本专利技术在其一些实施例中涉及矩阵乘法,更具体但非排他地,涉及用于一个或多个矩阵的乘法的系统和方法。矩阵和向量乘法是各种处理方法中使用的基本运算,例如,用于进行神经网络推导和/或训练神经网络。目前正寻求计算高效的系统和/或方法,从而使用合理数量的计算资源(即,存储器和/或处理硬件)在合理的时间内快速执行矩阵乘法。例如,神经网络硬件加速器需要具有高数据吞吐量和高效的能耗,才能基于大量不同的输入对不同的神经网络进行处理。
技术实现思路
本专利技术的目的在于提供一种多线程脉动阵列,以及用于操作该多线程脉动阵列的装置、方法、计算机程序产品和系统。通过独立权利要求的特征实现前述和其他目的。进一步的实施形式在从属权利要求、具体说明和附图中显而易见。根据第一方面,一种多线程脉动阵列包括:多个处理元件,分别包括处理器,其中,每个所述处理元件用于:从相应的第一输入源接收多个第一输入,从相应的第二输入源接收多个第二输入,其中,所述多个第一输入和所述多个第二输入布置为与多个线程相对应的多对,为所述处理器的每个操作周期调度所述多个线程中的线程,对所述线程执行计算操作。根据第二方面,一种操作多线程脉动阵列的方法包括:针对所述多线程脉动阵列的多个处理元件中的每个处理元件,执行:从相应的第一输入源接收多个第一输入,从相应的第二输入源接收多个第二输入,其中,所述多个第一输入和所述多个第二输入布置为与多个线程相对应的多对,为每个操作周期调度所述多个线程中的线程,对所述线程执行计算操作。当输入数据 ...
【技术保护点】
1.一种多线程脉动阵列(300),其特征在于,包括:/n多个处理元件(302),分别包括处理器(308),其中,每个所述处理元件(302)用于:/n从相应的第一输入源(304)接收多个第一输入;/n从相应的第二输入源(306)接收多个第二输入,/n其中,所述多个第一输入和所述多个第二输入布置为与多个线程相对应的多对;/n为所述处理器的每个操作周期调度所述多个线程中的线程;/n对所述线程执行计算操作。/n
【技术特征摘要】
【国外来华专利技术】1.一种多线程脉动阵列(300),其特征在于,包括:
多个处理元件(302),分别包括处理器(308),其中,每个所述处理元件(302)用于:
从相应的第一输入源(304)接收多个第一输入;
从相应的第二输入源(306)接收多个第二输入,
其中,所述多个第一输入和所述多个第二输入布置为与多个线程相对应的多对;
为所述处理器的每个操作周期调度所述多个线程中的线程;
对所述线程执行计算操作。
2.根据权利要求1所述的多线程脉动阵列(300),其特征在于,所述多个处理元件(302)布置为二维阵列,从而将第一处理元件(302)的多个第一输出(316)作为多个第一输入(312)提供给第二相邻处理元件(302),将所述第一处理元件的多个第二输出(318)作为多个第二输入(314)提供给第三相邻处理元件。
3.根据前述权利要求中的任一项所述的多线程脉动阵列(300),其特征在于,根据所述线程的可用非影响值执行所述调度,其中,所述非影响值为不会显著影响所述处理器(308)计算的值的输入值。
4.根据前述权利要求中的任一项所述的多线程脉动阵列(300),其特征在于,所述处理器(308)用于:当相应线程的值中的至少一个是非影响值时,并行执行针对所述线程的所述计算操作和针对其他线程中的每个相应线程的跳过操作;或者,当相应线程的值中的至少一个是影响值时,并行执行针对所述线程的所述计算操作和针对其他线程中的每个相应线程的停顿操作。
5.根据权利要求4所述的多线程脉动阵列(300),其特征在于,所述计算操作由计算组件(308A)执行,所述跳过操作由移动路径组件(308B)执行,所述停顿操作由停顿组件(308C)执行,其中,所述计算组件(308A)的所述计算操作的执行独立于所述移动路径组件(308B)的所述跳过操作和所述停顿组件(308C)的所述停顿操作。
6.根据前述权利要求中的任一项所述的多线程脉动阵列(300),其特征在于,所述处理器(308)用于当所述多个线程包括非影响值时,并行处理针对所述多个线程的多个跳过操作。
7.根据前述权利要求中任一项所述的多线程脉动阵列(300),其特征在于,所述处理器(308)用于针对相应的第一输入和/或第二输入,对每个包括非影响值的线程执行跳过操作。
8.根据前述权利要求...
【专利技术属性】
技术研发人员:塔尔·霍洛维茨,乌里·韦泽,吴祖光,罗会斌,约尼·乔克伦,
申请(专利权)人:华为技术有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。