用于神经网络的增强型乘法累加设备制造技术

技术编号:31308117 阅读:14 留言:0更新日期:2021-12-12 21:31
用于执行乘法/累加运算的设备,其具有第一宽度,其使用具有第二宽度(例如,第一宽度的一半)的计算管线来处理第一和第二缓冲器中的值。一个定序器,其使用乘法/累加电路处理第一和第二缓冲区中部分值的组合(高

【技术实现步骤摘要】
用于神经网络的增强型乘法累加设备


[0001]本专利技术涉及用于执行大量数学运算的系统和方法。

技术介绍

[0002]提高执行速度的最常见方法之一是并行执行操作,例如采用多个处理器内核。通过配置具有许多(例如,成千上万个)处理管线的图形处理单元(GPU),可以在更大的规模上利用此原理,其中每个处理管线可以被配置为执行一个数学功能。以这种方式,可以并行处理大量数据。尽管GPU最初用于图形处理应用程序,但GPU也经常用于其他应用,尤其是人工智能。
[0003]改进GPU管线或包括许多处理单元的任何处理设备的功能将是对本领域的一种改进。
附图说明
[0004]图1为可实现本专利技术实施例的方法的一个计算机系统的示意性框图。
[0005]图2为本专利技术实施例的一个乘法/累加电路的示意框图。
[0006]图3是为本专利技术实施例的一个用于对双宽度输入参数执行乘法/累加运算的方法流程图。
[0007]图4是为本专利技术实施例的另一个用于对双宽度输入参数执行乘法/累加运算的方法流程图。
[0008]图5是根据本专利技术实施例的用于执行组累加的方法流程图。
具体实施方式
[0009]为了容易理解本专利技术的优点,将通过参考附图中所示的具体实施例来呈现本专利技术的更为具体的描述。应当理解,这些附图仅描述本专利技术的典型实施例,而不构成对其范围的限制。以下将通过使用附图以额外的特异性和细节来描述和解释本专利技术。
[0010]本专利技术的组件可以以多种不同的方式来布置和设计。因此,如附图所示,以下对本专利技术的实施例的更详细的描述并非旨在限制本专利技术所要求的保护范围,而以示意方式说明本专利技术的基本构想。请参考附图以更好地理解此处描述的实施例,其中,相同的组件始终用相同的数字表示。
[0011]根据本专利技术的实施例可以体现为装置,方法或计算机程序产品。相应地,本专利技术可以采取全硬件实施例,全软件实施例(包括固件,常驻软件,微代码等)或,结合软件和硬件的实施例的形式,在本文中这些方面可被称为“模块”或“系统”。此外,本专利技术的形式可以是在任何有形表达介质中体现的计算机程序产品,在该介质中具有计算机可用的程序代码。
[0012]本专利技术可以利用一种或多种计算机可用或计算机可读介质的任何组合,包括非暂时性介质。例如,计算机可读介质可以包括便携式计算机软盘,硬盘,随机存取存储器(RAM)设备,只读存储器(ROM)设备,可擦除可编程只读存储器(EPROM或闪存)设备,便携式光盘只
读存储器(CDROM),光学存储设备和磁性存储设备。在选定的实施例中,计算机可读介质可以包括任何非暂时性介质,其可以包含、存储、通信、传播或传输由指令执行系统、装置或设备使用或与其结合使用的程序。
[0013]本专利技术可以用一种或多种编程语言的任何组合来编写用于执行本专利技术的操作的计算机程序代码,所述编程语言包括诸如Java,Smalltalk,C++等之类的面向对象的编程语言以及诸如“C”编程语言之类的常规过程编程语言。所述程序代码可以完全在计算机系统上作为独立软件包执行,在独立硬件单元上执行,部分在与计算机间隔一定距离的远程计算机上执行,或者完全在远程计算机或服务器上执行。在最后一种情况下,远程计算机可以通过任何类型的网络(包括局域网(LAN)或广域网(WAN))连接到计算机,或者可以与外部计算机建立连接(例如,通过使用互联网服务提供商的互联网)。
[0014]下面将参考根据本专利技术实施例的方法、装置(系统)、计算机程序产品的流程图和/或框图描述本专利技术。流程图图示和框图的每个部分都可以通过计算机程序指令或代码来实现。这些计算机程序指令可以被提供给通用计算机、专用计算机或用以生产机器的其他可编程数据处理设备的处理器,从而使计算机或其他可编程数据处理设备的处理器执行的指令可创建用于实现流程图和/或框图中指定的功能/动作。
[0015]这些计算机程序指令还可以存储在非暂时性计算机可读介质中,该介质可以指导计算机或其他可编程数据处理设备以特定方式运行,从而使存储在计算机可读介质中的指令产生制品,该制品包括指令装置,该指令装置可实现流程图和/或方框图中指定的功能/动作。
[0016]计算机程序指令也可被加载到计算机或其他可编程数据处理设备上,以使一系列操作步骤在计算机或其他可编程设备上执行,以产生计算机实现的过程,从而使计算机或其他可编程数据处理设备的处理器执行的指令提供用于实现流程图和/或框图中指定的功能/动作的过程。
[0017]图1为示例计算设备100的框图。计算设备100可以用于执行各种过程,诸如本文所讨论的过程。计算设备100可以用作服务器、客户端或任何其他计算实体。计算设备可以执行本文所公开的各种功能,并且可以执行一个或多个应用程序,例如本文公开的应用程序。计算设备100可以是多种计算设备中的任何一种,例如台式计算机、笔记本计算机、服务器计算机、手持式计算机、平板计算机等。
[0018]计算设备100包括一个或多个处理器102,一个或多个存储设备104,一个或多个接口106,一个或多个大容量存储设备108,一个或多个输入/输出(I/O)设备110,和显示设备130,均耦合到总线112。处理器102包括一个或多个执行存储在存储设备104和/或大容量存储设备108中的指令的处理器或控制器。处理器102还可以包括各种类型的计算机可读介质,例如高速缓冲存储器。
[0019]存储设备104包括各种计算机可读介质,例如易失性存储器(例如,随机存取存储器(RAM)114)和/或非易失性存储器(例如,只读存储器(ROM)116)。存储设备104还可以包括可擦写ROM,例如闪存。
[0020]大容量存储设备108包括各种计算机可读介质,例如磁带、磁盘、光盘、固态存储器(例如,闪存)等。如图1所示,一个实例中的大容量存储设备是一个硬盘驱动器124。大容量存储设备108中还可以包括各种驱动器,以使得其能够从各种计算机可读介质读取和/或写
入各种计算机可读介质。大容量存储设备108包括可移动介质126和/或不可移动介质。
[0021]I/O设备110包括各种设备,这些设备可将数据和/或其他信息输入到计算设备100或从计算设备100检索所述数据或其他信息。示例I/O设备110包括光标控制设备、键盘、小键盘、麦克风、监视器或其他显示设备、扬声器、打印机、网络接口卡、调制解调器、镜头、CCD或其他图像捕获设备等。
[0022]显示设备130包括能够向计算设备100的一个或多个用户显示信息的任何类型的设备。显示设备130可以是监视器、显示终端或视频投影设备等。
[0023]图形处理单元(GPU)132可以耦合到处理器102和/或显示设备130。GPU可以用于渲染计算机生成的图像并执行其他图形处理。GPU可以拥有诸如处理器102之类的通用处理器的一些或全部功能。GPU还可以拥有特定于图形处理的附加功能。GPU可以拥有坐标变换、阴影、纹理、光栅化以及其他有助渲染计算机生成图像的功能相关的硬编码和本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种设备,包括:第一输入缓冲器,被配置为存储具有第一宽度的第一值;第二输入缓冲器,被配置为存储具有第一宽度的第二值;乘法/累加电路,被配置为对具有第二宽度的输入参数执行乘法/累加操作,该第二宽度是第一宽度的一半;组累加器,被配置为累加输出乘法/累加电路;定序器,其中,对于第一输入缓冲器和第二输入缓冲器可能的部分位置的多个组合中的每个组合,该定序器用于:将对应的第一值和第二值的部分输入到乘法器累加电路;以及调用组累加器将乘/累加电路的输出添加到一个组累加缓冲器的内容中。2.根据权利要求1所述的设备,其中,所述第一输入缓冲器和所述第二输入缓冲器的所述部分位置包括:一个高部和一个低部,其中,高部具有比低部高的幅度,高部和低部不重叠,并且高部的位数和低部的位数之和等于第一宽度中的位数。3.根据权利要求2所述的设备,其中第一输入缓冲器和第二输入缓冲器可能的部分位置的多个组合包括:第一输入缓冲器中的第一值的高部和第二输入缓冲器中的第二值的高部;第一输入缓冲器中的第一值的低部和第二输入缓冲器中的第二值的高部;第一输入缓冲器中的第一值的低部和第二输入缓冲器中的第二值的低部;第一个输入缓冲区中的第一值的高部和第二个输入缓冲区中的第二个值的低部。4.根据权利要求3所述的设备,其中,所述第二宽度是所述第一宽度的一半。5.根据权利要求4所述的设备,其中,所述第一宽度为16位,并且所述第一宽度为8位。6.根据权利要求5所述的设备,其中,所述组累加缓冲器具有48位的宽度。7.根据权利要求4所述的设备,其中,所述组累加器还被配置为:当第一输入缓冲器和第二输入缓冲器的部分位置的每个组合包括第一输入缓冲器的高部和第二输入缓冲器的高部时,将乘法/累加电路的输出移位第一宽度以获得移位后的输出,并将移位后的输出添加到组累加器缓冲器的内容中;当第一输入缓冲区和第二输入缓冲区的部分位置的每个组合仅包括第一输入缓冲区和第二输入缓冲区中的一个的高部时,将乘法/累加电路的输出移位第二宽度以获得移位后的输出,并将移位后的输出添加到组累加器缓冲区的内容中。8.根据权利要求1所述的设备,其进一步包含一个控制器,所述控制器经编程以使用所述第一输入缓冲器,乘法/累加电路,定序器及组累加器来实施卷积神经网络。9.根据权利要求1所述的设备,其进一步包含图形处理单元,所述图形处理单元包含所述第一输入缓冲器,乘...

【专利技术属性】
技术研发人员:罗文杰孟跃张晋
申请(专利权)人:芯原控股有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1