支持向量运算的处理装置、芯片、电子设备和方法制造方法及图纸

技术编号:23363734 阅读:28 留言:0更新日期:2020-02-18 17:35
本申请公开了支持向量运算的处理装置、芯片、电子设备和方法,其中处理装置包括:分级设置的多个运算单元,每级运算单元能够按照同一组输入向量中的输入向量元素的排列顺序分别获取对应的至少两个输入向量元素;第一级的运算单元对其自身所获取的输入向量元素进行运算,并输出相应的结果;后续级的运算单元对上一级的运算单元所输出的结果及其自身所获取的输入向量元素进行运算,并输出相应的结果。通过上述方式,本申请能够提高处理装置的运算效率。

Processing device, chip, electronic equipment and method of support vector operation

【技术实现步骤摘要】
支持向量运算的处理装置、芯片、电子设备和方法
本申请涉及人工智能
,特别是涉及支持向量运算的处理装置、芯片、电子设备和方法。
技术介绍
在人工智能算法的发展下,神经网络算法变得越来越受计算机科学家的重视。其中向量运算大量存在神经网络算法运算中,对于大规模向量运算,现代计算机的算力受到了挑战。向量运算的专用数字电路是提高大规模向量运算的效率的有效方案。目前的计算单元运算大规模向量内部元素求和或者比较最大最小值时需要多次循环来求出结果,难以实现大规模数据吞吐量和高并行度,运行效率低下。
技术实现思路
本申请主要解决的技术问题是提供支持向量运算的处理装置、芯片、电子设备和方法,能够提高向量运算的处理效率。为解决上述技术问题,本申请采用的一个技术方案是:提供一种支持向量运算的处理装置,包括分级设置的多个运算单元,每级运算单元能够按照同一组输入向量中的输入向量元素的排列顺序分别获取对应的至少两个输入向量元素;第一级的运算单元对其自身所获取的输入向量元素进行运算,并输出相应的结果;后续级的运算单元对上一级的运算单元所输出的结果及其自身所获取的输入向量元素进行运算,并得出相应的结果。为解决上述技术问题,本申请采用的另一个技术方案是:提供一种神经网络芯片,包括上述的处理装置。为解决上述技术问题,本申请采用的再一个技术方案是:提供一种电子设备,包括上述的神经网络芯片。为解决上述技术问题,本申请采用的又一个技术方案是:提供一种支持向量运算的处理方法,包括:每级所述运算单元能够按照同一组输入向量中的输入向量元素的排列顺序分别获取对应的至少两个输入向量元素;第一级的所述运算单元对其自身所获取的输入向量元素进行运算,并输出相应的结果发送给下一级的所述运算单元;后续级的所述运算单元获取来自于上一级的所述运算单元的结果,并对上一级的所述运算单元所输出的结果及其自身所获取的输入向量元素进行运算,并得出相应的结果。与现有技术相比,本申请的有益效果是:通过设置分级设置的多个运算单元,第一级的运算单元进行相应运算后,输出相应的运算结果至下一级的运算单元,后续级的运算单元对上一级的运算单元所输出的结果及其自身所获取的输入向量元素进行运算,输出相应的结果,分级计算能够提高运算单元的处理速度,而且可以实现对同一组输入向量的流水式运算,还可以实现对不同组的输入向量进行连续计算,提高整个处理装置的高吞吐量计算。附图说明图1是本申请支持向量运算的处理装置实施例的电路示意框图;图2是本申请支持向量运算的处理装置实施例中的运算单元的第一电路示意框图;图3是本申请支持向量运算的处理装置实施例中的运算单元的第二电路示意框图;图4是本申请支持向量运算的处理装置实施例在整段式运算模式下进行并行运算过程示意图;图5是本申请支持向量运算的处理装置实施例在分段式运算模式下进行并行运算过程示意图;图6是本申请神经网络芯片实施例的结构示意框图;图7是本申请电子设备实施例的结构示意框图;图8是本申请支持向量运算的处理方法实施例的流程示意图。具体实施方式下面将结合本申请实施例中的附图,对本申请实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅是本申请的一部分实施例,而不是全部的实施例。基于本申请中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。参阅图1,本申请支持向量运算的处理装置实施例,可以包括分级设置的多个运算单元10、解码器20、分段寄存器30和运算结果筛选单元40。分级设置的多个运算单元10之间可以顺次连接,也即相邻级的运算单元10之间可以相互连接。每级的运算单元10能够按照同一组输入向量中的输入向量元素的排列顺序分别获取对应的至少两个输入向量元素。在本实施例中,同一组输入向量是指一个输入向量,也是可以依次排列的多个输入向量的组合。第一级的运算单元10对其自身所获取的输入向量元素进行运算,并输出相应的结果。后续级的运算单元10对上一级的运算单元10所输出的结果及其自身所获取的输入向量元素进行运算,并得出相应的结果。在本实施例中,上一级的运算单元10所输出的相应结果可以是其进行运算所得出的运算结果,也可以是根据实际运算情况所设置的结果。通过设置第一级的运算单元10进行相应运算后,输出相应的运算结果至下一级的运算单元10,后续级的运算单元10对上一级的运算单元10所输出的结果及其自身所获取的输入向量元素进行运算,输出相应的结果,分级计算能够提高运算单元10的处理速度,而且可以实现对同一组输入向量的流水式运算,还可以实现对不同组的输入向量进行连续计算,提高整个处理装置的高吞吐量计算。运算单元10可以具有多个运算模式,例如为整段式运算模式和分段式运算模式。在整段式运算模式下,多个运算单元10将所获取的输入向量元素作为整体,并进行连续运算。在分段式运算模式下,多个运算单元10将所获取的输入向量元素划分成多个分段,并分别对各分段内输入向量元素进行运算。设置运算单元10具有多个运算模式,能够满足不同情形的向量元素运算,实现多样运算。运算单元10可以具有多个运算功能,例如为求和运算功能和比较运算功能。多个运算单元10在执行求和运算功能时,可以将所获取的输入向量元素进行求和运算,运算结果为和值。多个运算单元10在整段式运算模式下执行求和运算功能时,将该同一组输入向量的所有输入向量元素进行求和运算。多个运算单元10在分段式下执行求和运算功能时,将同一组输入向量的各分段内是输入向量元素分别进行求和运算。多个运算单元10在执行比较运算功能时,可以将所获取的输入向量元素进行大小比较运算,运算结果为最大值或最小值。多个运算单元10在整段式运算模式下执行比较运算功能时,将该同一组输入向量的所有输入向量元素进行比较运算。多个运算单元10在分段式下执行求和运算功能时,将同一组输入向量的各分段内的输入向量元素分别进行比较运算。参阅图2和3,各运算单元10可以包括分级设置的多组子运算单元100。每组子运算单元100中包括至少一子运算单元100。第一组子运算单元100中的子运算单元100分别对运算单元10所获取的输入向量元素中的部分输入向量元素进行运算,并输出运算结果。其余组子运算单元100中的子运算单元100对前一组子运算单元100中的运算结果进行运算,并输出相应的运算结果。每一子运算单元100包括运算选择器110、结果选择器120以及并联设置于运算选择器110和结果选择器120之间的至少两个运算器130。运算选择器110可以用于切换整段式运算模式或者分段式运算模式,和/或将输入向量元素发送至对应的运算器130。结果选择器120用于将对应的运算器130的运算结果输出。至少两个运算器130可以包括用于执行求和运算功能的加法器131和用于执行比较运算功能的比较器132。加法器131可以包括整型加法器1311、浮点加法器1312。整型加法器本文档来自技高网...

【技术保护点】
1.一种支持向量运算的处理装置,其特征在于,包括:/n分级设置的多个运算单元,每级所述运算单元能够按照同一组输入向量中的输入向量元素的排列顺序分别获取对应的至少两个输入向量元素;/n其中,第一级的所述运算单元对其自身所获取的输入向量元素进行运算,并输出相应的结果;后续级的所述运算单元对上一级的所述运算单元所输出的结果及其自身所获取的所述输入向量元素进行运算,并输出相应的结果。/n

【技术特征摘要】
1.一种支持向量运算的处理装置,其特征在于,包括:
分级设置的多个运算单元,每级所述运算单元能够按照同一组输入向量中的输入向量元素的排列顺序分别获取对应的至少两个输入向量元素;
其中,第一级的所述运算单元对其自身所获取的输入向量元素进行运算,并输出相应的结果;后续级的所述运算单元对上一级的所述运算单元所输出的结果及其自身所获取的所述输入向量元素进行运算,并输出相应的结果。


2.根据权利要求1所述的处理装置,其特征在于:
所述多个运算单元中的至少两个运算单元能够在同一时段对从不同组所述输入向量所获得的所述输入向量元素进行并行运算,所述至少两个运算单元中在所述同一时段各自获取一组所述输入向量,且所述至少两个运算单元所获取的所述输入向量均不同。


3.根据权利要求1所述的处理装置,其特征在于:
所述处理装置还包括解码器,用于对接收到的运算选择指令和/或模式选择指令进行解析,并将解析结果发送给所述多个运算单元,以使得所述多个运算单元执行所述运算选择指令所指定的运算功能和/或执行所述模式选择指令所指定的运算模式。


4.根据权利要求3所述的处理装置,其特征在于:
所述运算模式包括整段式运算模式和分段式运算模式,所述多个运算单元能够执行所述模式选择指令在整段式运算模式和分段式运算模式之间进行切换,其中在所述整段式运算模式下,所述多个运算单元将所获取的所述输入向量元素作为整体,并进行连续运算;在所述分段式运算模式下,所述多个运算单元将所获取的所述输入向量元素划分成多个分段,并分别对各所述分段内输入向量元素进行运算。


5.根据权利要求4所述的处理装置,其特征在于:
所述处理装置还包括分段寄存器,所述分段寄存器用于存储分段标记;
在所述分段式运算模式下,所述多个运算单元根据所述分段指示将所述输入向量元素进行分段,分别对各所述分段内的所述输入向量元素进行运算,分别输出各分段所对应的运算结果。


6.根据权利要求5所述的处理装置,其特征在于:
所述分段寄存器包括分别与各所述输入向量元素对应的标记位,每个所述标记位用于存储第一分段标记或第二分段标记,其中所述第一分段标记用于指示对应的输入向量元素与后续的输入向量元素属于同一分段,所述第二分段标记用于指示对应的输入向量元素与后续的输入向量元素分属不同的分段。


7.根据权利要求6所述的处理装置,其特征在于:
在所述分段式运算模式下,所述运算单元用于判断其自身的最后一个分段内的所述输入向量元素与下一级的所述运算单元的第一个分段内的所述输入向量元素是否属于同一分段,若属于同一分段,则将所述自身的最后一个分段对应的运算结果发送至下一级的所述运算单元。


8.根据权利要求7所述的处理装置,其特征在于:
所述运算功能至少包括求和运算功能和比较运算功能;
在所述整段式运算模式下,所述运算单元在执行所述求和运算功能或者所述比较运算功能时,求和结果或者比较结果作为所述相应的结果进行输出;和/或,
在所述分段式运算模式下,所述运算单元判断其自身的最后一个分段内的所述输入向量元素与下一级的所述运算单元的第一个分段内的所述输入向量元素不属于同一分段,在执行所述求和运算功能时,则将零值输出至下一级的所述运算单元;在执...

【专利技术属性】
技术研发人员:杨龚轶凡郑瀚寻闯小明曾昭睿
申请(专利权)人:深圳芯英科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1