一种向量计算装置及方法制造方法及图纸

技术编号:30068085 阅读:19 留言:0更新日期:2021-09-18 08:19
本申请实施例公开了一种向量计算装置及方法,涉及计算机领域,减少了向量计算过程的耗时,降低了向量计算过程的功耗,提高了向量计算的效率。具体方案为:获取待计算向量和第一函数;并行将待计算向量的标量数值分别与规则条件对比,得到待计算向量中每个标量数值的状态信息;确定待计算向量中存在标量数值处于正常状态;将待计算向量中处于正常状态的标量数值并行代入第一函数计算,得到待计算向量的第一函数的计算结果。第一函数的计算结果。第一函数的计算结果。

【技术实现步骤摘要】
一种向量计算装置及方法


[0001]本申请实施例涉及计算机领域,尤其涉及一种向量计算装置及方法。

技术介绍

[0002]基础数学库是高性能计算机系统的核心,主要用于完成科学、工程中常见的数值密集型运算。基础数学库的计算性能直接影响上层各种科学、工程的计算效率,因此,提高基础数学库的计算效率有着十分重要的意义。
[0003]随着单指令流多数据(single instruction multiple data,SIMD)技术的提出,采用SIMD技术开发的向量基础数学库广泛应用。较传统的标量基础数学库而言,向量基础数学库在处理包含多个标量数据的向量时,将传统的串行处理方式转换为并行处理,可以加速数据的处理性能,使基础数学库的计算速率显著提高。在多媒体和信号处理等领域的应用过程中,采用上述向量基础数据库进行数值计算时,数据处理效率明显提升。
[0004]当前,向量基础数学库的计算过程为:首先,获取需要计算的向量数值和计算函数;然后,串行检测向量中包括的多个标量数值的状态,判断向量中的每个标量数值是否正常,若所有标量数值均处于正常状态,则将计算函数采用幂级数转换为多项式,再用SIMD指令集并行将所有标量数值代入多项式计算,得到多项式计算结果输出;若向量中的至少一个标量值存在异常状态时,则以串行方式对每个标量数值进行处理,对异常状态的标量数值输出异常信息,对正常状态的标量数值进行多项式计算输出结果。
[0005]可以看出,当前的向量基础数学库计算过程,耗时长、处理效率低,指令读取次数多、访存事务数量大,功耗消耗大。

技术实现思路

[0006]本申请提供一种向量计算装置及方法,减少了向量计算过程的耗时,降低了向量计算过程的功耗,提高了向量计算的效率。
[0007]为了达到上述目的,本申请采用如下技术方案:
[0008]第一方面,本申请提供一种向量计算装置,该装置可以包括:获取单元、处理单元、确定单元和计算单元。该装置配置了逻辑模块,该逻辑模块可以包括多组并联的算术逻辑单元(arithmetic and logic unit,ALU)。其中,获取单元,用于获取待计算向量和第一函数,待计算向量包括多个标量数值;处理单元,用于通过多组并联的ALU,并行将待计算向量的标量数值分别与规则条件对比,得到待计算向量中每个标量数值的状态信息;其中,规则条件用于判断标量数值是否正常,一个标量数值的状态信息用于指示一个标量数值与规则条件对比处于正常状态或者异常状态;确定单元,用于确定待计算向量中存在标量数值处于正常状态;计算单元,用于将待计算向量中处于正常状态的标量数值并行代入第一函数计算,得到待计算向量的第一函数的计算结果。
[0009]通过本申请提供的向量计算装置,在向量计算时,并行检测向量中每个标量数值的状态;在向量中存在标量数值正常时,并行对正常状态的标量数值进行函数计算,减少了
向量计算过程中指令读取次数和访存事务数量;进一步减少了向量计算过程的耗时,降低了向量计算过程的功耗,提高了向量计算的效率。
[0010]其中,ALU可以指执行算术和逻辑运算的组合逻辑电路。逻辑模块中包括了多组并联的ALU,用于执行并行操作。
[0011]规则条件的内容可以根据实际需求进行配置,本申请对此不予限定。
[0012]第一函数为待计算向量要参与的计算,本文所称的第一函数可以为第一函数的表达式,或者也可以为第一函数转换后的多项式,或者其他。
[0013]结合第一方面或上述一种可能的实现方式中,在另一种可能的实现方式中,该处理单元具体用于:调用第一指令,以启动多组并联的ALU,通过多组并联的ALU,并行将待计算向量的标量数值分别与规则条件对比,得到待计算向量中每个标量数值的状态信息。在该可能的实现方式中,通过配置的第一指令实现了并行的对比检测,与通过多条指令实现相比,减少了向量计算过程中指令读取次数和访存事务数量;进一步减少了向量计算过程的耗时,降低了向量计算过程的功耗,提高了向量计算的效率。
[0014]结合第一方面或上述任一种可能的实现方式,在另一种可能的实现方式中,该确定单元具体用于:调用第二指令,以启动多组并联的ALU,通过多组并联的ALU,并行将待计算向量中每个标量数值的状态信息与判断条件对比,确定待计算向量中存在标量数值处于正常状态。在该可能的实现方式中,通过配置的第二指令实现了并行判断待计算向量中是否存在标量数值处于正常状态,与通过多个指令实现相比,减少了向量计算过程中指令读取次数和访存事务数量;进一步减少了向量计算过程的耗时,降低了向量计算过程的功耗,提高了向量计算的效率。
[0015]其中,判断条件可以根据用户的实际需求进行配置,本申请不做具体限定。
[0016]结合第一方面或上述任一种可能的实现方式,在另一种可能的实现方式中,获取单元还可以用于,获取第一函数转换后的多项式系数向量;该计算单元具体用于:调用三指令,以启动多组并联的ALU,通过多组并联的ALU,并行对待计算向量中处于正常状态的标量数值和系数向量进行乘加计算,得到待计算向量中处于正常状态的标量数值的多项式值。在该可能的实现方式中,通过配置的第三指令实现了并行多项式计算,与通过多个指令实现相比,减少了向量计算过程中指令读取次数和访存事务数量;进一步减少了向量计算过程的耗时,降低了向量计算过程的功耗,提高了向量计算的效率。
[0017]结合第一方面或上述任一种可能的实现方式,在另一种可能的实现方式中,该向量计算装置还可以包括配置单元,用于配置启动多组并联的ALU的指令。
[0018]其中,配置单元配置的启动多组并联的ALU的指令可以为下述一项或多项:第一指令、第二指令、第三指令。
[0019]结合第一方面或上述任一种可能的实现方式,在另一种可能的实现方式中,逻辑模块可以包括第一逻辑子模块、第二逻辑子模块及第三逻辑子模块;不同逻辑子模块分别包括并联的ALU,用于执行不同的并行操作。其中,一个逻辑子模块包括的并联的ALU为逻辑模块包括的多组并联的ALU的子集。
[0020]结合第一方面或上述任一种可能的实现方式,在另一种可能的实现方式中,规则条件可以包括下述一项或多项:是否大于最大阈值、是否小于最小阈值、是否为非数(not a number,NaN)、是否为负无穷、是否为正无穷。
[0021]状态信息可以包括与每个规则条件项的对比结果。
[0022]结合第一方面或上述任一种可能的实现方式,在另一种可能的实现方式中,规则条件可以为:是否属于规定范围内。
[0023]结合第一方面或上述任一种可能的实现方式,在另一种可能的实现方式中,该向量计算装置还可以包括输出单元,用于输出待计算向量的第一函数的计算结果。
[0024]结合第一方面或上述任一种可能的实现方式,在另一种可能的实现方式中,输出单元还可以用于,在待计算向量中存在处于异常状态的标量数值时,对待计算向量中处于异常状态的标量数值进行异常输出。
[0025]第二方面,本申请提供本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种向量计算装置,其特征在于,所述装置配置了逻辑模块;所述逻辑模块包括多组并联的算术逻辑单元ALU;所述装置包括:获取单元,用于:获取待计算向量和第一函数,所述待计算向量包括多个标量数值;处理单元,用于:通过所述多组并联的ALU,并行将所述待计算向量的标量数值分别与规则条件对比,得到所述待计算向量中每个标量数值的状态信息;其中,所述规则条件用于判断标量数值是否正常,一个标量数值的状态信息用于指示所述一个标量数值与所述规则条件对比处于正常状态或者异常状态;确定单元,用于:确定所述待计算向量中存在标量数值处于正常状态;计算单元,用于:将所述待计算向量中处于正常状态的标量数值并行代入所述第一函数计算,得到所述待计算向量的所述第一函数的计算结果。2.根据权利要求1所述的装置,其特征在于,所述处理单元具体用于:调用第一指令,以启动所述多组并联的ALU,通过所述多组并联的ALU,并行将所述待计算向量的标量数值分别与所述规则条件对比,得到所述待计算向量中每个标量数值的状态信息。3.根据权利要求1或2所述的装置,其特征在于,所述确定单元具体用于:调用第二指令,以启动所述多组并联的ALU,通过所述多组并联的ALU,并行将所述待计算向量中每个标量数值的所述状态信息与判断条件对比,确定所述待计算向量中存在标量数值处于正常状态。4.根据权利要求1-3任一项所述的装置,其特征在于,所述获取单元还用于,获取所述第一函数转换后的多项式系数向量;所述计算单元具体用于:调用第三指令,以启动所述多组并联的ALU,通过所述多组并联的ALU,并行对所述待计算向量中处于正常状态的标量数值和所述系数向量进行乘加计算,得到所述待计算向量中处于正常状态的标量数值的多项式值。5.根据权利要求1-4任一项所述的装置,其特征在于,所述装置还包括配置单元,用于配置启动所述多组并联的ALU的指令。6.根据权利要求1-5任一项所述的装置,其特征在于,所述逻辑模块包括第一逻辑子模块、第二逻辑子模块及第三逻辑子模块;不同逻辑子模块分别包括并联的ALU,用于执行不同的并行操作;其中,一个逻辑子模块包括的并联的ALU为所述逻...

【专利技术属性】
技术研发人员:俞立呈李涛侯新宇张斌
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1