用于芯片检测任务的人工智能芯片计算方法技术

技术编号:39579608 阅读:9 留言:0更新日期:2023-12-03 19:30
本发明专利技术是关于用于芯片检测任务的人工智能芯片计算方法

【技术实现步骤摘要】
用于芯片检测任务的人工智能芯片计算方法、装置及芯片


[0001]本专利技术涉及计算机
,尤其涉及用于芯片检测任务的人工智能芯片计算方法

装置及芯片


技术介绍

[0002]现有技术中,用于检测任务

计算任务的人工智能芯片方案主要分为两类,一类是通用处理器,如
CPU

Central Processing Unit
,中央处理器)
、FPGA

Field Programmable Gate Array
,现场可编程门阵列)等,通过软件实现人工智能计算;另一类是专门针对人工神经网络的加速处理器,如
Nvidia

GPU

Graphics Processing Unit
,图形处理器)
、Google

TPU

Tensor Processing Units
,张量处理器)等

这些芯片方案在不同场景下有其优劣势,但是对于多任务自分配和调度的问题,需要在软硬件结合的设计上做更多的优化和创新

[0003]传统的人工神经网络处理器中,面临着算力不足

功耗过大

时延较长等问题,严重影响人工智能芯片在更多场景中的普及和使用

例如,在现有方案中,芯片内部的数据计算尤其是针对浮点数据的计算仍有较大的计算开销,传统的计算方式往往会带来很多冗余的计算和不必要的时延,如何进一步提升人工智能芯片计算能力,成为亟待解决的问题


技术实现思路

[0004]为克服相关技术中存在的问题,本专利技术的实施例提供一种用于芯片检测任务的人工智能芯片计算方法

装置及芯片

技术方案如下:
[0005]根据本专利技术的实施例的第一方面,提供一种用于芯片检测任务的人工智能芯片计算方法,包括:
[0006]在同一计算任务内,根据不同聚合等级将待计算浮点数据对齐到相应的基准指数位,得到多个浮点数据块,同一浮点数据块中的浮点数据具有相同的基准指数位;所述聚合等级能根据计算任务和计算时间进行动态调整;
[0007]对浮点数据块中的浮点数据进行计算:若是加减运算,则直接进行浮点数据的尾数加减运算;若是乘法运算,则直接对指数位进行移位;若是除法运算,则将指数位直接转化为归零

[0008]在本申请一实施例中,所述根据不同聚合等级将待计算浮点数据对齐到相应的基准指数位,包括:
[0009]接收随着待计算浮点数据下发的多个聚合等级以及聚合信息,所述聚合信息指明了要对齐到相应聚合等级的浮点数据;
[0010]根据聚合信息将浮点数据的指数位对齐到相应聚合等级对应的基准指数位;其中,聚合等级对应的基准指数位能动态调整

[0011]在本申请一实施例中,所述方法还包括:
[0012]将浮点数据的指数位对齐到相应聚合等级对应的基准指数位时,引入额外预设比
特数用于存储对齐产生的移位信息

[0013]在本申请一实施例中,所述方法还包括:
[0014]对浮点数据块中的浮点数据进行计算之前,对浮点数据进行变换;其中,所述变换包括以下至少一种:傅里叶变换

指数变换
、Z
变换
、cordic
变换;
[0015]对浮点数据进行计算之后的结果进行逆变换后输出

[0016]根据本专利技术的实施例的第二方面,提供一种用于芯片检测任务的人工智能芯片计算装置,包括:
[0017]控制模块,用于在同一计算任务内,根据不同聚合等级将待计算浮点数据对齐到相应的基准指数位,得到多个浮点数据块,同一浮点数据块中的浮点数据具有相同的基准指数位;所述聚合等级能根据计算任务和计算时间进行动态调整;
[0018]计算模块,用于对浮点数据块中的浮点数据进行计算:若是加减运算,则直接进行浮点数据的尾数加减运算;若是乘法运算,则直接对指数位进行移位;若是除法运算,则将指数位直接转化为归零

[0019]在本申请一实施例中,所述控制模块用于:
[0020]接收随着待计算浮点数据下发的多个聚合等级以及聚合信息,所述聚合信息指明了要对齐到相应聚合等级的浮点数据;
[0021]根据聚合信息将浮点数据的指数位对齐到相应聚合等级对应的基准指数位;其中,聚合等级对应的基准指数位能动态调整

[0022]在本申请一实施例中,所述控制模块还用于:
[0023]将浮点数据的指数位对齐到相应聚合等级对应的基准指数位时,引入额外预设比特数用于存储对齐产生的移位信息

[0024]在本申请一实施例中,所述控制模块还用于:
[0025]对浮点数据块中的浮点数据进行计算之前,对浮点数据进行变换;其中,所述变换包括以下至少一种:傅里叶变换

指数变换
、Z
变换
、cordic
变换;
[0026]对浮点数据进行计算之后的结果进行逆变换后输出

[0027]根据本专利技术的实施例的第三方面,一种人工智能芯片,包括上述第二方面中任一项所述的用于芯片检测任务的人工智能芯片计算装置

[0028]根据本专利技术的实施例的第四方面,提供一种计算机可读存储介质,其上存储有计算机指令,该指令被处理器执行时实现本专利技术的实施例的第一方面中任一项方法的步骤

[0029]本专利技术的实施例提供的技术方案,在同一计算任务内,计算单元进行计算之前,先根据不同聚合等级将待计算浮点数据对齐到相应的基准指数位得到多个浮点数据块,然后在对浮点数据块中的浮点数据进行计算时,若是加减运算无需进行对齐操作,若是乘法运算,则将原本的指数位相加操作转化为对指数位移位;若是除法运算,则将原本的指数位相减直接转化为归零,从而提高了计算效率

[0030]应当理解的是,以上的一般描述和后文的细节描述仅是示例性和解释性的,并不能限制本专利技术

附图说明
[0031]此处的附图被并入说明书中并构成本说明书的一部分,示出了符合本专利技术的实施
例,并与说明书一起用于解释本专利技术的原理

[0032]图1是根据一示例性实施例示出的用于芯片检测任务的人工智能芯片计算方法的流程图

[0033]图2是根据一示例性实施例示出的用于芯片检测任务的人工智能芯片计算方法的流程图

[0034]图3是根据一示例性实施例示出的用于芯片检测任务的人工智能芯片计算装置的框图

[0035]图4是根据一示例性实施例示出的用于芯片检测任务的人工智能芯片计算装置的框图
...

【技术保护点】

【技术特征摘要】
1.
一种用于芯片检测任务的人工智能芯片计算方法,其特征在于,包括:在同一计算任务内,根据不同聚合等级将待计算浮点数据对齐到相应的基准指数位,得到多个浮点数据块,同一浮点数据块中的浮点数据具有相同的基准指数位;所述聚合等级能根据计算任务和计算时间进行动态调整;对浮点数据块中的浮点数据进行计算:若是加减运算,则直接进行浮点数据的尾数加减运算;若是乘法运算,则直接对指数位进行移位;若是除法运算,则将指数位直接转化为归零
。2.
根据权利要求1所述的方法,其特征在于,所述根据不同聚合等级将待计算浮点数据对齐到相应的基准指数位,包括:接收随着待计算浮点数据下发的多个聚合等级以及聚合信息,所述聚合信息指明了要对齐到相应聚合等级的浮点数据;根据聚合信息将浮点数据的指数位对齐到相应聚合等级对应的基准指数位;其中,聚合等级对应的基准指数位能动态调整
。3.
根据权利要求2所述的方法,其特征在于,所述方法还包括:将浮点数据的指数位对齐到相应聚合等级对应的基准指数位时,引入额外预设比特数用于存储对齐产生的移位信息
。4.
根据权利要求1所述的方法,其特征在于,所述方法还包括:对浮点数据块中的浮点数据进行计算之前,对浮点数据进行变换;其中,所述变换包括以下至少一种:傅里叶变换

指数变换
、Z
变换
、cordic
变换;对浮点数据进行计算之后的结果进行逆变换后输出
。5.
一种用于芯片检测任务的人工智能芯片计算装置,其特征在于,包括:控制模块,用于在同一计算任务内,根据不同聚合等级将待计算浮点数据对齐到...

【专利技术属性】
技术研发人员:王洲孙烨磊唐晓楠王春祥王雅婷李慧清杨威杨雷明巴宁岳文
申请(专利权)人:北京星宇天航科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1