计算电路和人工智能加速器制造技术

技术编号:41996285 阅读:27 留言:0更新日期:2024-07-12 12:21
本申请实施例提供了一种计算电路及人工智能加速器,涉及集成电路技术领域。该计算电路接收多个第一块浮点数,对多个第一块浮点数进行计算,获得多个第二块浮点数,其包括:第一计算单元、转换单元和第二计算单元;第一计算单元接收多个第一块浮点数,对多个第一块浮点数的尾数项进行计算,得到多个第一中间浮点数;转换单元将多个第一中间浮点数归一化为多个归一化尾数项;第二计算单元对多个归一化尾数项进行计算,获得多个第二中间浮点数,基于归一化尾数项将多个第二中间浮点数归一化为多个第二块浮点数。该计算电路降低了电路的逻辑复杂度与功耗,有效降低数据存储需求,解决了人工智能业务存储空间、带宽不足的问题。

【技术实现步骤摘要】

本申请涉及集成电路,特别是涉及一种计算电路和人工智能加速器


技术介绍

1、ai(artificial intelligence,人工智能)加速器是一种专门设计的硬件加速器或计算机系统,其主要功能是加速人工智能应用程序,特别是人工神经网络、机器学习、机器视觉和其他数据密集型或传感器驱动的任务。人工智能算法包含着庞大的计算量和存储量,例如,归一化指数函数(softmax函数)是人工智能模型中常见的算子之一,其将一个任意k维实数矢量压缩至另一个k维实数矢量中,并使新矢量中每一个元素的取值范围都在(0,1)区间内,且所有元素和为1。在概率论中,归一化指数函数的输出可用来表示一个分类概率分布。归一化指数函数的数学表达式如下式所示:

2、

3、然而,目前常用的归一化指数函数计算电路采用浮点数作为电路的。归一化指数函数计算过程中涉及大量的指数、除法操作,传统的电路设计均采用浮点数计算单元,即采用浮点数作为电路的输入、输出,面积大、功耗高、存储与带宽要求高,从而导致人工智能业务存在算力、存储空间、带宽不足等挑战。

/>

技术本文档来自技高网...

【技术保护点】

1.一种计算电路,其特征在于,所述计算电路接收多个第一块浮点数,对所述多个第一块浮点数进行计算,获得多个第二块浮点数;所述多个第一块浮点数共享第一指数项,所述多个第二块浮点数共享第二指数项;

2.根据权利要求1所述的计算电路,其特征在于,所述第一计算单元包括最大值提取子单元、矢量减法子单元、矢量指数计算子单元;

3.根据权利要求2所述的计算电路,其特征在于,所述最大值提取子单元包括比较器阵列,所述比较器阵列对所述多个第一块浮点数的尾数项进行比较,获得所述多个第一块浮点数的尾数项中最大的尾数项。

4.根据权利要求2所述的计算电路,其特征在于,所述矢量减法...

【技术特征摘要】

1.一种计算电路,其特征在于,所述计算电路接收多个第一块浮点数,对所述多个第一块浮点数进行计算,获得多个第二块浮点数;所述多个第一块浮点数共享第一指数项,所述多个第二块浮点数共享第二指数项;

2.根据权利要求1所述的计算电路,其特征在于,所述第一计算单元包括最大值提取子单元、矢量减法子单元、矢量指数计算子单元;

3.根据权利要求2所述的计算电路,其特征在于,所述最大值提取子单元包括比较器阵列,所述比较器阵列对所述多个第一块浮点数的尾数项进行比较,获得所述多个第一块浮点数的尾数项中最大的尾数项。

4.根据权利要求2所述的计算电路,其特征在于,所述矢量减法子单元包括减法器阵列,所述减法器阵列计算各个所述第一块浮点数的尾数项与所述第一尾数项的差值...

【专利技术属性】
技术研发人员:方绍峡原钢
申请(专利权)人:原粒北京半导体技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1