System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种多精度调整及数据跳过的人工智能芯片架构方案制造技术_技高网

一种多精度调整及数据跳过的人工智能芯片架构方案制造技术

技术编号:40953352 阅读:3 留言:0更新日期:2024-04-18 20:29
本发明专利技术公开了一种面向人工智能芯片的实现方法及电路,该方法包括:所提出的人工智能芯片由一个计算阵列作为核心,计算阵列内部包含多个计算单元,计算单元可以支持不同的精度调整以实现自身精度的自调整,所述计算单元可以根据任务和配置需要灵活切换自身数据精度,以实现在当前计算设备内提高精度或者降低精度且可以进行灵活的自分配,如部分高算力需求任务可以执行在高精度范围,部分低算力需求任务可以执行在低精度范围,以更好的支持多精度操作等应用。进一步的,所提出的计算单元内部包含精度自动选择和跳过机制,可以实现计算过程中精度的自调整,并依据实时计算任务进行调整,当输入数据较小时可以选择直接数据跳过或者降低为单比特的门电路操作,以实现具体的精度调整和对齐操作,以及计算任务的灵活精度分配和调整。

【技术实现步骤摘要】

本专利技术实施例涉及数据处理,尤其涉及一种面向人工智能芯片的实现方法及电路。


技术介绍

1、现有技术中,传统的人工神经网络处理器中,现有的技术主要包括传统的单精度浮点数运算、双精度浮点数运算和定点运算等方式。然而,这些技术都存在一定的局限性,例如单精度浮点数运算在精度上存在不足,而双精度浮点数运算则会占用较多的计算资源和存储资源,定点运算的精度虽然较高,但需要花费较多的设计成本和开发周期。因此,需要提出一种更加灵活、高效的多精度调整及数据跳过的人工智能芯片架构方案,以更好地支持多精度操作等应用。

2、现有的人工智能芯片在精度调整方面存在一定的局限性。例如,固定精度的计算单元只能进行一定精度的计算,难以适应不同任务的需求。另外,现有的计算单元在执行低精度计算时,由于存在数据丢失的问题,可能会影响计算结果的准确性。此外,现有技术在多精度调整和灵活分配方面的能力也较为有限,不能满足各种不同应用场景的需求。


技术实现思路

1、本专利技术实施例提供一种面向人工智能芯片的实现方法及电路,用以实现多精度自分配及调整,并且具有更好的适应性和灵活性。

2、第一方面,一种面向人工智能芯片的实现方法及电路,其特征在于,包括:

3、电路包含一个或多个计算阵列,计算阵列内部包含多个计算单元,计算单元所述计算单元可以根据任务和配置需要灵活切换自身数据精度,以实现在当前计算设备内提高精度或者降低精度且可以进行灵活的自分配,如部分高算力需求任务可以执行在高精度范围,部分低算力需求任务可以执行在低精度范围,以更好的支持多精度操作等应用;

4、其中,所述计算单元可以根据任务和配置需要灵活切换自身数据精度,以实现在当前计算设备内增加数据精度或者降低数据精度且可以进行灵活的自分配;

5、其中,本权利要求提出的计算单元可以根据任务和配置需要灵活切换提高精度或者降低精度,即在第一时间段内执行第一数据精度,在第二时间段内执行第二数据精度,第一数据精度和第二数据精度不同,以更好的支持精度调整等应用;

6、其中,通过上述方法,实现在当前计算设备内不同的数据精度进行且可以进行灵活的自分配自调整。

7、在一种可能的设计中,其特征在于,所述不同的计算单元可以根据任务和配置需要分别独立的提高数据精度或者降低数据精度。在该计算单元陈列中,部分承载高算力需求任务的计算单元可以执行在高精度范围,部分承载低算力需求任务的计算单元可以执行在低精度范围。所述计算任务类型包括训练任务、推理任务和训练推理同步进行任务。根据不同的任务和配置需要,计算单元可以实现不同的数据精度以实现自身数据精度的自调整,以及在当前计算设备内实现不同计算单元分别的提高精度或者降低精度且可以进行灵活的自分配。

8、在一种可能的设计中,其特征在于,所述计算单元之间包含精度自动选择对齐机制,以实现跨精度数据的整合和对齐操作,以及计算任务的灵活频率分配和调整。在该精度自动选择对齐中,计算单元可以将数据结果根据下一个计算单元需要的精度格式,进行预调整,再进行输出,完成计算阵列内部计算单元之间的跨精度数据的传输和整合。所述精度自动选择对齐机制,为灵活精度调整机制,对应计算单元的输出精度不受计算单元内部精度精度限制。

9、计算单元获取当前需要执行的任务序列,然后通过控制器对计算单元的数据精度进行切换和配置。所述计算任务序列包括第一任务、第二任务、第三任务等。根据不同的任务和配置需要,计算单元可以实现不同的数据精度以实现自身精度的调整,以实现在当前计算设备内提高精度或者精度且可以进行灵活的自分配。

10、在一种可能的设计中,其特征在于,所提出的计算单元内部采用小数据直接跳过或单比特计算机制,确定数据的更优化精度节省。具体来说,当输入数据较小时,该芯片会根据精度选择机制选择数据的精度调整方式,包括数据跳过和降低为单比特的门电路操作。如果数据的精度较低,芯片可以直接跳过这些数据,避免进行不必要的计算,以提高计算效率。

11、其中,通过上述方法,实现在当前计算设备内某些特定场景下精度的进一步降低且可以进行灵活的自分配。

12、在一种可能的设计中,其特征在于,所提出的计算单元内部采用下一计算单元所需精度问询机制。即完成计算的上一计算单元先向下一计算单元方发送所需数据精度问询,下一计算单元收到问询后再发送具体精度需求,以确保数据的精度匹配性。

13、其中,本权利要求提出的计算单元,其特征在于根据任务和配置需要灵活切换自身发送或接收任务类型和所执行的实时计算任务所需的精度,即如在第一时间段内执行第一任务的精度需求问询,在第二时间段内执行第二任务的精度回应接收,第一任务和第二任务属于不同的计算需求,以更好的多任务同步调度;

14、其中,通过上述方法,实现在当前计算设备内更为精准的提高精度或降低精度且可以进行灵活的自分配。

15、在一种可能的设计中,其特征在于,所提出的计算单元内部包括中间精度计算机制。具体来讲,计算单元可以将需要不确定下一计算单元精度的情况下的输出数据统一转化为通用型较强的某一中间精度格式。所述中间精度格式,其精度一般保证最大化,以确保下一计算单元的高精度计算需求。在进行中间精度计算时,计算单元可以根据任务和配置需要动态调整自身的输出精度范围,以实现任务之间的灵活中间精度分配和调整。下一计算单元收到中间精度之后,再根据自身数据需要,对其进行简化,以完成进一步的数据计算。

16、所述需要中间精度计算机制包括计算参数和或计算数据本身,第一参数为第一任务所需参数,第二参数为第二任务所需参数,所述第一参数和第二参数分别进行中间精度值读取和存放。

17、其中,本权利要求提出的计算单元,其特征在于根据任务和配置需要灵活读取存放输出中间精度数据,即如在第一时间段内执行第一任务的第一中间精度参数运算,在第二时间段内执行第二任务的第二中间精度参数运算,第一任务和第二任务属于不同的计算需求,以更好的多任务同步调度;

18、其中,通过上述方法,实现在当前计算设备内不同的任务的中间精度参数运算进行跨精度的灵活的自分配自调整。

19、在一种可能的设计中,其特征在于,该芯片的计算流程如下:

20、s1输入数据:将数据输入到芯片的计算阵列中。

21、s2精度选择和跳过机制:计算阵列内部的计算单元包含精度选择和跳过机制,根据输入数据的大小和配置要求,可以选择直接跳过或者降低精度。

22、s3多精度计算:根据任务和配置要求,计算单元可以灵活切换自身的数据精度,以实现在当前计算设备内提高精度或者降低精度且可以进行灵活的自分配。

23、s4单比特极简运算:本专利技术针对数据量非常小的值,提出的单比特电路近似是一种通过将数字信号量化为1或0的二进制值来近似处理数值计算的方法。

24、s5输出结果:将计算结果输出到芯片的输出端口。

25、计算单元的处理流程会根据任务的类型和计本文档来自技高网...

【技术保护点】

1.一种面向人工智能芯片的实现方法及电路,其特征在于,包括:

2.如权利要求1所述的电路,其特征在于,所述不同的计算单元可以根据任务和配置需要分别独立的提高数据精度或者降低数据精度。在该计算单元陈列中,部分承载高算力需求任务的计算单元可以执行在高精度范围,部分承载低算力需求任务的计算单元可以执行在低精度范围。所述计算任务类型包括训练任务、推理任务和训练推理同步进行任务。根据不同的任务和配置需要,计算单元可以实现不同的数据精度以实现自身数据精度的自调整,以及在当前计算设备内实现不同计算单元分别的提高精度或者降低精度且可以进行灵活的自分配。

3.如权利要求1所述的电路,其特征在于,所述计算单元之间包含精度自动选择对齐机制,以实现跨精度数据的整合和对齐操作,以及计算任务的灵活频率分配和调整。在该精度自动选择对齐中,计算单元可以将数据结果根据下一个计算单元需要的精度格式,进行预调整,再进行输出,完成计算阵列内部计算单元之间的跨精度数据的传输和整合。所述精度自动选择对齐机制,为灵活精度调整机制,对应计算单元的输出精度不受计算单元内部精度精度限制。计算单元获取当前需要执行的任务序列,然后通过控制器对计算单元的数据精度进行切换和配置。所述计算任务序列包括第一任务、第二任务、第三任务等。根据不同的任务和配置需要,计算单元可以实现不同的数据精度以实现自身精度的调整,以实现在当前计算设备内提高精度或者精度且可以进行灵活的自分配。

4.如权利要求1所述的电路,其特征在于,所提出的计算单元内部采用小数据直接跳过或单比特计算机制,确定数据的更优化精度节省。具体来说,当输入数据较小时,该芯片会根据精度选择机制选择数据的精度调整方式,包括数据跳过和降低为单比特的门电路操作。如果数据的精度较低,芯片可以直接跳过这些数据,避免进行不必要的计算,以提高计算效率。其中,通过上述方法,实现在当前计算设备内某些特定场景下精度的进一步降低且可以进行灵活的自分配。

5.如权利要求1所述的电路,其特征在于,所提出的计算单元内部采用下一计算单元所需精度问询机制。即完成计算的上一计算单元先向下一计算单元方发送所需数据精度问询,下一计算单元收到问询后再发送具体精度需求,以确保数据的精度匹配性。其中,本权利要求提出的计算单元,其特征在于根据任务和配置需要灵活切换自身发送或接收任务类型和所执行的实时计算任务所需的精度,即如在第一时间段内执行第一任务的精度需求问询,在第二时间段内执行第二任务的精度回应接收,第一任务和第二任务属于不同的计算需求,以更好的多任务同步调度;其中,通过上述方法,实现在当前计算设备内更为精准的提高精度或降低精度且可以进行灵活的自分配。

6.如权利要求1所述的电路,其特征在于,所提出的计算单元内部包括中间精度计算机制。具体来讲,计算单元可以将需要不确定下一计算单元精度的情况下的输出数据统一转化为通用型较强的某一中间精度格式。所述中间精度格式,其精度一般保证最大化,以确保下一计算单元的高精度计算需求。在进行中间精度计算时,计算单元可以根据任务和配置需要动态调整自身的输出精度范围,以实现任务之间的灵活中间精度分配和调整。下一计算单元收到中间精度之后,再根据自身数据需要,对其进行简化,以完成进一步的数据计算。所述需要中间精度计算机制包括计算参数和或计算数据本身,第一参数为第一任务所需参数,第二参数为第二任务所需参数,所述第一参数和第二参数分别进行中间精度值读取和存放。其中,本权利要求提出的计算单元,其特征在于根据任务和配置需要灵活读取存放输出中间精度数据,即如在第一时间段内执行第一任务的第一中间精度参数运算,在第二时间段内执行第二任务的第二中间精度参数运算,第一任务和第二任务属于不同的计算需求,以更好的多任务同步调度;其中,通过上述方法,实现在当前计算设备内不同的任务的中间精度参数运算进行跨精度的灵活的自分配自调整。

7.如权利要求1所述的电路,其特征在于,该芯片的计算流程如下:S1输入数据:将数据输入到芯片的计算阵列中。S2精度选择和跳过机制:计算阵列内部的计算单元包含精度选择和跳过机制,根据输入数据的大小和配置要求,可以选择直接跳过或者降低精度。S3多精度计算:根据任务和配置要求,计算单元可以灵活切换自身的数据精度,以实现在当前计算设备内提高精度或者降低精度且可以进行灵活的自分配。S4单比特极简运算:本专利技术针对数据量非常小的值,提出的单比特电路近似是一种通过将数字信号量化为1或0的二进制值来近似处理数值计算的方法。S5输出结果:将计算结果输出到芯片的输出端口。计算单元的处理流程会根据任务的类型和计算单元的类型进行优化和调整,以保证计算效率和准确性。

8.如权利要求1所述的电路,...

【技术特征摘要】

1.一种面向人工智能芯片的实现方法及电路,其特征在于,包括:

2.如权利要求1所述的电路,其特征在于,所述不同的计算单元可以根据任务和配置需要分别独立的提高数据精度或者降低数据精度。在该计算单元陈列中,部分承载高算力需求任务的计算单元可以执行在高精度范围,部分承载低算力需求任务的计算单元可以执行在低精度范围。所述计算任务类型包括训练任务、推理任务和训练推理同步进行任务。根据不同的任务和配置需要,计算单元可以实现不同的数据精度以实现自身数据精度的自调整,以及在当前计算设备内实现不同计算单元分别的提高精度或者降低精度且可以进行灵活的自分配。

3.如权利要求1所述的电路,其特征在于,所述计算单元之间包含精度自动选择对齐机制,以实现跨精度数据的整合和对齐操作,以及计算任务的灵活频率分配和调整。在该精度自动选择对齐中,计算单元可以将数据结果根据下一个计算单元需要的精度格式,进行预调整,再进行输出,完成计算阵列内部计算单元之间的跨精度数据的传输和整合。所述精度自动选择对齐机制,为灵活精度调整机制,对应计算单元的输出精度不受计算单元内部精度精度限制。计算单元获取当前需要执行的任务序列,然后通过控制器对计算单元的数据精度进行切换和配置。所述计算任务序列包括第一任务、第二任务、第三任务等。根据不同的任务和配置需要,计算单元可以实现不同的数据精度以实现自身精度的调整,以实现在当前计算设备内提高精度或者精度且可以进行灵活的自分配。

4.如权利要求1所述的电路,其特征在于,所提出的计算单元内部采用小数据直接跳过或单比特计算机制,确定数据的更优化精度节省。具体来说,当输入数据较小时,该芯片会根据精度选择机制选择数据的精度调整方式,包括数据跳过和降低为单比特的门电路操作。如果数据的精度较低,芯片可以直接跳过这些数据,避免进行不必要的计算,以提高计算效率。其中,通过上述方法,实现在当前计算设备内某些特定场景下精度的进一步降低且可以进行灵活的自分配。

5.如权利要求1所述的电路,其特征在于,所提出的计算单元内部采用下一计算单元所需精度问询机制。即完成计算的上一计算单元先向下一计算单元方发送所需数据精度问询,下一计算单元收到问询后再发送具体精度需求,以确保数据的精度匹配性。其中,本权利要求提出的计算单元,其特征在于根据任务和配置需要灵活切换自身发送或接收任务类型和所执行的实时计算任务所需的精度,即如在第一时间段内执行第一任务的精度需求问询,在第二时间段内执行第二任务的精度回应接收,第...

【专利技术属性】
技术研发人员:岳文王春祥王洲王雅婷巴宁
申请(专利权)人:北京冠邦开源技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1