System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 数据处理的方法、装置以及AI芯片制造方法及图纸_技高网

数据处理的方法、装置以及AI芯片制造方法及图纸

技术编号:40356390 阅读:5 留言:0更新日期:2024-02-09 14:42
本申请实施例提供了一种数据处理的方法、装置以及AI芯片,该方法包括:接收第一参数信息,所述第一参数信息包括切分基数以及至少一个辅助数据,其中,所述切分基数用于切分第一数据块,所述至少一个辅助数据用于将所述第一数据块补齐到目标数据块,所述至少一个辅助数据为有效值;基于所述至少一个辅助数据将所述第一数据块补齐到所述目标数据块,并根据所述第一数据块切分的基数将所述目标数据块切分为多个大小规格相同的数据块。本申请提供的技术方案使得目标数据块切分得到的多个规格大小相同的数据块可以进行搬运的情况下,还不会影响第一数据块的运算的结果。

【技术实现步骤摘要】

本申请实施例涉及人工智能领域,并且更具体地,涉及一种数据处理的方法、装置以及ai芯片。


技术介绍

1、人工智能(artificial intelligence,ai)是利用数字计算机或者数字计算机控制的机器模拟、延伸和扩展人的智能,感知环境、获取知识并使用知识获得最佳结果的理论、方法、技术及应用系统。换句话说,人工智能是计算机科学的一个分支,它企图了解智能的实质,并生产出一种新的能以人类智能相似的方式作出反应的智能机器。人工智能也就是研究各种智能机器的设计原理与实现方法,使机器具有感知、推理与决策的功能。人工智能领域的研究包括机器人,自然语言处理,计算机视觉,决策与推理,人机交互,推荐与搜索,ai基础理论等。

2、随着ai技术的高速发展,传统的图形处理单元(graphics processing unit,gpu)、中央处理单元(central processing unit,cpu)已经不能满足日益增长的性能需求,各大厂商都在试图研究各自的ai芯片以满足其在ai领域的差异化竞争,从而获得领先地位。在ai系统栈上,编译生成高性能算子来提高图像处理、自然语言处理、计算机视觉等方向神经网络的训练与推理性能,是ai芯片的关键竞争力。

3、业界基于tvm和halide等ai编译框架在兼容不同硬件芯片的基础上对关键算子进行性能加速,实现高性能算子。对于在性能调优过程中所出现的ai编译框架无法自动优化的场景,如何进行目标场景的优化,以此加速算子的算力成为亟需要解决的技术问题。


技术实现思路

1、本申请实施例提供一种数据处理的方法、ai编译框架以及ai芯片,可以使能各种调优手段,加速算子的算力,实现高性能算子。

2、第一方面,提供了一种数据处理的方法,所述方法包括:;基于所述至少一个辅助数据将所述第一数据块补齐到所述目标数据块,并根据所述切分基数将目标数据块切分为多个大小规格相同的数据块。

3、上述技术方案中,第一数据块通过所述切分基数切分得到的多个数据块的大小规格不同,可以借助至少一个辅助数据将第一数据块补齐到目标数据块,并根据所述切分基数切分所述目标数据块,能够得到多个规格大小相同的数据块。由于至少一个辅助数据为有效值,该有效值与第一数据块参与的不同的运算类型相关,因此在借助至少一个辅助数据将第一数据块补齐到目标数据块,使得目标数据块切分得到的多个规格大小相同的数据块可以进行搬运的情况下,还不会影响第一数据块参与的运算的结果。

4、结合第一方面,在第一方面的某些实现方式中,通过接口接收到用户输入的所述第一参数信息。

5、结合第一方面,在第一方面的某些实现方式中,所述第一数据块参与的运算包括:reduce函数或大数相乘溢出场景中的运算,且所述有效值不影响所述reduce函数或所述大数相乘溢出场景中运算的结果。

6、结合第一方面,在第一方面的某些实现方式中,所述第一参数信息还包括所述第一数据块的维度。

7、结合第一方面,在第一方面的某些实现方式中,所述方法还包括:根据所述第一数据块的维度确定所述第一数据块。

8、结合第一方面,在第一方面的某些实现方式中,所述接口为原语接口。

9、第二方面,提供了一种数据处理的方法,包括:接收第二参数信息,所述第二参数信息包括指令发射队列中向外预发送的指令数量以及第一指令预发送的时间段,所述第一指令为所述指令发射队列中的指令;根据所述第二参数信息,调整所述指令发射队列中指令的发送顺序,使得所述第一指令优先于第二指令从所述指令发射队列中发送,所述第二指令为所述指令发射队列中的指令,所述第二指令的类型和所述第一指令的类型相同。

10、上述技术方案中,支持用户进行预启动到不同时间段与不同数据量,使得指令不会互相阻塞,提高流水并行度,优化极致性能。

11、结合第二方面,在第二方面的某些实现方式中,所述第二指令为第i次迭代计算中的后置指令,所述第一指令为第i+1次迭代计算中的前置指令,所述i为大于或等于1的正整数。

12、结合第二方面,在第二方面的某些实现方式中,所述第i次迭代计算为matmul函数的第i次迭代计算,所述第i+1次迭代计算为所述matmul函数的第i+1次迭代计算。

13、结合第二方面,在第二方面的某些实现方式中,所述第一指令和第二指令为vector类指令。

14、结合第二方面,在第二方面的某些实现方式中,通过接口接收所述第二参数信息,述接口为原语接口。

15、第三方面,提供了一种数据处理的方法,包括:接收第三参数信息,所述第三参数信息指示对迭代搬运的目标数据集合中的至少两个数据进行倒序遍历搬运,所述目标数据集合中的至少两个数据需迭代循环搬运至硬件平台参与计算;根据所述第三参数信息,调整所述目标数据集合中的至少两个数据的搬运顺序,将所述目标数据集合中的至少两个数据倒序搬运至所述硬件平台参与计算。

16、上述技术方案中,支持用户对指定维度计算逻辑进行顺序改变,根据逻辑减少冗余搬运的次数,从而降低了对ai芯片造成较大的搬运压力,提高了ai芯片的使用性能。

17、结合第三方面,在第三方面的某些实现方式中,根据所述第三参数信息,调整所述目标数据集合中的至少两个数据的搬运顺序,使得在第i+1次迭代循环过程中,复用第i次迭代循环过程中搬运至所述硬件平台的数据,所述i为大于或等于1的正整数。

18、结合第三方面,在第三方面的某些实现方式中,所述数据为第i次迭代循环过程中搬运至所述硬件平台的目标数据集合中的尾部数据。

19、结合第三方面,在第三方面的某些实现方式中,通过接口接收所述第三参数信息,所述接口为原语接口。

20、第四方面,提供了一种数据处理的装置,包括:接收模块,处理模块。其中,接收模块,用于接收第一参数信息,所述第一参数信息包括切分基数以及至少一个辅助数据,其中,所述至少一个辅助数据用于将第一数据块补齐到目标数据块,所述至少一个辅助数据为有效值,所述第一数据块通过所述切分基数切分得到的多个数据块的大小规格不同,所述有效值与所述第一数据参与的运算的类型相关;处理模块,用于基于所述至少一个辅助数据将所述第一数据块补齐到所述目标数据块,并根据所述切分基数将所述目标数据块切分为多个大小规格相同的数据块。

21、结合第四方面,在第四方面的某些实现方式中,所述接收模块具体用于:通过接口接收到用户输入的所述第一参数信息。

22、结合第四方面,在第四方面的某些实现方式中,所述有效值与reduce函数或大数相乘溢出场景中不同的运算类型有关,且所述有效值不影响所述reduce函数或大数相乘溢出场景中所述运算的结果。

23、结合第四方面,在第四方面的某些实现方式中,所述处理模块还用于:将所述至少一个辅助数据的取值设置为所述有效值。

24、结合第四方面,在第四方面的某些实现方式中,所述第一参数信息还包括所述第一数据块的本文档来自技高网...

【技术保护点】

1.一种数据处理的方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述接收到第一参数信息,包括:

3.根据权利要求1或2所述的方法,其特征在于,所述第一数据块参与的运算包括:reduce函数或大数相乘溢出场景中的运算,且所述有效值不影响所述reduce函数或所述大数相乘溢出场景中运算的结果。

4.根据权利要求1至3中任一项所述的方法,其特征在于,所述第一参数信息还包括所述第一数据块的维度。

5.根据权利要求4所述的方法,其特征在于,所述方法还包括:

6.根据权利要求2至5中任一项所述的方法,其特征在于,所述接口为原语接口。

7.一种数据处理的方法,其特征在于,包括:

8.根据权利要求7所述的方法,其特征在于,所述第二指令为第i次迭代计算中的后置指令,所述第一指令为第i+1次迭代计算中的前置指令,所述i为大于或等于1的正整数。

9.根据权利要求8所述的方法,其特征在于,所述第i次迭代计算为matmul函数的第i次迭代计算,所述第i+1次迭代计算为所述matmul函数的第i+1次迭代计算。

10.根据权利要求7至9中任一项所述的方法,其特征在于,所述第一指令和第二指令为vector类指令。

11.根据权利要求7至10中任一项所述的方法,其特征在于,所述接收第二参数信息,包括:

12.一种数据处理的方法,其特征在于,包括:

13.根据权利要求12所述的方法,其特征在于,所述根据所述第三参数信息,调整所述目标数据集合中的至少两个数据的搬运顺序包括:

14.根据权利要求13所述的方法,其特征在于,所述数据为第i次迭代循环过程中搬运至所述硬件平台的目标数据集合中的尾部数据。

15.根据权利要求12至14中任一项所述的方法,其特征在于,所述接收第三参数信息,包括:

16.一种数据处理的装置,其特征在于,包括:

17.根据权利要求16所述的装置,其特征在于,所述接收模块具体用于:

18.根据权利要求16或17所述的装置,其特征在于,所述第一数据块参与的运算包括:reduce函数或大数相乘溢出场景中的运算,且所述有效值不影响所述reduce函数或所述大数相乘溢出场景中运算的结果。

19.根据权利要求16至18中任一项所述的装置,其特征在于,所述第一参数信息还包括所述第一数据块的维度。

20.根据权利要求16至19中任一项所述的装置,其特征在于,所述处理模块还用于:

21.根据权利要求16至20中任一项所述的装置,其特征在于,所述接口为原语接口。

22.一种数据处理的装置,其特征在于,包括:

23.根据权利要求22所述的装置,其特征在于,所述第二指令为第i次迭代计算中的后置指令,所述第一指令为第i+1次迭代计算中的前置指令,所述i为大于或等于1的正整数。

24.根据权利要求23所述的装置,其特征在于,所述第i次迭代计算为matmul函数的第i次迭代计算,所述第i+1次迭代计算为所述matmul函数的第i+1次迭代计算。

25.根据权利要求22至24中任一项所述的装置,其特征在于,所述第一指令和第二指令为vector类指令。

26.根据权利要求22至25中任一项所述的装置,其特征在于,所述接收模块具体用于:

27.一种数据处理的装置,其特征在于,包括:

28.根据权利要求27所述的装置,其特征在于,所述处理模块具体用于:

29.根据权利要求28所述的装置,其特征在于,所述数据为第i次迭代循环过程中搬运至所述硬件平台的目标数据集合中的尾部数据。

30.根据权利要求27至29中任一项所述的装置,其特征在于,所述接收模块具体用于:

31.一种AI芯片,其特征在于,包括:包括处理器和存储器,所述存储器用于存储程序指令,所述处理器用于调用所述程序指令来执行如权利要求1至6中任一项所述的方法。

32.一种AI芯片,其特征在于,包括:包括处理器和存储器,所述存储器用于存储程序指令,所述处理器用于调用所述程序指令来执行如权利要求7至11中任一项所述的方法。

33.一种AI芯片,其特征在于,包括:包括处理器和存储器,所述存储器用于存储程序指令,所述处理器用于调用所述程序指令来执行如权利要求12至15中任一项所述的方法。

34.一种计算机可读存储介质,其特征在于,所述计算机可读介质存储用于计算设备执行的程序代码,该程序代码包括用于执行如权利要求1至6中任...

【技术特征摘要】

1.一种数据处理的方法,其特征在于,包括:

2.根据权利要求1所述的方法,其特征在于,所述接收到第一参数信息,包括:

3.根据权利要求1或2所述的方法,其特征在于,所述第一数据块参与的运算包括:reduce函数或大数相乘溢出场景中的运算,且所述有效值不影响所述reduce函数或所述大数相乘溢出场景中运算的结果。

4.根据权利要求1至3中任一项所述的方法,其特征在于,所述第一参数信息还包括所述第一数据块的维度。

5.根据权利要求4所述的方法,其特征在于,所述方法还包括:

6.根据权利要求2至5中任一项所述的方法,其特征在于,所述接口为原语接口。

7.一种数据处理的方法,其特征在于,包括:

8.根据权利要求7所述的方法,其特征在于,所述第二指令为第i次迭代计算中的后置指令,所述第一指令为第i+1次迭代计算中的前置指令,所述i为大于或等于1的正整数。

9.根据权利要求8所述的方法,其特征在于,所述第i次迭代计算为matmul函数的第i次迭代计算,所述第i+1次迭代计算为所述matmul函数的第i+1次迭代计算。

10.根据权利要求7至9中任一项所述的方法,其特征在于,所述第一指令和第二指令为vector类指令。

11.根据权利要求7至10中任一项所述的方法,其特征在于,所述接收第二参数信息,包括:

12.一种数据处理的方法,其特征在于,包括:

13.根据权利要求12所述的方法,其特征在于,所述根据所述第三参数信息,调整所述目标数据集合中的至少两个数据的搬运顺序包括:

14.根据权利要求13所述的方法,其特征在于,所述数据为第i次迭代循环过程中搬运至所述硬件平台的目标数据集合中的尾部数据。

15.根据权利要求12至14中任一项所述的方法,其特征在于,所述接收第三参数信息,包括:

16.一种数据处理的装置,其特征在于,包括:

17.根据权利要求16所述的装置,其特征在于,所述接收模块具体用于:

18.根据权利要求16或17所述的装置,其特征在于,所述第一数据块参与的运算包括:reduce函数或大数相乘溢出场景中的运算,且所述有效值不影响所述reduce函数或所述大数相乘溢出场景中运算的结果。

19.根据权利要求16至18中任一项所述的装置,其特征在于,所述第一参数信息还包括所述第一数据块的维度。

20.根据权利要求16至19中任一项所述的装置,其特征在于,所述处理模块还用于:

21.根据权利要求16至20中任一项所述的装置,其特征在于,所述接口为原语接口。

22.一种数据处理的装置,其特征在于,包括:

23.根据权利要求...

【专利技术属性】
技术研发人员:季韩特程琛吴凌飞徐子明
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1