System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种数据处理方法及处理器核技术_技高网

一种数据处理方法及处理器核技术

技术编号:40710884 阅读:6 留言:0更新日期:2024-03-22 11:12
一种数据处理方法及处理器核,用于提高批归一化的计算速度。该方法适用于处理器核,处理器核中包括第一计算核、第二计算核和片上高速缓存,方法包括:第一计算核对输入数据执行卷积操作,得到卷积操作的结果;第一计算核向第二计算核发送卷积操作的结果,以及,向片上高速缓存写入卷积操作的结果;第二计算核对卷积操作的结果执行第一归约操作,得到第一归约操作的结果;第二计算核从片上高速缓存中加载卷积操作的结果,并根据卷积操作的结果和第一归约操作的结果,进行归一化操作。进一步的,第一计算核(或第二计算核)的数据加载和计算均放在不同的协作线程簇,确保指令的异步发射和执行。

【技术实现步骤摘要】

本申请实施例涉及计算机领域,尤其涉及一种数据处理方法及处理器核


技术介绍

1、目前的人工智能(artificial intelligence,ai)框架主要分为动态图模式(eager mode)和图形模式(graph mode)两种。对于graph mode,graph mode中的包括多个算子,graph mode可通过算子融合的方式,将多个算子融合为一个算子,该一个算子对应于一个设备内核(device kernel),且中央处理器(central processing unit,cpu)仅需要针对融合后的一个算子进行启动(launch)操作。

2、在上述graph mode中,多个算子可包括卷积操作和批归一化操作,处理器核可依次执行卷积操作和批归一化操作。且处理器核可将卷积操作的结果写入内存中,以及,在执行批归一化操作的过程中,多次从内存中加载卷积操作的结果,进而将卷积操作的结果作为归一化操作的输入。

3、处理器核需要多次从内存中加载卷积操作的结果,影响批归一化的计算速度。


技术实现思路

1、本申请提供一种数据处理方法及处理器核,用于提高批归一化的计算速度。

2、第一方面,本申请提供一种数据处理方法,适用于处理器核,处理器核中包括第一计算核、第二计算核和片上高速缓存,方法包括:第一计算核对输入数据执行卷积操作,得到卷积操作的结果;第一计算核向第二计算核发送卷积操作的结果,以及,向片上高速缓存写入卷积操作的结果;第二计算核对卷积操作的结果执行第一归约操作,得到第一归约操作的结果;第二计算核从片上高速缓存中加载卷积操作的结果,并根据卷积操作的结果和第一归约操作的结果,进行归一化操作。

3、上述技术方案中,第一计算核执行卷积操作,向第二计算核发送卷积操作的结果,如此,第二计算核无需从内存中加载卷积操作的结果,有助于提高批归一化的计算速度。第一计算核将卷积操作的结果写入到片上高速缓存,第二计算核访问片上高速缓存的速度高于第二计算核访问内存的速度,有助于进一步提高批归一化的计算速度。此外,通过两个计算核并行执行,第一计算核无需等待第二计算核执行完归一化操作,即可继续执行其他的卷积操作,有助于提高整个数据处理的计算速度。

4、在一种可能的实现方式中,处理器核中还包括l2缓存,处理器核是n个处理器核中的任一个,n为大于1的整数;第二计算核根据卷积操作的结果和第一归约操作的结果,进行归一化操作,包括:第二计算核向l2缓存中写入第一归约操作的结果;第二计算核从n个处理器核中的其他n-1个处理器核的l2缓存中分别获取其他n-1个处理器核的第一归约操作的结果,将其他n-1个处理器核的第一归约操作的结果写入l2缓存中;第二计算核根据l2缓存中的n个处理器核的第一归约操作的结果,进行第二归约操作,得到第二归约操作的结果;第二计算核根据第二归约操作的结果、卷积操作的结果,进行归一化操作。

5、上述技术方案中,适用于n个处理器核之间执行归约操作,以得到多个处理器核执行归约操作之后的结果,进而有助于各个处理器核中的第二计算核执行后续的归一化计算。可以理解,n个处理器核分别执行各自的卷积操作和归约操作,进而n个处理器核中每个处理器核获取其他处理器核的归约操作的结果,根据自己的归约操作结果和其他处理器核的归约操作的结果,进一步执行归约操作,该方案适用于较大规模的模型计算,且有助于提高模型计算的速度。

6、在一种可能的实现方式中,第一计算核对输入数据执行卷积操作,得到卷积操作的结果,包括:第一计算核对输入数据循环执行卷积操作,在每次循环中输出卷积操作的结果;第一计算核向第二计算核发送卷积操作的结果,包括:第一计算核在确定第二计算核中包括m个空闲槽位之后,向第二计算核发送本次循环所输出的卷积操作的结果,其中,第一归约操作的结果占用m个槽位,m为正整数。

7、在一种可能的实现方式中,第二计算单元根据卷积操作的结果和第一归约操作的结果,进行归一化操作之后,还包括:第二计算单元释放第一归约操作的结果占用的m个槽位;第二计算单元向第一计算单元发送空闲指令,空闲指令用于指示第二计算核中包括m个空闲槽位。

8、上述技术方案中,由于第二计算单元中包括的槽位有限,即能够存储的第一归约操作的结果的数量有限,当第二计算单元使用完成某个第一归约操作的结果之后,可将该第一归约操作的结果占用的m个槽位释放,以使得第一计算单元可将新输出的卷积操作的结果发送给第二计算单元,第二计算单元再根据该新输出的卷积操作的结果计算得到新的第一归约操作的结果,并将该新的结果写入至m个槽位中。

9、在一种可能的实现方式中,第二计算核中包括加载存储缓存,第一计算核向第二计算核发送卷积操作的结果,包括:第一计算核向加载存储缓存发送卷积操作的结果;第二计算核对卷积操作的结果执行第一归约操作,得到第一归约操作的结果,包括:加载存储缓存对卷积操作的结果执行第一归约操作,得到第一归约操作的结果,并存储第一归约操作的结果。

10、上述技术方案中,第二计算核中的加载存储缓存可对卷积操作的结果执行第一归约操作,得到第一归约操作的结果,进而存储第一归约操作的结果,如此,第二计算核在需要进行第一归约操作时,无需从内存中加载卷积操作的结果,有助于提高批归一化的计算速度。

11、在一种可能的实现方式中,第二计算核中包括加载存储缓存和计算单元,加载存储缓存用于存储第一归约操作的结果,计算单元用于根据卷积操作的结果和第一归约操作的结果,进行归一化操作;方法还包括:第一计算核向计算单元发送数据就绪指令,数据就绪指令用于触发计算单元从片上高速缓存中加载卷积操作的结果,以及,从加载存储缓存中加载第一归约操作的结果。

12、上述技术方案中,第一计算核指示计算单元从片上高速缓存中加载卷积操作的结果,以及从加载存储缓存中加载第一归约操作的结果,进而计算单元能够执行归一化操作,有助于提高批归一化的计算速度。

13、在一种可能的实现方式中,处理器核中还包括寄存器,第二计算核根据卷积操作的结果和第一归约操作的结果,进行归一化操作之后,还包括:第二计算核将归一化操作之后的结果写入至寄存器中;第二计算核根据寄存器中的归一化操作之后的结果,进行激活操作。

14、上述技术方案中,第二计算核将归一化操作之后的结果写入至寄存器中,第二计算核访问寄存器的速度高于第二计算核访问内存的速度,有助于进一步提高激活操作的计算速度。

15、在一种可能的实现方式中,第一计算核包括多个协议线程簇,第一计算核中的多个协议线程簇用于执行第一计算核的不同操作;第二计算核中包括多个协议线程簇,第二计算核中的多个协议线程簇用于执行第二计算核的不同操作。

16、上述技术方案中,每个协议线程簇独立运行,如可独立向硬件发送执行指令(如向内存发送读取指令,向缓存发送读取指令等)、独立执行计算等,如此,有助于提高每个协议线程簇的运行效率,进一步提高批归一化的计算速度。

本文档来自技高网...

【技术保护点】

1.一种数据处理方法,其特征在于,适用于处理器核,所述处理器核中包括第一计算核、第二计算核和片上高速缓存,所述方法包括:

2.如权利要求1所述的方法,其特征在于,所述处理器核中还包括L2缓存,所述处理器核是N个处理器核中的任一个,N为大于1的整数;

3.如权利要求1所述的方法,其特征在于,所述第一计算核对输入数据执行卷积操作,得到所述卷积操作的结果,包括:

4.如权利要求3所述的方法,其特征在于,所述第二计算单元根据所述卷积操作的结果和所述第一归约操作的结果,进行归一化操作之后,还包括:

5.如权利要求1所述的方法,其特征在于,所述第二计算核中包括加载存储缓存,所述第一计算核向所述第二计算核发送所述卷积操作的结果,包括:

6.如权利要求1所述的方法,其特征在于,所述第二计算核中包括加载存储缓存和计算单元,所述加载存储缓存用于存储所述第一归约操作的结果,所述计算单元用于根据所述卷积操作的结果和所述第一归约操作的结果,进行归一化操作;所述方法还包括:

7.如权利要求1所述的方法,其特征在于,所述处理器核中还包括寄存器,所述第二计算核根据所述卷积操作的结果和所述第一归约操作的结果,进行归一化操作之后,还包括:

8.如权利要求1-7中任一项所述的方法,其特征在于,

9.一种处理器核,其特征在于,包括:

10.一种处理器,其特征在于,所述处理器包括逻辑电路和供电电路,所述供电电路用于为所述逻辑电路供电,所述逻辑电路用于执行如权利要求1至8中任一项所述的方法的操作步骤。

11.一种芯片,其特征在于,所述计算机芯片包括处理器和缓存,所述处理器用于执行如权利要求1至8中任一项所述的方法的操作步骤。

...

【技术特征摘要】

1.一种数据处理方法,其特征在于,适用于处理器核,所述处理器核中包括第一计算核、第二计算核和片上高速缓存,所述方法包括:

2.如权利要求1所述的方法,其特征在于,所述处理器核中还包括l2缓存,所述处理器核是n个处理器核中的任一个,n为大于1的整数;

3.如权利要求1所述的方法,其特征在于,所述第一计算核对输入数据执行卷积操作,得到所述卷积操作的结果,包括:

4.如权利要求3所述的方法,其特征在于,所述第二计算单元根据所述卷积操作的结果和所述第一归约操作的结果,进行归一化操作之后,还包括:

5.如权利要求1所述的方法,其特征在于,所述第二计算核中包括加载存储缓存,所述第一计算核向所述第二计算核发送所述卷积操作的结果,包括:

6.如权利要求1所述的方法,其特征在于,所述第二计算核中包括加载存储缓存...

【专利技术属性】
技术研发人员:请求不公布姓名请求不公布姓名
申请(专利权)人:上海壁仞科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1