一种算子执行方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:44572101 阅读:22 留言:0更新日期:2025-03-11 14:31
本申请公开一种算子执行方法、装置、计算机设备及存储介质,属于人工智能技术领域,该方法中,在将第一算子输出的第一Layout的数据块阵列输入第二算子前,若确定第二算子的输入对应的是第二Layout,则根据数据块阵列包含的元素数量开辟一块连续的内存空间,先利用多个第一线程块,将数据块阵列中的元素线性存储到内存空间中,再利用多个第二线程块,将内存空间中的元素转换成第二Layout的数据块阵列输入第二算子,以执行第二算子。这样,通过一块连续的内存空间,可完成各种不同Layout之间的转换,提供了一种通用的Layout转换方案,由于无需对各种Layout之间的转换单独进行开发,所以能够降低开发成本。

【技术实现步骤摘要】

本申请涉及人工智能,尤其涉及一种算子执行方法、装置、计算机设备及存储介质


技术介绍

1、在人工智能
,当算子1的输出作为算子2的输入时,若算子1的输出对应的数据结构(layout)和算子2的输入对应的layout不同,就需要将算子1的输出从一种layout重排到另外一种layout。相关技术中,对每两种layout均开发一套转换程序,由于存在多种layout,各种layout之间的转换均需单独进行开发,所以开发成本较高。


技术实现思路

1、本申请实施例提供一种算子执行方法、装置、计算机设备及存储介质,用以提供一种通用的layout转换方案。

2、第一方面,本申请实施例提供一种算子执行方法,包括:

3、在将第一算子输出的第一数据结构layout的数据块阵列输入第二算子前,若确定所述第二算子的输入对应的是第二layout,则根据所述数据块阵列包含的元素数量,开辟一块连续的内存空间;

4、利用多个第一线程块,将所述数据块阵列中的元素线性存储到所述内存空间中,所述多个第一线本文档来自技高网...

【技术保护点】

1.一种算子执行方法,其特征在于,包括:

2.如权利要求1所述的方法,其特征在于,共有N1×M1个第一线程块,N1是根据所述数据块阵列在行方向上包含的数据块数量,以及单个第一线程块对应的数据块数量确定的,M1等于所述数据块阵列在列方向上包含的数据块数量。

3.如权利要求1或2所述的方法,其特征在于,利用多个第一线程块,将所述数据块阵列中的元素线性存储到所述内存空间中,包括:

4.如权利要求3所述的方法,其特征在于,所述Layout数据加载接口有内存架构参数,还包括:

5.如权利要求3所述的方法,其特征在于,还包括:>

6.如权利要...

【技术特征摘要】

1.一种算子执行方法,其特征在于,包括:

2.如权利要求1所述的方法,其特征在于,共有n1×m1个第一线程块,n1是根据所述数据块阵列在行方向上包含的数据块数量,以及单个第一线程块对应的数据块数量确定的,m1等于所述数据块阵列在列方向上包含的数据块数量。

3.如权利要求1或2所述的方法,其特征在于,利用多个第一线程块,将所述数据块阵列中的元素线性存储到所述内存空间中,包括:

4.如权利要求3所述的方法,其特征在于,所述layout数据加载接口有内存架构参数,还包括:

5.如权利要求3所述的方法,其特征在于,还包括:

6.如权利要求1所述的方法,其特征在于,共有n2×m2个第二线程块,n2是根据参考块阵列在行方向上包含的参考块数量、以及单个第二线程块对应的参考块数量确定的,m2等于所述参考块阵列在列方向上包含的参考块数量,所述参考...

【专利技术属性】
技术研发人员:请求不公布姓名请求不公布姓名请求不公布姓名
申请(专利权)人:广州壁仞集成电路有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1