内存分配方法及装置、电子设备、计算机可读介质制造方法及图纸

技术编号：38095122 阅读：9 留言：0更新日期：2023-07-06 09:09

本公开提供了一种内存分配方法，该内存分配方法应用于众核芯片，众核芯片包括多个计算核，每个计算核具有一个可用内存，该内存分配方法包括：确定神经网络计算图中与当前计算核对应的至少一个算子的算子属性信息；根据算子属性信息，依次对当前计算核对应的各算子进行内存分配操作；依次对当前计算核对应的各算子进行内存分配操作，包括：基于当前算子的算子属性信息及上下文信息，对当前算子进行可用内存的内存分配；当前算子对应的上下文信息包括内存分配时间排在当前算子之后的其他算子的算子属性信息。本公开还提供了一种内存分配装置、电子设备及计算机可读介质。电子设备及计算机可读介质。电子设备及计算机可读介质。

全部详细技术资料下载

【技术实现步骤摘要】
内存分配方法及装置、电子设备、计算机可读介质

[0001]本公开涉及计算机
，特别涉及一种内存分配方法及装置、电子设备、计算机可读介质。

技术介绍

[0002]深度学习框架(例如TensorFlow或ONNX)通常使用计算图来表达深度学习模型(神经网络)的计算。针对特定的加速硬件，神经网络计算图需要经过编译器进行编译，以生成可以在硬件上运行的指令流。其中，硬件可以是存算一体的众核架构芯片，众核架构芯片通常包括多个计算核(CORE)。
[0003]在神经网络计算图的编译阶段，计算图进入编译器后，会进行任务分配。例如，根据计算图的不同算子的计算量、访存需求以及算子间的同步信息，将不同的算子分配到不同的计算核上进行执行。
[0004]然而，计算核上的内存有限，而计算图的算子较多，如果内存分配不合理，容易产生外部碎片。

技术实现思路

[0005]本公开提供一种内存分配方法及装置、电子设备、计算机可读介质。
[0006]根据本公开的第一方面，本公开实施例提供了一种内存分配方法，该内存分配方法应用于众核芯片，所述众核芯片包括多个计算核，每个所述计算核对应配置有独立内存，该内存分配方法包括：
[0007]确定神经网络计算图中与当前计算核对应的至少一个算子的算子属性信息；
[0008]根据当前计算核对应的各所述算子的所述算子属性信息，依次对当前计算核对应的各算子进行内存分配操作；
[0009]所述依次对当前计算核对应的各算子进行内存分配操作，包括：基于当前算子的算...

【技术保护点】

【技术特征摘要】
1.一种内存分配方法，应用于众核芯片，所述众核芯片包括多个计算核，每个所述计算核对应配置有独立内存，所述方法包括：确定神经网络计算图中与当前计算核对应的至少一个算子的算子属性信息；根据当前计算核对应的各所述算子的所述算子属性信息，依次对当前计算核对应的各算子进行内存分配操作；所述依次对当前计算核对应的各算子进行内存分配操作，包括：基于当前算子的算子属性信息以及当前算子对应的上下文信息，对当前算子进行内存分配；其中，当前算子对应的上下文信息包括内存分配时间排在当前算子之后的其他算子的算子属性信息。2.根据权利要求1所述的内存分配方法，其中所述算子属性信息包括算子的内存分配时间、内存释放时间、算子大小、算子类型和算子标识。3.根据权利要求1所述的内存分配方法，其中所述基于当前算子的算子属性信息以及当前算子对应的上下文信息，对当前算子进行内存分配，包括：基于当前算子的算子属性信息以及当前算子对应的上下文信息，利用目标算法对当前算子进行内存分配。4.根据权利要求3所述的内存分配方法，其中所述目标算法包括以下至少一项：强化学习算法、基于资源池的内存分配算法、进化学习算法、启发式算法。5.根据权利要求1所述的内存分配方法，其中所述基于当前算子的算子属性信息以及当前算子对应的上下文信息，对当前算子进行内存分配，包括：根据当前算子的算子属性信息以及当前算子对应的上下文信息，确定当前算子对应的可分配内存区域；从当前算子对应的可分配内存区域中，确定出当前算子对应的目标内存区域；基于所述目标内存区域对当前算子进行内存分配。6.根据权利要求5所述的内存分配方法，其中所述算子属性信息包括算子的内存分配时间、内存释放时间和算子大小；所述根据当前算子的算子属性信息以及当前算子对应的上下文信息，确定当前算子对应的可分配内存区域，包括：根据当前算子的算子大小、内存分配时间、内存释放时间，以及所述上下文信息中其他算子的算子大小、内存分配时间、内存释放时间，对当前算子和其他算子进行内存分配组合，每一内存分配组合对应一种当前算子和其他算子的内存区域分配情况；在进行内存分配组合中，当任意两个算子满足内存复用条件时，将该两个算子相邻设置，且该两个算子中先释放内存的一个算子的内存区域设置为在释放后分配给另一个算子使用；针对每一个内存分配组合，当该内存分配组合所需的内存大小小于或等于当前计算核的可用内存大小时，将该内存分配组合中当前算子对应的内存区域确定为当前算子对应的可分配内存区域。7.根据权利要求1所述的内存分配...

【专利技术属性】
技术研发人员：徐茂轩，张士权，柯健，
申请(专利权)人：无锡灵汐类脑科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人