AI处理器的内存分配方法、计算机装置及计算机可读存储介质制造方法及图纸

技术编号：29419269 阅读：18 留言：0更新日期：2021-07-23 23:13

本发明专利技术涉及内存管理的技术领域，并且提供一种AI处理器的内存分配方法、计算机装置及计算机可读存储介质，该方法包括获取神经网络的多个算子，分析输入与输出占用的内存空间可重叠的算子；判断神经网络的输入的尺寸是否为固定尺寸，如是，采用静态内存池式分配算法确定多个内存块的存储地址：计算神经网络模型推理过程中每一内存块的大小，确认每一内存块的生命周期；并判断内存块是否为可被重叠的内存块，如是，修正内存块的大小和生命周期，根据内存块修正后的大小和生命周期分配各内存块的存储地址，否则，则采用动态内存池式分配算法为多个内存块申请内存空间。本发明专利技术还提供实现上述方法的计算机装置及计算机可读存储介质。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】AI处理器的内存分配方法、计算机装置及计算机可读存储介质
本专利技术涉及内存管理的
，具体地，是一种AI处理器的内存分配方法以及实现这种方法的计算机装置、计算机可读存储介质。
技术介绍
目前，深度神经网络技术在计算机视觉和自然语言处理等领域取得了巨大的成功。近年来，随着AIoT(ArtificialIntelligence&InternetofThings，人工智能与物联网)技术的兴起，人工智能技术与物联网技术在实际应用中不断融合，越来越多的深度学习算法需要部署到资源受限的嵌入式端设备上。然而，由于嵌入式端设备的计算能力和内存资源受限，因此需要研究高性能和高效能的边缘推理方法便于神经网络模型的部署。近年来，一部分研究人员聚焦于神经网络的模型推理性能，设计出高效的神经网络结构，如SqueezeNet、MobileNets和EfficientNet等，这些神经网络模型能够以较小的计算量获取较好的性能。此外，还有一部分研究人员侧重研究提高神经网络模型的效率，对神经网络模型进行压缩、裁剪和量化，在不明显降低神经网络模型性能的前提下，大幅减少计算量和内存消耗。由于深度神经网络前向推理过程中涉及到大量矩阵乘法和加法的运算，而这些运算又可以高度并行化执行，因此研究人员开始研究具有并行计算能力的人工智能处理器，即AI处理器。AI处理器通过将整个神经网络的计算部分映射到硬件逻辑上，从而完成对神经网络模型计算部分的硬件加速，在一定程度上缓解了嵌入式端设备的计算能力受限问题。然而，深度神经网络在前向推...

【技术保护点】
1.一种AI处理器的内存分配方法，包括：/n获取神经网络的多个算子；/n其特征在于：/n计算分析多个所述算子中，算子的输入与输出占用的内存空间可重叠的算子；/n判断所述神经网络的输入的尺寸是否为固定尺寸，如是，采用静态内存池式分配算法确定多个内存块的存储地址，否则，则采用动态内存池式分配算法为多个内存块申请内存空间；/n其中，采用静态内存池式分配算法确定多个内存块的存储地址包括：计算神经网络模型推理过程中每一内存块的大小，确认每一所述内存块的生命周期；并判断内存块是否为可被重叠的内存块，如是，修正内存块的大小和生命周期，根据内存块修正后的大小和生命周期分配各内存块的存储地址。/n

【技术特征摘要】
【国外来华专利技术】1.一种AI处理器的内存分配方法，包括：
获取神经网络的多个算子；
其特征在于：
计算分析多个所述算子中，算子的输入与输出占用的内存空间可重叠的算子；
判断所述神经网络的输入的尺寸是否为固定尺寸，如是，采用静态内存池式分配算法确定多个内存块的存储地址，否则，则采用动态内存池式分配算法为多个内存块申请内存空间；
其中，采用静态内存池式分配算法确定多个内存块的存储地址包括：计算神经网络模型推理过程中每一内存块的大小，确认每一所述内存块的生命周期；并判断内存块是否为可被重叠的内存块，如是，修正内存块的大小和生命周期，根据内存块修正后的大小和生命周期分配各内存块的存储地址。

2.根据权利要求1所述的AI处理器的内存分配方法，其特征在于：
计算分析多个所述算子中输入与输出占用的内存空间可重叠的算子包括：
判断一个算子的输入与输出激活是否只参与当前层算子的计算，如是，确认该算子的输入与输出占用的内存空间可重叠，否则，确认该算子的输入与输出占用的内存空间不可重叠。

3.根据权利要求2所述的AI处理器的内存分配方法，其特征在于：
被分析的算子为经过线性拆分的算子。

4.根据权利要求1至3任一项所述的AI处理器的内存分配方法，其特征在于：
确认每一所述内存块的生命周期包括：根据所述内存块所存储的算子第一次访问时间以及最后一次访问时间计算该内存块的生命周期。

5.根据权利要求1至4任一项所述的AI处理器的内存分配方法，其特征在于：
根据内存块修正后的大小和生命周期分配各内存块的存储地址包括：根据所述内存块修正后的大小和生命周期，将各个所述内存块放入静态内存池中，应用启发式算法计算各个所述内存块的偏移地址。

6.根据权利要求5所述的AI处理器的内存分配方法，其特征在于：
分配各内存块的存储地址前，确定所述静态...

【专利技术属性】
技术研发人员：汪厚峄，丁然，南楠，
申请(专利权)人：珠海全志科技股份有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人