优化神经网络模型执行策略的方法和装置制造方法及图纸

技术编号：38006848 阅读：14 留言：0更新日期：2023-06-30 10:23

本申请涉及优化神经网络模型执行策略的方法和装置。公开了一种优化神经网络模型的执行策略的方法，包括：接收一神经网络模型，神经网络模型包括多个节点，其中每个节点对应神经网络模型的至少一个运算层；识别各节点之间的数据依赖关系；根据识别的各节点之间的数据依赖关系确定多个节点执行顺序的约束条件；在满足执行顺序的约束条件的基础上，进行至少一个搜索算法以确定可能的候选节点执行顺序；基于每种候选节点执行顺序估计与神经网络模型的多个节点执行相关的存储需求；基于估计的与每种候选节点执行顺序相关的存储需求、根据预定的存储器使用效率指标从候选节点执行顺序中选择节点执行顺序，其中，改变节点执行顺序能够改变神经网络模型执行过程中多个节点中一个或多个节点的相应输出驻留在存储器中的时间；以及输出选择的神经网络模型的节点执行顺序。序。序。

全部详细技术资料下载

【技术实现步骤摘要】
优化神经网络模型执行策略的方法和装置

[0001]本公开一般涉及人工智能中的机器学习领域，具体来说，本公开涉及基于人工智能的神经网络模型的执行策略的方法及装置。

技术介绍

[0002] 近年来神经网络模型呈现计算规模增加、复杂度提升的趋势。同时，人工智能物联网（Artificial Intelligence of Things (AIoT)）等的应用市场正在持续增长，而高效能、低功耗、高云端整合成为发展趋势。
[0003]对于低硬件资源架构而言，面临的一个问题便是存储器容量限制，因此如何优化神经网络的执行策略以提高有限存储器的使用效率便成为一个迫切的问题。
[0004] US20190303762A1涉及神经网络计算图的优化方法。该计算图用于计算平台进行神经网络计算。计算平台从片外存储器中读取计算所需的数据。该专利申请定义用于识别水平和/或纵向相邻层的规则，基于优化规则选择可融合的层，以降低计算平台与片外存储器之间的数据交换频率。使用定义的融合规则来确定神经网络模型的不同融合策略，以及进行模拟来评估不同融合策略的时间成本和计算效率，并选择性能最佳的一种。
[0005] US10699186B2 涉及确定神经网络的执行顺序的方法。该方法先确定给定内存空间中用于运行网络推理的可用内存量，然后确定神经网络中每个运算的内存需求，并且提出一些图搜索算法来确定神经网络运算的执行顺序，以使得内存的使用不超过可用内存量。
[0006] CN112346877B涉及有效加速深度学习计算的内存分配方法。该...

【技术保护点】

【技术特征摘要】
1.一种优化神经网络模型的执行策略的方法，包括：接收一神经网络模型，所述神经网络模型包括多个节点，其中每个节点对应所述神经网络模型的至少一个运算层；识别所述各节点之间的数据依赖关系；根据识别的各节点之间的数据依赖关系确定多个节点执行顺序的约束条件；在满足所述执行顺序的约束条件的基础上，进行至少一个搜索算法以确定可能的候选节点执行顺序；基于每种候选节点执行顺序估计与所述神经网络模型的多个节点执行相关的存储需求；基于估计的与每种候选节点执行顺序相关的存储需求、根据预定的存储器使用效率指标从所述候选节点执行顺序中选择节点执行顺序，其中，改变节点执行顺序能够改变所述神经网络模型执行过程中多个节点中一个或多个节点的相应输出驻留在存储器中的时间；以及输出选择的所述神经网络模型的节点执行顺序。2.根据权利要求1所述的方法，其中，如果一个节点的输入来自另一节点的输出，则一个节点数据依赖于另一节点，以及将两个节点执行顺序的约束条件确定为：先运算另一节点再运算该一个节点；以及每个节点运行之后生成相应输出，所生成的输出驻留在存储器中直到调用该输出的所有节点运行完毕从存储器中释放。3.根据权利要求1所述的方法，其中，所述存储器使用效率指标包括存储器的平均使用量和/或存储器使用峰值，以及根据预定的存储器使用效率指标从所述候选节点执行顺序中选择节点执行顺序的步骤包括将存储需求最小的候选节点执行顺序选择为优化节点执行顺序，包括将运行神经网络模型时存储器的平均使用量最小和/或存储器使用峰值最低的候选节点执行顺序选择为优化节点执行顺序。4.根据权利要求1所述的方法，其中，识别所述多个节点之间的数据依赖关系的步骤包括：步骤A，基于预定识别方法来扫描所述神经网络模型中的多个节点以识别至少一个分支节点，其中如果一个节点直接跟随有至少两个单源类型的节点，则将该节点识别为分支节点，其中所述分支节点的输出被直接跟随的至少两个节点调用，并在该至少两个节点运行完毕后从存储器中释放该分支节点的输出；步骤B，将直接跟随所识别的一个分支节点的至少两个节点确定为至少两个分支组始节点，并将每个分支组始节点连同数据依赖于该分支组始节点的节点分别指定为同一个分支组，将至少两个分支组始节点连同相应分支组始节点的节点分别指定到分支组1，分支组2
……
分支组N。5. 根据权利要求4所述的方法，其中，确定可能的候选节点执行顺序和选择节点执行顺序的步骤包括：步骤C，确定所述分支组1至分支组N所有分支组可能的分支组候选执行顺序，基于每种分支组候选执行顺序估计与所...

【专利技术属性】
技术研发人员：张伟强，陈文炽，罗鹏，
申请(专利权)人：联合微电子中心有限责任公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人