神经网络模型推理所需最小内存占用量的估计方法和装置制造方法及图纸

技术编号：36912775 阅读：15 留言：0更新日期：2023-03-18 09:30

本发明专利技术公开了一种神经网络模型推理所需最小内存占用量的估计方法和装置，属于神经网络应用领域。该方法以图理论作为核心思想，将神经网络的计算逻辑用有向无环图来描述，把神经网络模型的推理过程映射成图的拓扑排序过程，再对搜索树进行剪枝以得到对最小内存占用量的估计以及对应的算子执行序列。边缘设备智能性的需求日益增大，本发明专利技术为神经网络模型在边缘设备上运行与设计提供了信息支撑，对边缘设备的智能性有着贡献。设备的智能性有着贡献。设备的智能性有着贡献。

全部详细技术资料下载

【技术实现步骤摘要】
神经网络模型推理所需最小内存占用量的估计方法和装置

[0001]本专利技术属于神经网络应用
，尤其涉及一种神经网络模型推理所需最小内存占用量的估计方法和装置。

技术介绍

[0002]近些年来，神经网络领域飞速发展吸引了大量的关注，相关应用成果层出不穷。例如，人脸识别技术可应用在日常打卡，图像识别和语义分割技术可应用于人员安全监控。这些技术对我们的生活起到了至关重要的作用，然而，它们距离完美的落地应用仍然面临着一系列的挑战。
[0003]首先，目前成熟的神经网络应用中，待推理数据普遍为摄像头及传感设备采集的各类传感数据，这些数据通过网络途径传递给远端服务器，在服务器上对这些数据进行智能推理，推理结果再通过网络返回到边缘设备端，边缘设备再根据结果进行进一步的处理。这种方式的缺点在于整个推理流程的时间消耗较大，并且极易受到网络稳定性的影响。为了减小推理时间，可以将神经网络模型直接运行在边缘计算设备上。然而，边缘计算设备相较于服务器有着较大的不同，以工业界使用广泛的STM32F7这种微控制器为例，其最大片上RAM存储为512KB，这意味着神经网络模型在该类型的微控制器上推理过程中所需要的最小总内存占用量不得超过512KB。
[0004]不同的边缘设备有着不同的内存限制，不同的神经网络模型结构也各不相同，为了判断神经网络能否在某种边缘设备上运行，我们必须要估计出神经网络智能推理过程所需的最小内存占用量。进一步的，这个估计方法其实也是一种在边缘计算设备上进行推理的方法，因此也需要快速进行。
专利技术...

【技术保护点】

【技术特征摘要】
1.一种神经网络模型推理所需最小内存占用量的估计方法，其特征在于，包括以下步骤：（1）通过神经网络模型的图来构建有向无环图；（2）将有向无环图扩充成有向无环图的标准形式；（3）基于步骤（2）得到的标准形式,通过贪心策略来获得初始的剪枝标准；（4）通过估计方法进行剪枝加速，具体为设起始点，按照算子执行序列搜索树的分支进行搜索，搜索结果的内存占用量为,通过内存占用量与初始的剪枝标准的比较来判断是否舍弃内存占用量或将内存占用量更新为最小内存占用量。2.根据权利要求1所述的一种神经网络模型推理所需最小内存占用量的估计方法，其特征在于，所述步骤（1）中的有向无环图包含点集和边集，即，其中，；集合中每个元素为一个节点，代表一个算子；每个节点有一个属性值，表示节点的计算所需要内存占用量；边集的每个元素代表中的一条边，表示节点计算使用节点的计算结果，称为该边的源节点，称为该边的目标节点，边的值为，代表源节点输出结果的内存占用量。3.根据权利要求1所述的一种神经网络模型推理所需最小内存占用量的估计方法，其特征在于，所述步骤（2）中的扩充为点扩充和边扩充。4.根据权利要求3所述的一种神经网络模型推理所需最小内存占用量的估计方法，其特征在于，所述点扩充为通过在中添加一个起始点和终止点,这两个点的属性值都为0，得到有向无环图的标准形式的点集。5.根据权利要求3所述的一种神经网络模型推理所需最小内存占用量的估计方法，其特征在于，所述边扩充为通过连接与中的起始节点和与中的终止节点，增加新的边，设置边的属性值为0，得到有向无环图的标准形式的边集，则。6.根据权利要求1所述的一种神经网络模型推理所需最小内存占用量的估计方法，其特征在于，所述步骤（3...

【专利技术属性】
技术研发人员：李超，
申请(专利权)人：之江实验室，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人