用于优化人工神经网络图的峰值存储器使用的方法和系统技术方案

技术编号:39929545 阅读:20 留言:0更新日期:2024-01-08 21:42
用于优化人工神经网络图的存储器使用的方法和系统。一种用于优化包括多个层和多个张量的人工神经网络图的存储器使用的计算机实现方法包括以下步骤:确定所述多个层中的各个层的张量工作集,其中,张量工作集包括相对于所述相应层消耗存储器的张量;确定多个张量工作集中的至少一个张量工作集是否需要高于预定阈值的存储器使用;如果确定多个工作集中的至少一个张量工作集需要高于预定阈值的存储器使用,则识别多个张量工作集中的需要高于预定阈值的存储器使用的张量工作集;识别负责所识别的工作集中的高于预定阈值的存储器使用的至少一个层;以及修剪所识别的至少一个层。

【技术实现步骤摘要】

本公开涉及用于优化人工神经网络图的存储器使用的方法和系统,具体地,涉及修剪人工神经网络图以优化存储器使用,特别是优化峰值存储器使用。


技术介绍

1、在现代嵌入式系统中,机器学习(ml)算法被用于解决各种任务。这些任务通常由深度神经网络(dnn)执行,这是近年来工业和学术界研究和开发的主要目标。然而,dnn的部署导致巨大的计算和存储器需求,这导致昂贵的目标片上系统(soc)。

2、由于绝大多数现有技术都是针对服务器和web应用而开发的,所以嵌入式系统需求并不总是dnn的初始目标。使dnn的需求最小化的一种典型策略是修剪(pruning),其根据给定的重要性度量去除dnn的非重要分量,诸如权重、通道或层。在所部署的模型仍然满足关键性能指标(kpi)的前提下应用修剪。然而,大多数现有修剪技术不考虑特定的资源预算(如存储器需求)作为资源受限的嵌入式系统的优化目标。

3、yihui he、xiangyu zhang和jian sun的"channel pruning for acceleratingvery deep neural netwo本文档来自技高网...

【技术保护点】

1.一种用于优化人工神经网络图的存储器使用的计算机实现方法,所述人工神经网络图包括多个层和多个张量,该计算机实现方法包括以下步骤:

2.根据权利要求1所述的计算机实现方法,其中,重复所述识别步骤和所述修剪步骤,直到所述多个张量工作集中的每个张量工作集需要低于所述预定阈值的存储器。

3.根据权利要求2所述的计算机实现方法,其中,在每个识别步骤中,识别需要最高存储器量的张量工作集。

4.根据权利要求1至3中任一项所述的计算机实现方法,

5.根据权利要求1至4中任一项所述的计算机实现方法,其中,修剪所识别的至少一个层包括去除所识别的至少一个层。<...

【技术特征摘要】

1.一种用于优化人工神经网络图的存储器使用的计算机实现方法,所述人工神经网络图包括多个层和多个张量,该计算机实现方法包括以下步骤:

2.根据权利要求1所述的计算机实现方法,其中,重复所述识别步骤和所述修剪步骤,直到所述多个张量工作集中的每个张量工作集需要低于所述预定阈值的存储器。

3.根据权利要求2所述的计算机实现方法,其中,在每个识别步骤中,识别需要最高存储器量的张量工作集。

4.根据权利要求1至3中任一项所述的计算机实现方法,

5.根据权利要求1至4中任一项所述的计算机实现方法,其中,修剪所识别的至少一个层包括去除所识别的至少一个层。

6.根据权利要求1至5中任一项所述的计算机实现方法,其中,所述多个张量工作集中需要最大存储器使用的张量工作集是基于所述人工神经网络图的架构确定的。

7.根据权利要求1至6中任一项所述的计算机实现方法,所述计算机实现方法还包括以下步骤:

8.根据权利要求1至7中任一项所述的计算机实现方法,其中,一旦所述多个张量工作集中的每个张量工作集都需要低于所述预定阈值的存储器,就从零开始重新训练修...

【专利技术属性】
技术研发人员:M·A·阿圭勒
申请(专利权)人:APTIV技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1