【技术实现步骤摘要】
本专利技术属于深度学习领域,涉及深度学习模型(也称深度神经网络dnn)在嵌入式设备(也称小型设备)上的部署,具体涉及一种用于小型设备的基于细粒度调度的深度学习模型内存优化方法。
技术介绍
1、深度学习模型(deep learningmodel),也称深度神经网络(deep neuralnetwork,dnn),是一种由多层神经元组成的人工神经网络。这些网络能够学习并模拟复杂的非线性关系,是近几年应用广泛的人工智能(artificial intelligence,ai)的核心要素。张量(tensor),也称为多维数组(nd-array),是dnn中的基本数据表示。张量的维度(dimension)也称为张量轴(tensoraxis)。一个n维张量有n个张量轴,张量x的所有张量轴记作x.a,第i个张量轴记作x.ai。张量的形状为其各个张量轴长度的组合,例如张量x的形状为2×3意味着其第一个轴长度为2,第二个轴长度为3。张量中的每个元素是一个标量,可以用下标索引访问,例如a[0,2]表示二维张量a的第0行第2列的标量元素。算子(operator
...【技术保护点】
1.一种用于小型设备的基于细粒度调度的深度学习模型内存优化方法,其特征在于,给定目标设备、性能开销限制、搜索时间限制和ONNX格式表示的原始DNN作为输入,具体步骤包括:
2.如权利要求1所述的用于小型设备的基于细粒度调度的深度学习模型内存优化方法,其特征在于,所述步骤1)将测量器编译部署到目标设备上,是通过USB进行烧录。
3.如权利要求1所述的用于小型设备的基于细粒度调度的深度学习模型内存优化方法,其特征在于,所述步骤1)预定比例的性能开销限制,其预定比例可调整,默认为5%。
4.如权利要求1所述的用于小型设备的基于细粒度调度的
...【技术特征摘要】
1.一种用于小型设备的基于细粒度调度的深度学习模型内存优化方法,其特征在于,给定目标设备、性能开销限制、搜索时间限制和onnx格式表示的原始dnn作为输入,具体步骤包括:
2.如权利要求1所述的用于小型设备的基于细粒度调度的深度学习模型内存优化方法,其特征在于,所述步骤1)将测量器编译部署到目标设备上,是通过usb进行烧录。
3.如权利要求1所述的用于小型设备的基于细粒度调度的深度学习模型内存优化方法,其特征在于,所述步骤1)预定比例的性能开销限制,其预定比例可调整,默认为5%。
4.如权利要求1所述的用于小型设备的基于细粒度调...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。