模型推理方法、设备、存储介质和程序产品技术

技术编号:38852723 阅读:16 留言:0更新日期:2023-09-17 10:00
本申请实施例提供的一种模型推理方法、设备、存储介质和程序产品,该方法包括:获取待处理模型和输入数据,其中,所述待处理模型的每个算子被配置有初始化内存空间,所述初始化内存空间与所述待处理模型允许的最大输入数据维度相适应;根据输入数据的数据维度和所述最大输入数据维度,确定所述待处理模型的每个算子的输出维度;基于所述输入数据、所述每个算子的输出维度和所述初始化内存空间,对所述待处理模型进行推理,输出模型推理结果。本申请可以减少模型推理时延,提高模型推理效率。提高模型推理效率。提高模型推理效率。

【技术实现步骤摘要】
模型推理方法、设备、存储介质和程序产品


[0001]本申请涉及计算机
,尤其涉及一种模型推理方法、设备、存储介质和程序产品。

技术介绍

[0002]人工智能(Artificial Intelligence,简称“AI”)是研究如何应用计算机的软硬件来模拟人类某些智能行为的基本理论、方法和技术。随着计算机技术的发展,AI模型的应用越来越普遍。人工神经网络(Artificial Neural Networks,ANNs),是一种模仿动物神经网络行为特征,进行分布式并行信息处理的算法数学模型。人工神经网络模型是一种常见的AI模型,广泛应用于各种场景,比如自然语言模型、图像识别模型等。
[0003]实际场景中,训练完成的AI模型,需要部署在服务器上或端侧产品上,经过模型推理过程实现模型的应用。AI模型推理时,在初始化阶段,推理框架需要为模型的每个算子分配与之输入维度相匹配的内存空间,才能实现对输入数据进行推理。
[0004]然而,当AI模型的输入维度动态变化时,如果仍采用上述方式为每个算子分配相应的内存空间,则每次输入数据变化后都需要重新分配模型中所有算子所需的内存空间,导致模型的推理时延过长,推理效率低下。

技术实现思路

[0005]本申请实施例提供一种模型推理方法、设备、存储介质和程序产品,可以减少模型推理时延,提高模型推理效率。
[0006]第一方面,本申请实施例提供一种模型推理方法,包括:获取待处理模型和输入数据,其中,所述待处理模型的每个算子被配置有初始化内存空间,所述初始化内存空间与所述待处理模型允许的最大输入数据维度相适应;根据输入数据的数据维度和所述最大输入数据维度,确定所述待处理模型的每个算子的输出维度;基于所述输入数据、所述每个算子的输出维度和所述初始化内存空间,对所述待处理模型进行推理,输出模型推理结果。
[0007]于一实施例中,在所述根据输入数据的数据维度,确定所述待处理模型的每个算子的输出维度之前,还包括:获取所述待处理模型允许的最大输入数据维度;根据所述最大输入数据维度,为所述待处理模型的每个算子配置所述初始化内存空间,所述初始化内存空间与所述最大输入数据维度相适应。
[0008]于一实施例中,所述根据所述最大输入数据维度,为所述待处理模型的每个算子配置所述初始化内存空间,所述初始化内存空间与所述最大输入数据维度相适应,包括:根据所述最大输入数据维度和所述每个算子的参数配置,确定所述每个算子的内存资源占用量;基于所述内存资源占用量为所述每个算子配置所述初始化内存空间,其中,针对每个算子,所述初始化内存空间的资源量大于或等于所述内存资源占用量。
[0009]于一实施例中,所述根据输入数据的数据维度和所述最大输入数据维度,确定所述待处理模型的每个算子的输出维度,包括:判断所述输入数据的数据维度是否大于所述
最大输入数据维度;若所述输入数据的数据维度大于所述最大输入数据维度,则根据所述最大输入数据维度,确定所述待处理模型中每个算子的输出维度。
[0010]于一实施例中,所述根据输入数据的数据维度和所述最大输入数据维度,确定所述待处理模型的每个算子的输出维度,还包括:若所述输入数据的数据维度小于或等于所述最大输入数据维度,则根据所述输入数据的数据维度,确定所述待处理模型中每个算子的输出维度。
[0011]于一实施例中,所述基于所述输入数据、所述每个算子的输出维度和所述初始化内存空间,对所述待处理模型进行推理,输出模型推理结果,包括:模型推理过程中,检测当前算子是否配置有预设属性;若所述当前算子配置有所述预设属性,则基于所述当前算子接收到的数据和所述当前算子的参数配置,更新所述当前算子的输出维度;基于更新后所述当前算子的输出维度和所述输入数据,在所述当前算子对应的初始化内存空间上对所述当前算子进行推理,得到所述当前算子的推理结果;根据所述待处理模型中所有算子的推理结果,确定所述待处理模型的推理结果。
[0012]于一实施例中,所述基于所述输入数据、所述每个算子的输出维度和所述初始化内存空间,对所述待处理模型进行推理,输出模型推理结果,还包括:若所述当前算子没有配置所述预设属性,基于所述当前算子的输出维度和所述输入数据,在所述当前算子对应的初始化内存空间上对所述当前算子进行推理,得到所述当前算子的推理结果;根据所述待处理模型中所有算子的推理结果,确定所述待处理模型的推理结果。
[0013]于一实施例中,所述根据所述待处理模型中所有算子的推理结果,确定所述待处理模型的推理结果,包括:将所述当前算子的推理结果传递给下一个算子,继续进行模型推理,直至遍历所述待处理模型的每个算子,得到所述模型推理结果。
[0014]于一实施例中,在所述模型推理过程中,检测当前算子是否配置有预设属性之前,还包括:创建所述待处理模型的拓扑结构,为所述待处理模型中的目标算子配置预设属性,并将所述预设属性在所述拓扑结构中传递。
[0015]第二方面,本申请实施例提供一种模型推理装置,包括:
[0016]第一获取模块,用于获取待处理模型和输入数据,其中,所述待处理模型的每个算子被配置有初始化内存空间,所述初始化内存空间与所述待处理模型允许的最大输入数据维度相适应;
[0017]确定模块,用于根据输入数据的数据维度和所述最大输入数据维度,确定所述待处理模型的每个算子的输出维度;
[0018]推理模块,用于基于所述输入数据、所述每个算子的输出维度和所述初始化内存空间,对所述待处理模型进行推理,输出模型推理结果。
[0019]于一实施例中,还包括:第二获取模块,用于在所述根据输入数据的数据维度,确定所述待处理模型的每个算子的输出维度之前,获取所述待处理模型允许的最大输入数据维度;配置模块,用于根据所述最大输入数据维度,为所述待处理模型的每个算子配置所述初始化内存空间,所述初始化内存空间与所述最大输入数据维度相适应。
[0020]于一实施例中,所述配置模块,用于根据所述最大输入数据维度和所述每个算子的参数配置,确定所述每个算子的内存资源占用量;基于所述内存资源占用量为所述每个算子配置所述初始化内存空间,其中,针对每个算子,所述初始化内存空间的资源量大于或
等于所述内存资源占用量。
[0021]于一实施例中,所述确定模块,用于判断所述输入数据的数据维度是否大于所述最大输入数据维度;若所述输入数据的数据维度大于所述最大输入数据维度,则根据所述最大输入数据维度,确定所述待处理模型中每个算子的输出维度。
[0022]于一实施例中,所述确定模块,还用于若所述输入数据的数据维度小于或等于所述最大输入数据维度,则根据所述输入数据的数据维度,确定所述待处理模型中每个算子的输出维度。
[0023]于一实施例中,所述推理模块,用于模型推理过程中,检测当前算子是否配置有预设属性;若所述当前算子配置有所述预设属性,则基于所述当前算子接收到的数据和所述当前算子的参数配置,更新所述当前算子的输出维度;基于更新后所本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型推理方法,其特征在于,包括:获取待处理模型和输入数据,其中,所述待处理模型的每个算子被配置有初始化内存空间,所述初始化内存空间与所述待处理模型允许的最大输入数据维度相适应;根据输入数据的数据维度和所述最大输入数据维度,确定所述待处理模型的每个算子的输出维度;基于所述输入数据、所述每个算子的输出维度和所述初始化内存空间,对所述待处理模型进行推理,输出模型推理结果。2.根据权利要求1所述的方法,其特征在于,在所述根据输入数据的数据维度,确定所述待处理模型的每个算子的输出维度之前,还包括:获取所述待处理模型允许的最大输入数据维度;根据所述最大输入数据维度,为所述待处理模型的每个算子配置所述初始化内存空间,所述初始化内存空间与所述最大输入数据维度相适应。3.根据权利要求2所述的方法,其特征在于,所述根据所述最大输入数据维度,为所述待处理模型的每个算子配置所述初始化内存空间,所述初始化内存空间与所述最大输入数据维度相适应,包括:根据所述最大输入数据维度和所述每个算子的参数配置,确定所述每个算子的内存资源占用量;基于所述内存资源占用量为所述每个算子配置所述初始化内存空间,其中,针对每个算子,所述初始化内存空间的资源量大于或等于所述内存资源占用量。4.根据权利要求1所述的方法,其特征在于,所述根据输入数据的数据维度和所述最大输入数据维度,确定所述待处理模型的每个算子的输出维度,包括:判断所述输入数据的数据维度是否大于所述最大输入数据维度;若所述输入数据的数据维度大于所述最大输入数据维度,则根据所述最大输入数据维度,确定所述待处理模型中每个算子的输出维度。5.根据权利要求4所述的方法,其特征在于,所述根据输入数据的数据维度和所述最大输入数据维度,确定所述待处理模型的每个算子的输出维度,还包括:若所述输入数据的数据维度小于或等于所述最大输入数据维度,则根据所述输入数据的数据维度,确定所述待处理模型中每个算子的输出维度。6.根据权利要求1所述的方法,其特征在于,所述基于所述输入数据、所述每个算子的输出维度和所述初始化内存空间,对所述待处理模型进行推理,输出模型推理...

【专利技术属性】
技术研发人员:伍国林王哲陆二伟廖建文
申请(专利权)人:荣耀终端有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1