模型的适配方法、装置及存储介质制造方法及图纸

技术编号:44554815 阅读:42 留言:0更新日期:2025-03-11 14:17
本申请提供一种模型的适配方法、装置及存储介质,涉及人工智能技术领域,用于解决深度学习模型在迁移时与高性能计算载体适配的问题。该方法包括:获取待迁移模型的模型信息、初始载体单元的初始载体信息和目标载体单元的目标载体信息。基于初始载体信息和目标载体信息,确定载体差异。基于模型信息和载体差异对待迁移模型进行调整,得到调整后的模型。

【技术实现步骤摘要】

本申请涉及人工智能,尤其涉及一种模型的适配方法、装置及存储介质


技术介绍

1、目前,深度学习模型的训练和推理需要大量计算资源。由于图形处理器(graphicsprocessing unit,gpu)对深度学习模型进行训练和推理时,无法高效实时性的需求。因此,需要将深度学习模型迁移至高性能计算载体上,以提高计算效率。

2、然而,将深度学习模型迁移至高性能计算载体过程中,可能会导致深度学习模型的性能降低。因此,如何保障深度学习模型在迁移时与高性能计算载体适配,成为当前亟待解决的问题。


技术实现思路

1、本申请提供一种模型的适配方法、装置及存储介质,用于解决深度学习模型在迁移时与高性能计算载体适配的问题。

2、为达到上述目的,本申请采用如下技术方案:

3、第一方面,本申请提供一种模型的适配方法。该方法中,获取待迁移模型的模型信息、初始载体单元的初始载体信息和目标载体单元的目标载体信息。基于初始载体信息和目标载体信息,确定载体差异。基于模型信息和载体差异对待迁移模型进行调整,得到本文档来自技高网...

【技术保护点】

1.一种模型的适配方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述模型信息包括:所述待迁移模型的大小和所述待迁移模型包括的多个初始模块;所述基于所述模型信息和所述载体差异对所述待迁移模型进行调整,得到调整后的模型,包括:

3.根据权利要求2所述的方法,其特征在于,所述基于所述模型信息和所述载体差异信息,调整所述待迁移模型的大小和所述待迁移模型包括的所述多个初始模块,得到所述调整后的模型,包括:

4.根据权利要求3所述的方法,其特征在于,所述方法还包括:

5.根据权利要求4所述的方法,其特征在于,所述基于所述待...

【技术特征摘要】

1.一种模型的适配方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述模型信息包括:所述待迁移模型的大小和所述待迁移模型包括的多个初始模块;所述基于所述模型信息和所述载体差异对所述待迁移模型进行调整,得到调整后的模型,包括:

3.根据权利要求2所述的方法,其特征在于,所述基于所述模型信息和所述载体差异信息,调整所述待迁移模型的大小和所述待迁移模型包括的所述多个初始模块,得到所述调整后的模型,包括:

4.根据权利要求3所述的方法,其特征在于,所述方法还包括:

5.根据权利要求4所述的方法,其特征在于,所述基于所述待迁移模型的初始算子,从算子库中确定与目标载体单元适配的目标算子,包括:

6.根据权利要求1-5中任一项所述的方法,其特征...

【专利技术属性】
技术研发人员:岳向阳马季春赵锴肖伟
申请(专利权)人:中国联合网络通信集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1