一种基于动态DNN的推理方法、设备、存储介质技术

技术编号:40330625 阅读:29 留言:0更新日期:2024-02-09 14:22
本发明专利技术涉及一种基于动态DNN的推理方法、设备、存储介质,方法包括如下步骤:针对目标动态DNN网络,通过子网结构搜索得到多个备选的静态子网;将所述多个备选的静态子网作为推理引擎的输入,完成所述目标动态DNN网络的训练,得到静态子网的网络参数以及对应的性能评价指标值;根据目标硬件设备的需求参数,从所述目标动态DNN网络中,选取性能评价指标值最优的静态子网作为优选的静态子网。与现有技术相比,本申请将动态DNN有效地部署在推理引擎上,将大大降低网络传输模型参数的压力和成本,有效延长硬件的寿命。

【技术实现步骤摘要】

本专利技术涉及计算机,尤其是涉及一种基于动态dnn的推理方法、设备、存储介质。


技术介绍

1、神经架构搜索(nas)是一种设计神经网络结构的技术。它可以基于平台和数据库,通过算法搜索合适的网络结构,有效降低设计网络结构的成本。nas的原理是利用策略在给定的网络结构空间中搜索合适的神经网络。通过一定的精度、延迟等指标来衡量神经网络结构的优劣,称为性能评价。

2、然而,nas在运行环境不同的情况下,仍然存在反复搜索和训练不同网络结构的问题。在搜索空间中寻找最优网络结构以及搜索后的训练过程无疑是耗费时间和计算资源的。其中ofa(once-for-all)提案在一定程度上弥补了nas的不足。

3、通常,静态网络方法只能针对特定平台进行部署和推理。对于不同的平台,往往需要重新训练。这种方法无疑需要足够的计算资源和时间才能运行。所以ofa从这个角度将搜索过程和训练分开,可以节省训练成本。

4、然而,尽管ofa节省了模型的训练时间,但要在部署平台上实现动态化仍然不切实际。原因如在于,与真实条件下的模型切换相比,ofa的搜索过程和校准b本文档来自技高网...

【技术保护点】

1.一种基于动态DNN的推理方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的一种基于动态DNN的推理方法,其特征在于,将所述多个备选的静态子网作为推理引擎的输入之后,还包括:

3.根据权利要求1所述的一种基于动态DNN的推理方法,其特征在于,所述的需求参数包括目标硬件设备的延迟和/或能量,所述的性能评价指标值包括精度和/或延迟。

4.根据权利要求1所述的一种基于动态DNN的推理方法,其特征在于,所述的推理方法应用于服务端,所述的推理方法还包括:

5.根据权利要求1所述的一种基于动态DNN的推理方法,其特征在于,利用遗传算法取性能评...

【技术特征摘要】

1.一种基于动态dnn的推理方法,其特征在于,包括如下步骤:

2.根据权利要求1所述的一种基于动态dnn的推理方法,其特征在于,将所述多个备选的静态子网作为推理引擎的输入之后,还包括:

3.根据权利要求1所述的一种基于动态dnn的推理方法,其特征在于,所述的需求参数包括目标硬件设备的延迟和/或能量,所述的性能评价指标值包括精度和/或延迟。

4.根据权利要求1所述的一种基于动态dnn的推理方法,其特征在于,所述的推理方法应用于服务端,所述的推理方法还包括:

5.根据权利要求1所述的一种基于动态dnn的推理方法,其特征在于,利用遗传算法取性能评价指标值最优的静态子网作为优选的子网。

6.根据权利要求1所述的一种基于动态dnn的推理方法,其特征...

【专利技术属性】
技术研发人员:高元天
申请(专利权)人:交通银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1