一种卷积神经网络模型的加载方法、装置及存储介质制造方法及图纸

技术编号:40803451 阅读:27 留言:0更新日期:2024-03-28 19:28
本发明专利技术公开了一种卷积神经网络模型的加载方法、装置及存储介质,本发明专利技术通过在边缘设备中设置若干小型神经网络模型,并计算出了各个小型神经网络模型的单次推理时间、模型推理时间以及运行内存;而后,即可基于此,来进行模型匹配,即将边缘设备的运算能力,与各小型神经网络模型的运行内存进行比较,来选取出备选模型;接着,再选取出单次推理时间符合使用需求的模型;最后,则可从符合使用需求的模型中,选取出尺寸最大的模型作为最优模型来进行模型加载;由此,本发明专利技术能够为边缘设备匹配出兼具效率以及精度的本地模型,避免了传统技术采用云端加载模型所存在的易受网络带宽和延时影响的问题,能够提高用户的体验感,适用于大规模应用与推广。

【技术实现步骤摘要】

本专利技术属于模型加载,具体涉及一种卷积神经网络模型的加载方法、装置及存储介质


技术介绍

1、随着深度学习领域的快速发展,卷积神经网络(cnn)在多种任务中(比如机器视觉)都展现出了卓越的性能,为了提高模型的精度,研究者们设计出了越来越复杂的cnn模型;然而,这些模型的计算和存储需求也随之增加,这使得边缘设备(如手机和智能手表)在加载和实时执行这些模型时面临了新的挑战。

2、为了解决这一问题,云计算被提出作为一种可能的解决方案,通过这种方式,边缘设备可以依赖云端强大的计算能力来进行深度学习模型的推理;但是,这种方法也带来了新的问题,即网络延迟和带宽限制,其中,在某些需要实时反馈的应用场景中,网络延迟可能导致用户体验下降,而带宽限制则可能影响到模型推理的效率;因此,如何在边缘设备上高效地加载并执行深度学习模型已成为了一个紧迫的研究问题。


技术实现思路

1、本专利技术的目的是提供一种卷积神经网络模型的加载方法、装置及存储介质,用以解决现有技术采用云计算来加载并执行深度学习模型所存在的容易受到网络延迟本文档来自技高网...

【技术保护点】

1.一种卷积神经网络模型的加载方法,其特征在于,包括:

2. 根据权利要求1所述的方法,其特征在于,所述任一第一神经网络模型为CNN模型,其中,所述任一第一神经网络模型的输出为:

3.根据权利要求1所述的方法,其特征在于,在以第二神经网络模型的输出作为训练数据来训练得到所述任一第一神经网络模型后,所述方法还包括:

4.根据权利要求3所述的方法,其特征在于,利用所述模型参数集,确定出剪枝后的模型参数集,包括:

5.根据权利要求1所述的方法,其特征在于,各个第一神经网络模型的模型推理时间,采用如下方法计算得到;

6.根据权利要求5所...

【技术特征摘要】

1.一种卷积神经网络模型的加载方法,其特征在于,包括:

2. 根据权利要求1所述的方法,其特征在于,所述任一第一神经网络模型为cnn模型,其中,所述任一第一神经网络模型的输出为:

3.根据权利要求1所述的方法,其特征在于,在以第二神经网络模型的输出作为训练数据来训练得到所述任一第一神经网络模型后,所述方法还包括:

4.根据权利要求3所述的方法,其特征在于,利用所述模型参数集,确定出剪枝后的模型参数集,包括:

5.根据权利要求1所述的方法,其特征在于,各个第一神经网络模型的模型推理时间,采用如下方法计算得到;

6.根据权利要求5所述的方法,其特征在于,获取各个第...

【专利技术属性】
技术研发人员:傅金波
申请(专利权)人:广州汇思信息科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1