神经网络结构搜索、模型发布方法、电子设备和存储介质技术

技术编号:33536080 阅读:14 留言:0更新日期:2022-05-19 02:17
本申请提供了一种神经网络结构搜索、模型发布方法、电子设备和存储介质。方法包括:获取第一应用平台的第一信息,第一信息用于指示第一应用平台的第一算力值;获取第二信息,第二信息用于指示第二应用平台在运行不同计算量的模型时的性能参数;基于预设的换算规则,根据第一应用平台的第一信息,对第二信息进行换算,得到第三信息;获取目标模型的目标性能参数,根据目标性能参数在第三信息中确定目标模型的计算量;根据目标模型的计算量,在预设的超网络中搜索得到目标模型;得到的目标模型在第一应用平台应用时,能够充分利用第一应用平台的计算能力,且第一应用平台的计算能力能够保证目标模型具有较高的运行效率。保证目标模型具有较高的运行效率。保证目标模型具有较高的运行效率。

【技术实现步骤摘要】
神经网络结构搜索、模型发布方法、电子设备和存储介质


[0001]本申请涉及人工智能
,尤其涉及一种神经网络结构搜索、模型发布方法、电子设备和存储介质。

技术介绍

[0002]深度学习模型在很多任务上都取得了非常好的效果,但神经网络结构设计是非常依赖专家经验,人工设计网络结构的时间周期较长,且聘请相应专家成本较高。神经网络结构搜索算法可以让机器代替专家来进行神经网络结构设计,并大大提升模型性能,搜索效率高于人工设计效率。
[0003]目前人工设计的网络模型或者神经网络结构搜索算法得到的模型,常常无法充分利用硬件平台的计算能力或者超出硬件平台的计算能力,无法充分利用硬件平台的计算能力时模型的大小会限制到模型的准确性,而超出硬件平台的计算能力时,模型的运行效率无法满足需求。

技术实现思路

[0004]本申请提供了一种神经网络结构搜索、模型发布方法、电子设备和存储介质,旨在使目标模型能够充分利用应用平台的计算能力,且具有较高的运行效率。
[0005]第一方面,本申请实施例提供了一种神经网络结构搜索方法,包括:
[0006]获取第一应用平台的第一信息,所述第一信息用于指示所述第一应用平台的第一算力值;
[0007]获取第二信息,所述第二信息用于指示第二应用平台在运行不同计算量的模型时的性能参数;
[0008]基于预设的换算规则,根据所述第一应用平台的第一信息,对所述第二信息进行换算,得到第三信息;
[0009]获取目标模型的目标性能参数,根据所述目标性能参数在所述第三信息中确定所述目标模型的计算量;
[0010]根据所述目标模型的计算量,在预设的超网络中搜索得到所述目标模型。
[0011]示例性的,所述获取第二信息,包括:获取所述第二应用平台在运行多个不同计算量的模型时的性能参数;根据所述模型的计算量和对应的性能参数,拟合得到所述第二应用平台在运行连续范围内任意计算量的模型时的性能参数,将所述第二应用平台在运行连续范围内任意计算量的模型时的性能参数作为所述第二信息。可以通过实测若干不同计算量的模型运行时的性能参数,得到没有实测的计算量的模型运行时的性能参数。
[0012]示例性的,在所述拟合得到所述第二应用平台在运行连续范围内任意计算量的模型时的性能参数之后,所述方法还包括:获取所述第二应用平台在运行测试模型时的性能参数;根据所述测试模型的计算量和对应的性能参数,修正拟合得到的所述第二应用平台在运行连续范围内任意计算量的模型时的性能参数;所述将所述第二应用平台在运行连续
范围内任意计算量的模型时的性能参数作为所述第二信息,包括:将修正后的所述第二应用平台在运行连续范围内任意计算量的模型时的性能参数作为所述第二信息。以提高第二信息的准确性。
[0013]示例性的,所述基于预设的换算规则,根据所述第一应用平台的第一信息,对所述第二信息进行换算,得到第三信息,包括:根据第一比值,对所述第二信息进行换算,得到第三信息,其中,所述第一比值是所述第一信息指示的第一应用平台的第一算力值,与所述第二信息中第二应用平台的第二算力值的比值。所述第三信息可以准确的指示所述第一应用平台在运行不同计算量的模型时的性能参数。
[0014]示例性的,所述方法还包括:根据所述第一应用平台的标称算力值与算力利用率的乘积,确定所述第一应用平台的第一算力值,其中,所述标称算力值为所述第一信息指示的第一应用平台的标称算力值,所述算力利用率为所述第一应用平台对应的算力利用率。在第一应用平台没有实测第一算力值时,根据预设的算力利用率确定第一应用平台的第一算力值。
[0015]示例性的,所述获取第二信息,包括:基于预设的第二信息与应用平台的对应关系,根据所述第一应用平台的第一信息,确定所述第一应用平台对应的第二信息。可以使得确定的第二信息更准确的体现第一应用平台的计算量和性能参数的对应关系。
[0016]示例性的,所述性能参数包括处理时间,所述根据第一比值,对所述第二信息进行换算,包括:将所述第二信息中不同计算量对应的处理时间除以所述第一比值;或者所述性能参数包括处理帧率,所述根据第一比值,对所述第二信息进行换算,包括:将所述第二信息中不同计算量对应的处理帧率乘以所述第一比值。
[0017]示例性的,所述根据所述目标性能参数在所述第三信息中确定所述目标模型的计算量,包括:基于所述第三信息中计算量与性能参数的对应关系,确定所述目标性能参数对应的计算量为所述目标模型的计算量。基于所述第三信息,根据目标模型的目标性能参数确定目标模型的计算量,以便在预设的超网络中搜索得到目标模型。
[0018]示例性的,所述根据所述目标模型的计算量,在预设的超网络中搜索得到所述目标模型,包括:根据所述目标模型的计算量,在预训练的超网络中搜索得到若干模型,所述模型包括预训练权重;根据训练数据集,分别对各所述模型进行训练,得到若干训练后的模型;根据验证数据集,分别确定各所述训练后的模型的模型性能;根据各所述训练后的模型的模型性能,在所述若干模型中确定所述目标模型,或者在所述若干训练后的模型中确定所述目标模型。通过在预训练的超网络中搜索得到目标模型,可以为下游训练任务提供更适合的网络模型以及相应的预训练权重,且预训练权重可以直接获取,可以减少时间和资源的消耗。
[0019]第二方面,本申请实施例提供了一种模型发布方法,包括:
[0020]根据前述的神经网络结构搜索方法确定目标模型;
[0021]根据终端设备的指令将所述目标模型发送到目标设备。可以实现模型的分发。
[0022]第三方面,本申请实施例提供了一种电子设备,包括存储器和处理器;
[0023]所述存储器用于存储计算机程序;
[0024]所述处理器,用于执行所述计算机程序并在执行所述计算机程序时,实现上述的神经网络结构搜索方法的步骤,或者上述的模型发布方法的步骤。
[0025]第四方面,本申请实施例提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,所述计算机程序被处理器执行时使所述处理器实现上述的神经网络结构搜索方法的步骤,或者上述的模型发布方法的步骤。
[0026]本申请实施例提供了一种神经网络结构搜索、模型发布方法、电子设备和存储介质,方法包括:获取第一应用平台的第一信息,第一信息用于指示第一应用平台的第一算力值;获取第二信息,第二信息用于指示第二应用平台在运行不同计算量的模型时的性能参数;基于预设的换算规则,根据第一应用平台的第一信息,对第二信息进行换算,得到第三信息;根据目标模型的目标性能参数,在第三信息中确定目标模型的计算量;根据目标模型的计算量,在预设的超网络中搜索得到目标模型。通过根据第一应用平台的第一信息,对第二信息指示的模型的计算量与性能参数的对应关系进行换算,使得第三信息可以准确的指示所述第一应用平台在运行不同计算量的模型时的性能参数;以及基于第三信息,根据目标模型的目标性能参数确定目标模型的计算量,以便在预设的超网络中搜索得到本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种神经网络结构搜索方法,其特征在于,包括:获取第一应用平台的第一信息,所述第一信息用于指示所述第一应用平台的第一算力值;获取第二信息,所述第二信息用于指示第二应用平台在运行不同计算量的模型时的性能参数;基于预设的换算规则,根据所述第一应用平台的第一信息,对所述第二信息进行换算,得到第三信息;获取目标模型的目标性能参数,根据所述目标性能参数在所述第三信息中确定所述目标模型的计算量;根据所述目标模型的计算量,在预设的超网络中搜索得到所述目标模型。2.根据权利要求1所述的神经网络结构搜索方法,其特征在于,所述获取第二信息,包括:获取所述第二应用平台在运行多个不同计算量的模型时的性能参数;根据所述模型的计算量和对应的性能参数,拟合得到所述第二应用平台在运行连续范围内任意计算量的模型时的性能参数,将所述第二应用平台在运行连续范围内任意计算量的模型时的性能参数作为所述第二信息。3.根据权利要求2所述的神经网络结构搜索方法,其特征在于,在所述拟合得到所述第二应用平台在运行连续范围内任意计算量的模型时的性能参数之后,所述方法还包括:获取所述第二应用平台在运行测试模型时的性能参数;根据所述测试模型的计算量和对应的性能参数,修正拟合得到的所述第二应用平台在运行连续范围内任意计算量的模型时的性能参数;所述将所述第二应用平台在运行连续范围内任意计算量的模型时的性能参数作为所述第二信息,包括:将修正后的所述第二应用平台在运行连续范围内任意计算量的模型时的性能参数作为所述第二信息。4.根据权利要求1所述的神经网络结构搜索方法,其特征在于,所述基于预设的换算规则,根据所述第一应用平台的第一信息,对所述第二信息进行换算,得到第三信息,包括:根据第一比值,对所述第二信息进行换算,得到第三信息,其中,所述第一比值是所述第一信息指示的第一应用平台的第一算力值,与所述第二信息中第二应用平台的第二算力值的比值。5.根据权利要求4所述的神经网络结构搜索方法,其特征在于,所述方法还包括:根据所述第一应用平台的标称算力值与算力利用率的乘积,确定所述第一应用平台的第一算力值,其中,所述标称算力值为所述第一信息指示的第一应用平台的标称算力值,所述算力利用率为所述第一应用平台对应的算力利用率。6.根据权利要求4所述的神经网络结构搜索方法,其特征在于,所述获取第二信息,包括:基于预设的第...

【专利技术属性】
技术研发人员:李桂友吴招乐李少华李尧邹中元赵丛
申请(专利权)人:共达地创新技术深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1