车载模型训练方法、装置、电子设备、存储介质及芯片制造方法及图纸

技术编号:34894586 阅读:13 留言:0更新日期:2022-09-10 13:54
本公开涉及模型训练中的一种车载模型训练方法、装置、电子设备、存储介质及芯片,包括:根据模型需求确定约束条件;根据约束条件确定基准模型的超参数,所述基准模型的卷积核中包括尺寸不同的多个子卷积核;将车载训练样本数据输入超参数确定后的基准模型中,对超参数确定后的基准模型进行训练,以根据所述尺寸不同的多个子卷积核确定对应所述卷积核的尺寸,得到目标车载模型,在训练过程中所述每一子卷积核的尺寸保持不变。通过基准模型的卷积核中包括尺寸不同的多个子卷积核,在训练过程中,可以灵活地根据尺寸不同的多个子卷积核确定对应所述卷积核的尺寸,从而提高模型训练的便捷性和通用性,并且提高了与各种训练器对接的便捷性和灵活性。捷性和灵活性。捷性和灵活性。

【技术实现步骤摘要】
车载模型训练方法、装置、电子设备、存储介质及芯片


[0001]本公开涉及模型训练
,尤其涉及一种车载模型训练方法、装置、电子设备、存储介质及芯片。

技术介绍

[0002]神经网络模型是由大量、简单的处理单元(称为神经元)互相连接形成的复杂网络系统,通常需要花费较长的时间设计和验证神经元的数量、神经元连接结构和网络层结构,从而搭建基准网络模型,进而借用基准网络模型的网络结构,通过特定的训练数据集训练,得到符合需求的神经网络模型。
[0003]相关技术中,根据需求的神经网络模型的功能,通过人为参与的方式,将基准网络模型中的部分网络层或者部分网络模块晒选出来,通过训练数据集对筛选出来的网络层或者网络模块进行训练,得到符合需求的神经网络模型。然而,人为筛选出来的网络层或者网络模块不够全面,往往导致训练得到的模型准确性较低。

技术实现思路

[0004]为克服相关技术中存在的问题,本公开提供一种车载模型训练方法、装置、电子设备、存储介质及芯片。
[0005]根据本公开实施例的第一方面,提供一种车载模型训练方法,包括:
[0006]根据模型需求确定约束条件;
[0007]根据所述约束条件确定基准模型的超参数,其中,所述基准模型的卷积核中包括尺寸不同的多个子卷积核;
[0008]将车载训练样本数据输入所述超参数确定后的基准模型中,对所述超参数确定后的基准模型进行训练,以根据所述尺寸不同的多个子卷积核确定对应所述卷积核的尺寸,得到目标车载模型,其中,在训练过程中所述每一子卷积核的尺寸保持不变。
[0009]可选地,所述将车载训练样本数据输入所述超参数确定后的基准模型中,对所述超参数确定后的基准模型进行训练,以根据所述尺寸不同的多个子卷积核确定对应所述卷积核的尺寸,得到目标车载模型,包括:
[0010]将车载训练样本数据输入所述超参数确定后的基准模型中,对所述超参数确定后的基准模型进行训练;
[0011]其中,在训练过程中,根据所述尺寸不同的多个子卷积核确定对应所述卷积核的尺寸,并按照所述基准模型的网络结构,根据确定尺寸后的所述卷积核对所述车载训练样本数据进行卷积,得到多个候选车载模型;
[0012]对所述候选车载模型的性能进行测试;
[0013]将性能最好的候选车载模型作为所述目标车载模型。
[0014]可选地,所述根据所述尺寸不同的多个子卷积核确定对应所述卷积核的尺寸,包括:
[0015]针对所述基准模型中的任一所述卷积核,确定各尺寸子卷积核的学习率参数;
[0016]根据各所述子卷积核的尺寸以及对应的所述学习率参数,加权求和确定对应该卷积核的尺寸。
[0017]可选地,所述根据所述尺寸不同的多个子卷积核确定对应所述卷积核的尺寸,包括:
[0018]针对所述基准模型中的任一所述卷积核,从尺寸不同的多个子卷积核中确定一个尺寸的目标子卷积核;
[0019]将所述目标子卷积核的尺寸作为该卷积核的尺寸。
[0020]可选地,所述按照所述基准模型的网络结构,根据确定尺寸后的所述卷积核对所述车载训练样本数据进行卷积,得到多个候选车载模型,包括:
[0021]以各卷积核在所述网络结构中的连接关系对所述卷积核进行位置编码;
[0022]确定编码后的各所述卷积核的卷积核类型和卷积核之间的依赖关系,所述依赖关系是指卷积核之间输入和/或输出存在关联;
[0023]根据所述卷积核类型和所述依赖关系,确定每一轮卷积过程中的可搜索卷积核;
[0024]基于预设的搜索算法,对所述可搜索卷积核进行搜索,并基于搜索结果,根据确定尺寸后的所述卷积核对所述车载训练样本数据进行卷积,得到每一轮卷积对应的候选车载模型,得到所述多个候选车载模型。
[0025]可选地,所述方法包括:
[0026]在每一次卷积完成后,根据所述卷积核类型、所述依赖关系以及该次卷积过程中的各卷积核的尺寸,对所述卷积核进行分组卷积划分,得到分组卷积的数量;
[0027]根据所述分组卷积的数量以及所述候选车载模型的模型信息,生成对应每一所述候选车载模型的描述文件。
[0028]可选地,所述根据所述约束条件确定基准模型的超参数,包括:
[0029]以所述约束条件确定所述基准模型中各卷积核的性能指标;
[0030]基于贝叶斯优化,根据任一所述卷积核的性能指标以及该卷积核的通道扩张比例,确定所述基准模型的迭代次数;
[0031]根据所述迭代次数,从超参数取值范围中确定所述基准模型的超参数,所述超参数取值范围是对所述基准模型进行初始化、并对初始化后的基准模型的网络结构进行解析后得到的。
[0032]可选地,所述约束条件包括:模型参数量、模型运行时延、模型占用内存量中的至少一者。
[0033]根据本公开实施例的第二方面,提供一种车载模型训练装置,包括:
[0034]条件确定模块,被配置为根据模型需求确定约束条件;
[0035]超参数确定模块,被配置为根据所述约束条件确定基准模型的超参数,其中,所述基准模型的卷积核中包括尺寸不同的多个子卷积核;
[0036]训练模块,被配置为将车载训练样本数据输入所述超参数确定后的基准模型中,对所述超参数确定后的基准模型进行训练,以根据所述尺寸不同的多个子卷积核确定对应所述卷积核的尺寸,得到目标车载模型,其中,在训练过程中所述每一子卷积核的尺寸保持不变。
[0037]可选地,所述训练模块,包括:
[0038]训练子模块,被配置为将车载训练样本数据输入所述超参数确定后的基准模型中,对所述超参数确定后的基准模型进行训练;
[0039]其中,在训练过程中,根据所述尺寸不同的多个子卷积核确定对应所述卷积核的尺寸,并按照所述基准模型的网络结构,根据确定尺寸后的所述卷积核对所述车载训练样本数据进行卷积,得到多个候选车载模型;
[0040]测试子模块,被配置为对所述候选车载模型的性能进行测试;
[0041]选择子模块,被配置为将性能最好的候选车载模型作为所述目标车载模型。
[0042]可选地,所述训练子模块,被配置为:
[0043]针对所述基准模型中的任一所述卷积核,确定各尺寸子卷积核的学习率参数;
[0044]根据各所述子卷积核的尺寸以及对应的所述学习率参数,加权求和确定对应该卷积核的尺寸。
[0045]可选地,所述训练子模块,被配置为:
[0046]针对所述基准模型中的任一所述卷积核,从尺寸不同的多个子卷积核中确定一个尺寸的目标子卷积核;
[0047]将所述目标子卷积核的尺寸作为该卷积核的尺寸。
[0048]可选地,所述训练子模块,被配置为:
[0049]以各卷积核在所述网络结构中的连接关系对所述卷积核进行位置编码;
[0050]确定编码后的各所述卷积核的卷积核类型和卷积核之间的依赖关系,所述依赖关系是指卷积核之间输入和/或输出存在本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种车载模型训练方法,其特征在于,包括:根据模型需求确定约束条件;根据所述约束条件确定基准模型的超参数,其中,所述基准模型的卷积核中包括尺寸不同的多个子卷积核;将车载训练样本数据输入超参数确定后的基准模型中,对所述超参数确定后的基准模型进行训练,以根据所述尺寸不同的多个子卷积核确定对应所述卷积核的尺寸,得到目标车载模型,其中,在训练过程中每一子卷积核的尺寸保持不变。2.根据权利要求1所述的方法,其特征在于,所述将车载训练样本数据输入所述超参数确定后的基准模型中,对所述超参数确定后的基准模型进行训练,以根据所述尺寸不同的多个子卷积核确定对应所述卷积核的尺寸,得到目标车载模型,包括:将车载训练样本数据输入所述超参数确定后的基准模型中,对所述超参数确定后的基准模型进行训练;其中,在训练过程中,根据所述尺寸不同的多个子卷积核确定对应所述卷积核的尺寸,并按照所述基准模型的网络结构,根据确定尺寸后的所述卷积核对所述车载训练样本数据进行卷积,得到多个候选车载模型;对所述候选车载模型的性能进行测试;将性能最好的候选车载模型作为所述目标车载模型。3.根据权利要求2所述的方法,其特征在于,所述根据所述尺寸不同的多个子卷积核确定对应所述卷积核的尺寸,包括:针对所述基准模型中的任一所述卷积核,确定各尺寸子卷积核的学习率参数;根据各所述子卷积核的尺寸以及对应的所述学习率参数,加权求和确定对应该卷积核的尺寸。4.根据权利要求2所述的方法,其特征在于,所述根据所述尺寸不同的多个子卷积核确定对应所述卷积核的尺寸,包括:针对所述基准模型中的任一所述卷积核,从尺寸不同的多个子卷积核中确定一个尺寸的目标子卷积核;将所述目标子卷积核的尺寸作为该卷积核的尺寸。5.根据权利要求2所述的方法,其特征在于,所述按照所述基准模型的网络结构,根据确定尺寸后的所述卷积核对所述车载训练样本数据进行卷积,得到多个候选车载模型,包括:以各卷积核在所述基准模型中网络结构的连接关系对所述卷积核进行位置编码;确定编码后的各所述卷积核的卷积核类型和卷积核之间的依赖关系,所述依赖关系是指卷积核之间输入和/或输出存在关联;根据所述卷积核类型和所述依赖关系,确定每一轮卷积过程中的可搜索卷积核;基于预设的搜索算法,对所述可搜索卷积核进行搜索,并基于搜索结果,根据确定尺寸后的所述卷积核对所述车载训练样本数据进行卷积,得到每一轮卷积对应的候选车载模型,得到所述多个候选车载模型。6.根据权利要求4所...

【专利技术属性】
技术研发人员:周天宝
申请(专利权)人:小米汽车科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1