模型资源的处理方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:32879416 阅读:15 留言:0更新日期:2022-04-02 12:12
本申请公开了一种模型资源的处理方法、装置、计算机设备及存储介质,方法包括:获取初始版本模型和多个目标版本数据集;基于多个目标版本数据集,对初始版本模型进行多次训练操作,得到每次训练操作对应的新版本模型;根据初始版本模型的第一模型名称和目标版本数据集的数据集名称,对新版本模型进行重命名,得到新版本模型的第二模型名称;根据第一模型名称、数据集名称和第二模型名称,生成初始版本模型、目标版本数据集和新版本模型之间的目标模型系谱。本实施例能够采用系谱直观展示模型之间以及模型与数据集之间的关系,便于回溯在先版本模型,实现模型和数据集的有效管理。实现模型和数据集的有效管理。实现模型和数据集的有效管理。

【技术实现步骤摘要】
模型资源的处理方法、装置、计算机设备及存储介质


[0001]本申请涉及计算机领域,尤其涉及一种模型资源的处理方法、装置、计算机设备及存储介质。

技术介绍

[0002]随着实际业务的拓展,需要不断更新训练数据集并重新训练人工智能模型,以提升模型性能或使模型适配新场景。但随着数据集和模型的不断更新,数据量增大会导致数据集与模型容易混淆,所以需要对数据集与模型进行管理。
[0003]目前,常见的数据集与模型管理方法主要是建立当前版本的数据集与模型之间的强关联,从而避免当前版本的数据集与模型之间的关系混淆。但是,对于模型训练效果不佳而需要进行版本回溯的情况,现有方法难以快速回溯到正确版本的模型,依旧存在数据集和模型容易混淆的问题,从而对模型优化效率造成不利影响。

技术实现思路

[0004]本申请提供了一种模型资源的处理方法、装置、计算机设备及存储介质,以解决数据集与模型容易混淆的技术问题。
[0005]为了解决上述技术问题,本申请实施例提供了一种模型资源的处理方法,包括:
[0006]获取初始版本模型和多个目标版本数据集;
[0007]基于多个目标版本数据集,对初始版本模型进行多次训练操作,得到每次训练操作对应的新版本模型;
[0008]根据初始版本模型的第一模型名称和目标版本数据集的数据集名称,对新版本模型进行重命名,得到新版本模型的第二模型名称;
[0009]根据第一模型名称、数据集名称和第二模型名称,生成初始版本模型、目标版本数据集和新版本模型之间的目标模型系谱。
[0010]本实施例通过采用目标版本数据集,对初始版本模型进行多次训练操作,得到每次训练操作的新版本模型,以确定模型之间的训练关系;并根据初始版本模型的第一模型名称和目标版本数据集的数据集名称,对新版本模型进行重命名,得到新版本模型的第二模型名称,从而使新版本模型的第二模型名称具备上一版本模型的模型信息和目标版本数据集的数据集信息,进而能够根据第二模型名称得到新版本模型与上一版本模型和目标版本数据集之间的关系;最后根据第一模型名称、数据集名称和第二模型名称,生成初始版本模型、目标版本数据集和新版本模型之间的目标模型系谱,以能够采用系谱直观展示模型之间以及模型与数据集之间的关系,使得数据集与模型关系清楚明了,从而便于在模型训练效果不佳时根据系谱关系查询到对应的在先版本模型,并回溯在先版本模型,实现模型和数据集的有效管理。
[0011]在一实施例中,基于多个目标版本数据集,对初始版本模型进行多次训练操作,得到每次训练操作对应的新版本模型,包括:
[0012]将初始版本模型作为在先版本模型,利用多个第一数据集,对在先版本模型进行训练操作,得到多个在后版本模型,其中每个第一数据集均为多个目标版本数据集中的一个;
[0013]将在后版本模型作为新的在先版本模型,利用多个第二数据集,对新的在先版本模型进行训练操作,得到多个新的在后版本模型,每个第二数据集均为多个目标版本数据集中的一个,新版本模型包括所有在后版本模型。
[0014]本实施例以初始版本模型作为在先版本模型,选取数据集对初始版本模型进行训练,得到在后版本模型,又将在后版本模型作为新的在先版本模型,选取数据集对在先版本模型进行训练,不断迭代,得到多个新版本模型,以便于在模型优化训练时提高模型可选性,从而最大限定的训练出满足条件的模型。
[0015]在一实施例中,根据初始版本模型的第一模型名称和目标版本数据集的数据集名称,对新版本模型进行重命名,得到新版本模型的第二模型名称,包括:
[0016]根据初始版本模型的第一模型名称,确定初始版本模型的第一版本号;
[0017]根据目标版本数据集的数据集名称,确定目标版本数据集的第二版本号;
[0018]对第一版本号和第二版本号进行组合,得到第二模型名称。
[0019]本实施例根据第一模型名称确定第一版本号,根据数据集名称确定第二版本号,以实现新版本模型的第二模型名称中能够具有在先版本模型的模型版本和数据集版本,从而便于仅根据第二模型名称就能够建立与在先版本模型或目标版本数据集之间的关系,使得模型关系更加直观和清楚。
[0020]在一实施例中,根据第一模型名称、数据集名称和第二模型名称,生成初始版本模型、目标版本数据集和新版本模型之间的目标模型系谱,包括:
[0021]根据第一模型名称和第二模型名称,确定初始版本模型与新版本模型之间的第一模型版本关系;
[0022]根据第二模型名称,确定多个新版本模型之间的第二模型版本关系;
[0023]根据数据集名称和第二模型名称,确定目标版本数据集与新版本模型之间的模型数据关系;
[0024]根据第一模型版本关系、第二模型版本关系和模型数据关系,建立目标模型系谱。
[0025]本实施例根据不同模型名称确定模型关系,根据不同模型名称和数据集名称确定模型数据关系,以及根据不同数据集名称确定数据集关系,以根据模型关系、模型数据关系和数据集关系,构建模型系谱,从而便于直观展示三种关系,使得模型训练过程时的模型与数据集清楚明了,避免混淆,便于在模型优化训练时,调整模型版本或数据集版本。
[0026]在一实施例中,获取初始版本模型和多个目标版本数据集之前,还包括:
[0027]将初始版本数据集作为在先版本数据集,对在先版本数据集进行变更操作,得到在后版本数据集,变更操作包括添加操作、删除操作或修改操作;
[0028]将在后版本数据集作为新的在先版本数据,对新的在先版本数据集进行变更操作,得到新的在后版本数据集,目标版本数据集包括初始版本数据集和所有在后版本数据集。
[0029]本实施例通过对在先版本数据集进行变更操作,得到多个目标版本数据集,以扩展初始版本数据集,从而采用多种版本数据集优化模型,提高模型优化效果。
[0030]在一实施例中,将在后版本数据集作为新的在先版本数据,对新的在先版本数据集进行变更操作,得到新的在后版本数据集之后,还包括:
[0031]根据在前版本数据集的第一名称,对在后版本数据集进行重命名,得到在后版本数据集的第二名称;
[0032]根据变更操作、第一名称和第二名称,确定在前版本数据集与在后版本数据集之间的变更序列,变更序列用于表征在前版本数据集与在后版本数据集之间的继承关系或变迁关系。
[0033]本实施例通过变更序列和第二名称,确定数据集之间的关系,从而便于后续对模型进行优化训练时,根据训练结果调整数据集版本,以提高模型优化效果。
[0034]在一实施例中,基于多个目标版本数据集,对初始版本模型进行多次训练操作,得到每次训练操作对应的新版本模型之后,还包括:
[0035]利用预设的测试数据集,对多个新版本模型进行测试操作,得到每个新版本模型的性能指标。
[0036]本实施例通过对新版本模型进行测试操作,以对比各个新版本模型的性能指标,使得模型优化效果更加直观。
[0本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种模型资源的处理方法,其特征在于,包括:获取初始版本模型和多个目标版本数据集;基于多个所述目标版本数据集,对初始版本模型进行多次训练操作,得到每次训练操作对应的新版本模型;根据所述初始版本模型的第一模型名称和目标版本数据集的数据集名称,对所述新版本模型进行重命名,得到所述新版本模型的第二模型名称;根据所述第一模型名称、所述数据集名称和所述第二模型名称,生成所述初始版本模型、所述目标版本数据集和所述新版本模型之间的目标模型系谱。2.如权利要求1所述的模型资源的处理方法,其特征在于,所述基于多个所述目标版本数据集,对初始版本模型进行多次训练操作,得到每次训练操作对应的新版本模型,包括:将所述初始版本模型作为在先版本模型,利用多个第一数据集,对所述在先版本模型进行训练操作,得到多个在后版本模型,其中每个所述第一数据集均为多个所述目标版本数据集中的一个;将所述在后版本模型作为新的在先版本模型,利用多个第二数据集,对新的在先版本模型进行训练操作,得到多个新的在后版本模型,每个所述第二数据集均为多个所述目标版本数据集中的一个,所述新版本模型包括所有在后版本模型。3.如权利要求1所述的模型资源的处理方法,其特征在于,所述根据所述初始版本模型的第一模型名称和目标版本数据集的数据集名称,对所述新版本模型进行重命名,得到所述新版本模型的第二模型名称,包括:根据所述初始版本模型的第一模型名称,确定所述初始版本模型的第一版本号;根据所述目标版本数据集的数据集名称,确定所述目标版本数据集的第二版本号;对所述第一版本号和所述第二版本号进行组合,得到所述第二模型名称。4.如权利要求1所述的模型资源的处理方法,其特征在于,所述根据所述第一模型名称、所述数据集名称和所述第二模型名称,生成所述初始版本模型、所述目标版本数据集和所述新版本模型之间的目标模型系谱,包括:根据所述第一模型名称和所述第二模型名称,确定所述初始版本模型与所述新版本模型之间的第一模型版本关系;根据多个所述第二模型名称,确定多个所述新版本模型之间的第二模型版本关系;根据所述数据集名称和所述第二模型名称,确定所述目标版本数据集与所述新版本模型之间的模型数据关系;根据所述第一模型版本关系、所述第二模型版本关系和所述模型数据关系,建立所述目标模型系谱。5.如权利要求...

【专利技术属性】
技术研发人员:刘圣阳陈文浩杨军峰周炜金吉成
申请(专利权)人:广州海格星航信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1