模型训练、图像处理方法、装置、设备及存储介质制造方法及图纸

技术编号：38478536 阅读：10 留言：0更新日期：2023-08-15 16:57

本公开涉及一种模型训练、图像处理方法、装置、设备及存储介质。本公开通过包含有多模态信息如图像信息和文本信息的第一数据集进行模型训练，得到第一轮迭代训练后的模型。以第一轮迭代训练后的模型为基准进行多轮迭代训练，得到预训练模型，并且在每一轮迭代训练之前，对上一轮迭代训练采用的目标数据集进行更新。根据更新后的目标数据集，对上一轮迭代训练后的模型进行本轮迭代训练后，可使得本轮迭代训练后的模型相比于上一轮迭代训练后的模型更加精准。将该预训练模型作为下游任务例如废钢等级判定任务的起始模型，并根据下游任务中的样本数据对该预训练模型进行微调后，使得微调后的预训练模型精准的判定废钢等级，从而有效节约了废钢资源。而有效节约了废钢资源。而有效节约了废钢资源。

全部详细技术资料下载

【技术实现步骤摘要】
模型训练、图像处理方法、装置、设备及存储介质

[0001]本公开涉及信息
，尤其涉及一种模型训练、图像处理方法、装置、设备及存储介质。

技术介绍

[0002]目前，图像处理技术已经被广泛应用在各个领域。例如，通过对整车废钢进行图像采集，然后采用图像处理技术，判定整车废钢的等级。
[0003]但是，目前通过图像处理技术对整车废钢的等级判定不够精准，导致废钢资源得不到有效的利用。

技术实现思路

[0004]为了解决上述技术问题或者至少部分地解决上述技术问题，本公开提供了一种模型训练、图像处理方法、装置、设备及存储介质，以精准的判定废钢等级，节约废钢资源。
[0005]第一方面，本公开实施例提供一种模型训练方法，包括：
[0006]获取上一轮迭代训练后的模型、以及所述上一轮迭代训练采用的目标数据集，所述目标数据集至少包括第一数据集，所述第一数据集包括多个第一样本，所述第一样本包括第一图像和所述第一图像中目标对象的文本信息，所述第一数据集用于模型训练得到第一轮迭代训练后的模型，所述上一轮迭代训练后的模型是所述第一轮迭代训练后的模型，或者是以所述第一轮迭代训练后的模型为基准经过至少一轮迭代训练后的模型；
[0007]通过所述上一轮迭代训练后的模型，对所述目标数据集进行更新；
[0008]根据更新后的目标数据集，对所述上一轮迭代训练后的模型进行迭代训练，得到本轮迭代训练后的模型，通过多轮迭代训练后得到预训练模型。
[0009]第二方面，本公开实施例提供一种模型...

【技术保护点】

【技术特征摘要】
1.一种模型训练方法，其中，所述方法包括：获取上一轮迭代训练后的模型、以及所述上一轮迭代训练采用的目标数据集，所述目标数据集至少包括第一数据集，所述第一数据集包括多个第一样本，所述第一样本包括第一图像和所述第一图像中目标对象的文本信息，所述第一数据集用于模型训练得到第一轮迭代训练后的模型，所述上一轮迭代训练后的模型是所述第一轮迭代训练后的模型，或者是以所述第一轮迭代训练后的模型为基准经过至少一轮迭代训练后的模型；通过所述上一轮迭代训练后的模型，对所述目标数据集进行更新；根据更新后的目标数据集，对所述上一轮迭代训练后的模型进行迭代训练，得到本轮迭代训练后的模型，通过多轮迭代训练后得到预训练模型。2.根据权利要求1所述的方法，其中，通过所述上一轮迭代训练后的模型，对所述目标数据集进行更新，包括：通过所述上一轮迭代训练后的模型，从未标注的第二数据集中选取目标子集，所述目标子集中的每个第二图像的评价指标满足预设条件；通过所述上一轮迭代训练后的模型，对所述目标子集中的每个第二图像进行标注，得到标注后的目标子集；根据所述标注后的目标子集，对所述目标数据集进行更新，所述目标数据集和所述标注后的目标子集构成更新后的目标数据集。3.根据权利要求2所述的方法，其中，通过所述上一轮迭代训练后的模型，从未标注的第二数据集中选取目标子集，包括：针对所述未标注的第二数据集中的每个第二图像，通过所述上一轮迭代训练后的模型，对所述第二图像进行第一粒度的打分和第二粒度的打分，得到所述第二图像的第一粒度分值和第二粒度分值，所述第一粒度大于所述第二粒度；根据每个第二图像分别对应的第一粒度分值和第二粒度分值，确定每个第二图像分别对应的评价指标；将所述第二数据集中评价指标满足预设条件的第二图像构成所述目标子集。4.根据权利要求2所述的方法，其中，通过所述上一轮迭代训练后的模型，对所述目标子集中的每个第二图像进行标注，包括：针对所述目标子集中的每个第二图像，通过所述上一轮迭代训练后的模型，检测所述第二图像中的至少一个目标区域、以及每个目标区域中目标对象的类别；根据所述第二图像中每个目标区域中包括的目标对象的类别，对所述第二图像进行标注。5.一种模型训练方法，其中，所述方法包括：获取样本数据集中的第一图像和第二图像；根据待训练的机器学习模型，对所述第一图像和所述第二图像分别进行检测，得到所述第一图像的第一检测结果和所述第二图像的第二检测结果，所述待训练的机器学习模型的初始参数是预训练模型的参数，所述预训练模型是根据如权利要求1
‑
4中任一项所述的方法得到的；对所述第一图像中的多个第一候选区域和所述第二图像中的多个第二候选区域进行融合处理，得到多个第三候选区域；
根据所述多个第三候选区域，得到第三检测结果，所述第一检测结果、所述第二检测结果和所述第三检测结果分别包括至少一个目标区域、以及每个目标区域中目标对象的类别；根据所述第一检测结果、所述第二检测结果和所述第三检测结果，对所述待训练的机器学习模型进行训练，得到训练后的机器学习模型。6.根据权利要求5所述的方法，其中，根据所述第一检测结果、所述第二检测结果和所述第三检测结果，对所述待训练的机器学习模型进行训练，得到训练后的机器学习模型，包括：根据所述第一图像的标注结果和所述第一检测结果的差值、以及所述第二检测结果和所述第三检测结果的差值，构建损失函数；根据所述损失函数对所述待训练的机器学习模型进行训练，得到训练后的机器学习模型。7.根据权利要求5所述的方法，其中，根据所述第一检测结果、所述第二检测结果和所述第三检测结果，对所述待训练的机器学习模型进行...

【专利技术属性】
技术研发人员：杨昭，徐海华，魏溪含，陈伟璇，
申请(专利权)人：阿里巴巴达摩院杭州科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人