【技术实现步骤摘要】
模型训练的方法、装置、设备和可读介质
[0001]本公开的示例实施例总体涉及计算机
,并且更具体地,涉及模型训练的方法
、
装置
、
设备和计算机可读存储介质
。
技术介绍
[0002]随着机器学习技术的发展,已经可以利用机器学习模型来执行多种应用环境中的任务
。
指代文本定位是一种根据一句具有指向性的文本定位出图像中符合文本描述的对象的技术
。
针对跨模态智能分析任务,尤其是指代表达式分割
(RES)
任务,可以利用机器学习模型来实现指代文本定位
。
机器学习模型可以基于输入的指代文本,从图像中识别出指代文本所指示的对象,并输出与任务相匹配的可以指示该对象的分割掩码
。
技术实现思路
[0003]在本公开的第一方面,提供一种模型训练的方法
。
该方法包括:针对指代表达式分割任务,利用第一样本集对目标模型执行第一阶段训练,第一样本集包括第一样本图像以及对应的第一标签,第一标签指示第一样本图像中的对象的分割掩码;利用第一阶段训练后的目标模型对第二样本集中的各个第二样本图像执行指代表达式分割任务,得到各个第二样本图像中对象的预测分割掩码,每个第二样本图像具有对应的第二标签,第二标签指示第二样本图像中的对象的边界框;基于各个第二样本图像的第二标签来修改各个第二样本图像的预测分割掩码,以得到更新后的第二样本集,更新后的第二样本集包括第二样本图像以及对应的第三标签,第三标签指示第 ...
【技术保护点】
【技术特征摘要】
1.
一种模型训练方法,包括:针对指代表达式分割任务,利用第一样本集对目标模型执行第一阶段训练,所述第一样本集包括第一样本图像以及对应的第一标签,所述第一标签指示第一样本图像中的对象的分割掩码;利用所述第一阶段训练后的所述目标模型对第二样本集中的各个第二样本图像执行所述指代表达式分割任务,得到各个第二样本图像中对象的预测分割掩码,每个第二样本图像具有对应的第二标签,所述第二标签指示第二样本图像中的对象的边界框;基于各个第二样本图像的所述第二标签来修改各个第二样本图像的所述预测分割掩码,以得到更新后的第二样本集,所述更新后的第二样本集包括第二样本图像以及对应的第三标签,所述第三标签指示第二样本图像中的对象的分割掩码;以及至少利用所述更新后的第二样本集对所述目标模型执行第二阶段训练,所述第二阶段训练后的所述目标模型被应用于对目标图像执行所述指代表达式分割任务
。2.
根据权利要求1所述的方法,还包括:在所述第一阶段训练之前,针对参考表达式理解任务,至少利用所述第二样本集中的各个第二样本图像和对应的所述第二标签来对初始模型进行预训练,以得到所述目标模型用于所述第一阶段训练
。3.
根据权利要求1所述的方法,其中基于各个第二样本图像的所述第二标签来修改各个第二样本图像的所述预测分割掩码包括:基于各个第二样本图像的所述第二标签所指示的对象的所述边界框与所述预测分割掩码之间的匹配结果,来修改各个第二样本图像的所述预测分割掩码
。4.
根据权利要求3所述的方法,其中对于每个第二样本图像,所述匹配结果通过以下来确定:确定所述第二标签所指示的对象的所述边界框与所述预测分割掩码之间的相似度;如果所述相似度未达到预设阈值,确定所述第二样本图像的所述第二标签所指示的对象的所述边界框与所述预测分割掩码之间不匹配;以及如果所述相似度达到所述预设阈值,确定所述第二样本图像的所述第二标签所指示的对象的所述边界框与所述预测分割掩码之间匹配
。5.
根据权利要求4所述的方法,其中对于每个第二样本图像,确定所述第二标签所指示的对象的所述边界框与所述预测分割掩码之间的相似度包括:确定所述预测分割掩码在对应的第二样本图像的坐标系中的第一坐标轴上的第一投影距离和第二坐标轴上的第二投影距离;基于所述第一投影距离和所述第二投影距离来确定所述预测分割掩码对应的预测边界框;以及基于所述第二标签所指示的对象的所述边界框与所述预测边界框之间的重合度来确定所述相似度
。6.
根据权利要求3所述的方法,还包括:对于每个第二样本图像,如果所述匹配结果指示所述第二样本图像的所述第二标签所指示的对象的所述边界框与所述预测分割掩码之间不匹配,从所述第二样本集中删除该第二样本图像;以及如果所述匹配结果指示所述第二样本图像的所述第二标签所指示的对象的所述边界框与所述预测分割掩码之间匹配,基于该第二样本图像的所述边界框来修改该第二样本图
像的所述预测分割掩码
。7.
根据权利要求6所述的方法,其中每个第二样本图像的所述预测分割掩码包括对象轮廓的多个采样点,并且基于所边界框来修改第二...
【专利技术属性】
技术研发人员:刘武,梅涛,瞿梦雪,
申请(专利权)人:京东科技信息技术有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。