一种图像标注模型训练方法、标注方法、装置、设备及介质制造方法及图纸

技术编号:30345909 阅读:26 留言:0更新日期:2021-10-12 23:33
本申请公开一种图像标注模型训练方法、标注方法、装置、设备及介质,通过第一预设分析网络模型分析多个样本图像在全量标签上的分析值,将多个样本图像以及对应的分析值输入预设图像标注模型中的贪心模块,得到每个样本图像的目标标签,通过获取目标标签对应的偏差信息,确定目标标签与样本图像的匹配率;再根据多个样本图像、每个样本图像在目标标签上的分析值和目标标签对应的偏差信息,训练预设图像标注模型,在训练过程中,利用目标标签对应的偏差信息,使样本图像的目标标签趋于准确,使预设图像标注模型的标注准确度趋于完善,可以提高样本图像需要人工标注导致的低效率、人工成本大的问题,还可以提高图像标注模型的泛化能力。能力。能力。

【技术实现步骤摘要】
一种图像标注模型训练方法、标注方法、装置、设备及介质


[0001]本公开涉及图像标注领域,尤其涉及一种图像标注模型训练方法、标注方法、装置、设备及介质。

技术介绍

[0002]在如今自动驾驶、智能医疗、智能安防等人工智能领域,基于有明确标签训练样本的监督学习仍然是一种主要的模型训练方式。在具体的业务场景中需要大量的数据采集和标注,以用于算法模型的训练和迭代优化。目前,大多数企业及研究机构采用人工数据标注方式制作样本数据,标注人员的培训与手工标注存在人工工时长、劳动成本高等缺陷。以Imagenet的1500万数据集为例,该数据集的标注工作历时两年完成,动员了世界各地167个国家48940名标注人员。一些自动标注技术采用的模型,在训练时需要利用大量标注好的样本图像,也即在模型训练前期,需要人工对样本数据进行大量的标注,并且在模型更新时,也需要由人工对模型标注的样本进行校核。由此可见,在算法模型的训练和优化过程中,需要投入的人工成本极为庞大。

技术实现思路

[0003]为了解决上述技术问题,本专利技术提供一种图像标注模型训练方法、标注本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种图像标注模型训练方法,其特征在于,所述方法包括:获取样本图像数据集,所述样本图像数据集包括多个样本图像;将所述多个样本图像输入预设图像标注模型中的第一预设分析网络模型,得到每个样本图像在全量标签上的分析值;将所述多个样本图像以及对应的分析值输入所述预设图像标注模型中的贪心模块,得到每个样本图像的目标标签;获取所述目标标签对应的偏差信息;根据所述多个样本图像、每个样本图像在目标标签上的分析值和所述目标标签对应的偏差信息,训练所述预设图像标注模型,得到目标图像标注模型。2.根据权利要求1所述的方法,其特征在于,所述根据所述多个样本图像、每个样本图像在目标标签上的分析值和所述目标标签对应的偏差信息,训练所述预设图像标注模型,得到目标图像标注模型包括:根据所述多个样本图像、每个样本图像在目标标签上的分析值和所述目标标签对应的偏差信息,确定损失信息;根据所述损失信息训练所述第一预设分析网络模型,得到目标分析网络模型;利用所述损失信息,对所述贪心模块进行更新,得到更新后的贪心模块;将所述目标分析网络模型和所述更新后的贪心模型,作为所述目标图像标注模型。3.根据权利要求1所述的方法,其特征在于,所述将所述多个样本图像以及对应的分析值输入所述预设图像标注模型中的贪心模块,得到每个样本图像的目标标签包括:将每个样本图像以及对应的分析值输入所述预设图像标注模型中的贪心模块;利用所述贪心模块确定目标随机数,并获取预设变量;当所述目标随机数和所述预设变量满足第一预设条件时,利用所述贪心模块确定每个样本图像在全量标签上的分析值中,数值最大的分析值;将所述数值最大的分析值所对应的标签作为对应样本图像的目标标签。4.根据权利要求3所述的方法,其特征在于,所述利用所述贪心模块确定目标随机数,并获取预设变量之后,所述方法还包括:当所述目标随机数和所述预设变量满足第二预设条件时,利用所述贪心模块从所述全量标签中随机抽取一个标签,并将随机抽取的标签作为样本图像的目标标签。5.根据权利要求1所述的方法,其特征在于,所述方法还包括:获取历史样本图像、所述历史样本图像在对应目标标签上的分析值和对应的偏差信息;所述根据所述多个样本图像、每个样本图像在目标标签上的分析值和所述目标标签对应的偏差信息,训练所述预设图像标注模型,得到目标图像标注模型包括:从所述多个样本图像和所述历史样本图像中抽取目标样本图像;根...

【专利技术属性】
技术研发人员:李丰军周剑光谷俊
申请(专利权)人:中汽创智科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1