【技术实现步骤摘要】
降低长尾图像标注代价的图像分类模型复用方法和系统
[0001]本专利技术涉及一种降低长尾图像标注代价的图像分类模型复用方法和系统,属于机器学习
和图像分类
技术介绍
[0002]图像分类任务中,为了得到好的分类效果,机器学习方法通常需要收集大量的图像并要求图像具有明确的概念标注。在自然世界中,图像概念往往呈现长尾分布,即少数图像概念类别频繁出现,而大量图像概念类别偶尔出现(“长尾图像”)。对于此类图像的分类任务,长尾图像的标注过程更依赖专家经验知识,难以及时有效响应开展,需耗费大量人力物力资源,显著提高了图像分类模型构建的成本。
[0003]“模型复用”通过复用相关的图像分类模型降低目标任务训练过程所需要的标注图像代价,近年来引起广泛的关注。然而,当目标任务长尾图像标注稀缺时,对图像分类模型复用的可靠性评估困难,严重影响了图像分类模型复用在长尾图像中的应用。因此亟需要发展能够使用大量无标注图像的分类模型复用方法,使得在长尾图像标注稀缺的情况下,能够提升图像分类模型复用的效果和最终图像分类模型构建的性能 ...
【技术保护点】
【技术特征摘要】
1.一种降低长尾图像标注代价的图像分类模型复用方法,其特征在于,具体包括:1)通过复用策略使用候选模型组赋予未标注图像伪标注;2)结合图像伪标注,利用标注图像进行半监督学习图像分类模型;3)使用标注图像对模型进行性能评估,利用二阶梯度将性能提升方向反向传播到模型组,优化模型复用策略;4)重复上述1)
‑
3)直到图像伪标注不再变化,达到收敛。2.根据权利要求1所述的降低长尾图像标注代价的图像分类模型复用方法,其特征在于,所述未标注图像的伪标注获得的步骤为:取得未标注图像共u个样本,x
i
表示第i个未标注图像样本;取得候选模型组其中共有K个模型,f
k
为第k个候选模型,候选模型组为目标任务相关的一组模型。初始化复用策略函数g,策略函数g的输入为未标图像样本x,输出为一个K维权重向量对于未标图像样本x,复用策略的输出为其中g(x)
k
代表对于图像样本x,个体候选模型f
k
的集成权重;通过当前的复用策略g,对未标注图像做预测可以得到未标注图像的伪标注的集合3.根据权利要求1所述的降低长尾图像标注代价的图像分类模型复用方法,其特征在于,所述2)中,将通过候选模型组得到的伪标注图像集合与标注图像集合与标注图像集合共l个标注图像...
【专利技术属性】
技术研发人员:李宇峰,邵杰晶,侍蒋鑫,程战战,
申请(专利权)人:上海高德威智能交通系统有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。