本发明专利技术公开一种降低长尾图像标注代价的图像分类模型复用方法和系统,主要用于图像的类别呈长尾分布时减少构建机器学习模型的标注代价。本发明专利技术主要的技术方案为:通过获取与目标任务相关的一组模型,复用上述模型并利用目标任务上的未标注图像,使得在长尾图像标注较少的情况下实现性能提升,其中未标注图像的使用环节结合了1)有标注图像对目标任务模型的性能评估;2)相关模型对复用模式的指导更新,具有易实现、高效的特点,在长尾图像标注不足时,取得了比既有半监督学习和模型复用技术更优秀的性能。更优秀的性能。更优秀的性能。
【技术实现步骤摘要】
降低长尾图像标注代价的图像分类模型复用方法和系统
[0001]本专利技术涉及一种降低长尾图像标注代价的图像分类模型复用方法和系统,属于机器学习
和图像分类
技术介绍
[0002]图像分类任务中,为了得到好的分类效果,机器学习方法通常需要收集大量的图像并要求图像具有明确的概念标注。在自然世界中,图像概念往往呈现长尾分布,即少数图像概念类别频繁出现,而大量图像概念类别偶尔出现(“长尾图像”)。对于此类图像的分类任务,长尾图像的标注过程更依赖专家经验知识,难以及时有效响应开展,需耗费大量人力物力资源,显著提高了图像分类模型构建的成本。
[0003]“模型复用”通过复用相关的图像分类模型降低目标任务训练过程所需要的标注图像代价,近年来引起广泛的关注。然而,当目标任务长尾图像标注稀缺时,对图像分类模型复用的可靠性评估困难,严重影响了图像分类模型复用在长尾图像中的应用。因此亟需要发展能够使用大量无标注图像的分类模型复用方法,使得在长尾图像标注稀缺的情况下,能够提升图像分类模型复用的效果和最终图像分类模型构建的性能。
[0004]图像标注稀缺时,“半监督学习”通过使用大量未标注图像来提升图像分类模型的性能,在诸多方面得到了应用。然而,既有半监督学习方法对未标注图像的使用往往依赖于较强的分布假设,一般认为未标注图像中概念类别的频率相当。当面临拥有长尾图像的分类任务时,未标注图像概念类别比例可能严重失衡,基于既有半监督学习算法难以有效利用好未标注图像,性能不佳。
[0005]综合而言,为有效降低长尾图像分类任务的标注代价,亟需要发展能够使用大量无标注图像的新型半监督图像分类模型复用方法,提升图像分类模型复用和半监督学习的效果,最终提升图像分类模型的分类性能,有效减少标注代价。目前这方面的技术方案国内国际上还较少。
技术实现思路
[0006]专利技术目的:针对现有技术中存在的长尾图像分类性能不佳的问题与不足,本专利技术提供一种降低长尾图像标注代价的图像分类模型复用方法和系统。融合半监督学习和图像分类模型复用的优势,减少长尾图像的标注代价,提升图像分类模型的性能。具体而言,首先,通过复用相关模型赋予未标注图像以初始伪标注,在此基础上,借助相关模型进行半监督学习使用未标注图像,根据在标注图像上的性能效果将误差通过高阶梯度反向传播到相关模型,优化模型复用策略,提高模型复用的效果和最终提升模型的分类性能。
[0007]技术方案:一种降低长尾图像标注代价的图像分类模型复用方法,具体包括:
[0008]1)通过复用策略使用候选模型组赋予未标注图像伪标注;
[0009]2)结合图像伪标注,利用标注图像进行半监督学习图像分类模型,提升模型图像分类性能;
[0010]3)使用标注图像对模型进行性能评估,利用二阶梯度将性能提升方向反向传播到模型组,优化模型复用策略,提高效果;
[0011]4)重复上述3个环节直到图像伪标注不再变化,达到收敛,得到图像分类模型,可以用于图像的分类操作。
[0012]所述未标注图像的伪标注获得的步骤为:
[0013]取得未标注图像共u个样本,x
i
表示第i个未标注图像样本。取得候选模型组其中共有K个模型,f
k
为第k个候选模型,候选模型组为目标任务相关的一组模型。初始化复用策略函数g,策略函数g的输入为未标图像样本x,输出为一个K维权重向量对于未标图像样本x,复用策略的输出为其中g(x)
k
代表对于图像样本x,个体候选模型f
k
的集成权重。通过当前的复用策略g,对未标注图像做预测可以得到未标注图像的伪标注的集合
[0014]所述2)中,将通过候选模型组得到的伪标注图像集合与标注图像集合共l个标注图像样本进行半监督学习,获得目标任务上的图像分类模型h。
[0015]所述3)中,优化模型复用的步骤为:
[0016]使用半监督学习得到的图像分类模型h在标注图像上进行性能评估,基于对比分类模型的输出h(x
i
)与图像的真实标注y
i
计算模型性能评估函数通过性能评估函数的二阶梯度反馈更新复用策略函数g。
[0017]一种降低长尾图像标注代价的图像分类模型复用系统,包括:
[0018]伪标注模块:通过复用策略使用候选模型组赋予未标注图像伪标注;
[0019]图像分类模型学习模块:结合图像伪标注,利用标注图像进行半监督学习图像分类模型;
[0020]优化模型复用模块:使用标注图像对模型进行性能评估,利用二阶梯度将性能提升方向反向传播到模型组,优化模型复用策略;
[0021]循环模块:依次重复执行伪标注模块、图像分类模型学习模块和优化模型复用模块,直到图像伪标注不再变化,达到收敛,得到图像分类模型。
[0022]所述系统的实现过程和方法相同,不再赘述。
[0023]一种计算机设备,该计算机设备包括存储器、处理器及存储在存储器上并可在处理器上运行的计算机程序,处理器执行上述计算机程序时实现如上所述的降低长尾图像标注代价的图像分类模型复用方法。
[0024]一种计算机可读存储介质,该计算机可读存储介质存储有执行如上所述的降低长尾图像标注代价的图像分类模型复用方法的计算机程序。
附图说明
[0025]图1是本专利技术方法流程图;
[0026]图2是通过复用策略获取伪标注的流程图
[0027]图3是通过伪标注利用未标注图像的半监督学习流程图。
具体实施方式
[0028]下面结合具体实施例,进一步阐明本专利技术,应理解这些实施例仅用于说明本专利技术而不用于限制本专利技术的范围,在阅读了本专利技术之后,本领域技术人员对本专利技术的各种等价形式的修改均落于本申请所附权利要求所限定的范围。
[0029]如图1所示,降低长尾图像标注代价的图像分类模型复用方法的流程图。步骤1为开始动作。
[0030]步骤2通过候选模型组和复用策略函数g,计算得到未标注图像D
u
的伪标注的集合
[0031]取得未标注图像共u个样本,x
i
表示第i个未标注图像样本。取得候选模型组其中共有K个模型,f
k
为第k个候选模型。初始化复用策略函数g,策略函数g的输入为未标图像样本x,输出为一个K维权重向量对于未标图像样本x,复用策略的输出为其中g(x)
k
代表对于图像样本x,个体候选模型f
k
的集成权重。通过当前的复用策略g,对未标注图像做预测可以得到未标注图像的伪标注的集合
[0032]步骤3中使用伪标注图像集合和标注图像集合D
l
进行半监督学习得到当前任务图像分类模型h,
[0033]步骤4利用标注图像集合D
l
评估当前任务的图像分类模型h,通过错误反馈更新复用策略函数g。具体而言,使用标注图像集合D
l
中的l个图像样本,本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种降低长尾图像标注代价的图像分类模型复用方法,其特征在于,具体包括:1)通过复用策略使用候选模型组赋予未标注图像伪标注;2)结合图像伪标注,利用标注图像进行半监督学习图像分类模型;3)使用标注图像对模型进行性能评估,利用二阶梯度将性能提升方向反向传播到模型组,优化模型复用策略;4)重复上述1)
‑
3)直到图像伪标注不再变化,达到收敛。2.根据权利要求1所述的降低长尾图像标注代价的图像分类模型复用方法,其特征在于,所述未标注图像的伪标注获得的步骤为:取得未标注图像共u个样本,x
i
表示第i个未标注图像样本;取得候选模型组其中共有K个模型,f
k
为第k个候选模型,候选模型组为目标任务相关的一组模型。初始化复用策略函数g,策略函数g的输入为未标图像样本x,输出为一个K维权重向量对于未标图像样本x,复用策略的输出为其中g(x)
k
代表对于图像样本x,个体候选模型f
k
的集成权重;通过当前的复用策略g,对未标注图像做预测可以得到未标注图像的伪标注的集合3.根据权利要求1所述的降低长尾图像标注代价的图像分类模型复用方法,其特征在于,所述2)中,将通过候选模型组得到的伪标注图像集合与标注图像集合与标注图像集合共l个标注图像...
【专利技术属性】
技术研发人员:李宇峰,邵杰晶,侍蒋鑫,程战战,
申请(专利权)人:上海高德威智能交通系统有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。