一种主动选择多示例多标记数字图像的相关反馈方法技术

技术编号:13829680 阅读:57 留言:0更新日期:2016-10-13 16:00
本发明专利技术公开了一种主动选择多示例多标记数字图像的相关反馈方法。多示例多标记学习是近年来提出的一种新的机器学习框架,已在许多实际问题中得到成功应用,基于多示例多标记输入表示的图像自动标注技术能够很好地应用于现实任务。但是随着其表达能力的增强,图像自动标注方法对标记好的训练样本的需求量随着表示空间的变大而急剧增大。本发明专利技术通过结合机器学习中的多示例多标记学习和主动学习技术,在不增加用户标注代价的前提下,每一次相关反馈的过程中获得更加精细丰富的标记信息,从而更大程度的提升系统标注精度,有效地减少了用户的参与代价。

【技术实现步骤摘要】

本专利技术属于数字图像自动标注
,具体涉及一种主动选择多示例多标记数字图像的相关反馈方法
技术介绍
随着数码产品的普及以及各类社交网站的流行,数字图像成为越来越多互联网内容的载体。为了高效利用这些数字图像数据,一个最核心也是最困难的任务是让计算机理解图像的语义,而自动图像标注则是其中的关键技术。目前的自动图像标注技术往往将图像表示成单一的示例,且仅关注图像与单个语义类别的相关性。但是图像往往具有复杂的语义,包含多个对象实体,这样单示例单标记的表示会造成信息损失,无法准确描述图像的语义,从而无法准确预测图像标记。更有效方法是基于多示例多标记机器学习(简称MIML)的框架,用多个特征示例组成的集合来表示一幅图像,并同时预测图像与多个语义标记之间的相关性。目前有少数基于MIML输入表示的图像自动标注技术,但是它们对标记好的训练样本的需求量随着表示空间的变大而急剧增大,而现实任务中的已标记数据往往非常有限,导致这些技术难以被广泛应用。一个解决方案是引入相关反馈技术,让人类用户在自动标注过程中提供一些有用的标记信息从而提高系统标注精度。机器学习中的主动学习方法能够选择出最有价值的样本向用户查询标记,从而能尽可能减少用户的参与代价。现有的基于主动学习的相关反馈机制选择出最有价值的图像并向用户询问该图像与某个语义类别是否相关。这种反馈方式获得的信息非常有限,不能适应于多示例多标记表示下的图像自动标注问题。
技术实现思路
专利技术目的:为了克服现有技术中存在的不足,本专利技术提供一种主动选择多示例多标记数字图像的相关反馈方法,技术方案:为实现上述目的,本专利技术采用的技术方案为:一种主动选择多示例多标记数字图像的相关反馈方法,包括以下步骤:(一)计算数据库中每张图像对标注模型的价值评分,并选择评分最大的图像作为候选图像X*;(二)计算当前标注模型对于步骤(一)中所选图像上的所有未被反馈的标记的掌握程度,并选择最小值对应的标记作为候选标记y*;(三)将步骤(一)(二)中所选的所述候选图像X*和候选标记y*提供给用户,让用户提供相关性反馈;(四)针对该所述候选图像X*及候选标记y*,根据包括是否相关、最相关示例在内的用户反馈结果进行梯度下降更新标注模型;(五)返回步骤(一)或结束并输出标注模型。进一步的,所述步骤(一)图像对标注模型的价值评分的具体方法为:假设总共有K类标记,用Yi=[yi1,...,yiK]T表示第i幅图像Xi的标记向量,如果本图像与第k个标记相关,则yik=1,否则yik=-1;按照公式计算未经用户反馈的图像集合U中每张图像Xi对标注模型的价值评分C1(Xi),所述公式为: C 1 ( X i ) = | p - q | m a x { ξ , K - c a r d ( U ( X i ) )本文档来自技高网...

【技术保护点】
一种主动选择多示例多标记数字图像的相关反馈方法,其特征在于:包括以下步骤:(一)计算数据库中每张图像对标注模型的价值评分,并选择评分最大的图像作为候选图像X*;(二)计算当前标注模型对于步骤(一)中所选图像上的所有未被反馈的标记的掌握程度,并选择最小值对应的标记作为候选标记y*;(三)将步骤(一)(二)中所选的所述候选图像X*和候选标记y*提供给用户,让用户提供相关性反馈;(四)针对该所述候选图像X*及候选标记y*,根据包括是否相关、最相关示例在内的用户反馈结果进行梯度下降更新标注模型;(五)返回步骤(一)或结束并输出标注模型。

【技术特征摘要】
1.一种主动选择多示例多标记数字图像的相关反馈方法,其特征在于:包括以下步骤:(一)计算数据库中每张图像对标注模型的价值评分,并选择评分最大的图像作为候选图像X*;(二)计算当前标注模型对于步骤(一)中所选图像上的所有未被反馈的标记的掌握程度,并选择最小值对应的标记作为候选标记y*;(三)将步骤(一)(二)中所选的所述候选图像X*和候选标记y*提供给用户,让用户提供相关性反馈;(四)针对该所述候选图像X*及候选标记y*,根据包括是否相关、最相关示例在内的用户反馈结果进行梯度下降更新标注模型;(五)返回步骤(一)或结束并输出标注模型。2.根据权利要求1所述的主动选择多示例多标记数字图像的相关反馈方法,其特征在于:所述步骤(一)图像对标注模型的价值评分的具体方法为:假设总共有K类标记,用Yi=[yi1,...,yiK]T表示第i幅图像Xi的标记向量,如果本图像与第k个标记相关,则yik=1,否则yik=-1;按照公...

【专利技术属性】
技术研发人员:黄圣君高能能
申请(专利权)人:南京航空航天大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1