基于主动学习和多标签多示例学习的场景图像标注方法技术

技术编号：12422375 阅读：78 留言：0更新日期：2015-12-02 17:49

本发明专利技术针对场景图像的两个基本特征：（1）场景图像往往包含复杂语义；（2）人工标注大量的图像需要耗费昂贵人力成本，公开了一种基于主动学习和多标签多示例学习的场景图像标注方法，包括：在有标签图像基础上训练初始分类模型；对无标签图像进行标签预测；计算分类模型可信度；选择不确定性最大无标签图像；专家对该图像进行人工标注；更新图像集合；当算法达到要求时停止。本发明专利技术利用主动学习策略，在保证分类模型精确度的同时，大大减少了需要人工标注的场景图像数量，从而降低了标注成本。同时，本发明专利技术把图像转化为多标签多示例数据，使图像复杂语义得到合理表示，提高了图像标注的精确度。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及场景图像标注
，特别是涉及一种基于主动学习和多标签多示例学习的场景图像标注方法。
技术介绍
：随着信息技术的发展和互联网服务的进步，新闻、社交和商品交易等各类网站得到了长足的发展，互联网每天都产生海量的场景图片。这些场景图片具有以下两个基本特点。一方面，单幅场景图像不仅仅反映一个内容，可能涉及多个主题，语义比较复杂。例如，一副关于街道的图像，可能涉及行人、马路、车辆、树木、天空、建筑物等多个不同的主题。另一方面，互联网所产生的大量场景图像，不具有能够充分描述图片内容的分类标签。譬如，用户可能在社交网络上传了一个风景照片，但是照片内容并没有详细的文字描述。对于这些语义复杂，并且不具备分类标签的海量场景图像，如何利用这些图片，为互联网用户提供相关的服务，这是场景图像标注的核心任务。场景图像标注的目的是，通过有标签场景图像的学习，给无标签场景图像赋予精确的分类标签，使它们能够为互联网用户提供服务。传统的图像标注方法在互联网场景图像标注方面存在一些局限性。首先，传统的图像标注方法把一幅图像看作单一的向量。如上所述，一副场景图像可能包含若干个主题，如果把一幅图像转化为单一的向量，可能无法准确描述场景图像的语义，也无法精确对场景图像进行标记。其次，传统的图像标注方法需要大量的有标签场景图像来学习分类模型。为了建立高精确度的分类模型，往往需要专家通过人工标注方式，标注相当数量的场景图像来训练分类模型。人工标注大量的场景图像，需要耗费巨大的人力和物力资源。因此，一种基于少量有标签图像的高效自动场景图像标注技...

【技术保护点】
基于主动学习和多标签多示例学习的场景图像标注方法，其特征在于，包括如下步骤，第一步、获取一批无标签的场景图像；随机抽取少量场景图像，通过专家人工标注方式，赋予这些场景图像分类标签，分类标签的最大数目为k，k≥2，将原来的场景图像集合被重新分为两个集合，一个集合包含少量有标签场景图像，另外一个集合包括剩下的大量无标签场景图像；第二步、把有标签场景图像和无标签场景图像转化为多示例数据，每幅图像看作一个多示例包，每个区域看成多示例包的一个示例；第三步、把少量有标签场景图像看作训练集，根据场景图像的标签数量，训练若干个初始分类模型；第四步、利用已建立的分类模型，对样本集中的无标签场景图像进行标注，每个图像可能具有多个标签；第五步、根据无标签场景图像的标注结果，计算每个分类模型的可信度；第六步、结合分类模型的可信度，从无标签场景图像中挑选一个不确定性最大的图像，并交给专家对该场景图像进行标注；第七步、把经过专家标注的场景图像从无标签图像数据集中移除，放入有标签场景图像数据集，并重新训练分类模型；第八步、判断该模型的精确度是否达到用户所要求的精确度，或者迭代轮数是否达到用户指定的次数，如果没有达到...

【技术特征摘要】

【专利技术属性】
技术研发人员：肖燕珊，刘波，郝志峰，李杰龙，阮奕邦，张丽阳，
申请(专利权)人：广东工业大学，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人