图像标注方法和图像标注装置制造方法及图纸

技术编号:9276408 阅读:89 留言:0更新日期:2013-10-24 23:29
本发明专利技术公开了一种图像标注方法和图像标注装置。根据本发明专利技术的图像标注方法,包括:对于给定图像集合中的每一个图像,在所述图像集合中选择在图像特征上与所述图像相近的多个其它图像;通过用所述多个其它图像的图像特征拟合所述图像的图像特征,获得所述图像的多个拟合系数;以及根据所述图像的所述多个拟合系数,利用所述多个其它图像的标签来构造所述图像的标签。

【技术实现步骤摘要】
图像标注方法和图像标注装置
本专利技术一般地涉及图像管理与图像检索。具体而言,本专利技术涉及一种能够对图像的标签进行优化的方法和装置。
技术介绍
近年来,随着多媒体技术和互联网的迅速发展,数字图像的数量和复杂度迅速增长。因此,存在如何对大量图像进行快速而有效的管理的问题,主要涉及图像的访问、存取、组织、检索等。图像通常关联有一些文本描述信息,例如,标题、主题词、评论信息等,用以表明图像的内容、拍摄地点、个人感受和评价等信息。因此,可以基于这些信息为图像添加标签,或直接将主题词作为标签,来辅助图像的管理和检索。例如,可以直接使用主题词(标签)进行图像检索:当用户希望查找某些图像时,用户输入关键词,图像检索装置比对用户输入的关键词和既有的主题词(标签),如果主题词中包含这个关键词,那么,认为该图像是目标图像,并将其反馈给用户,从而轻易地实现了基于关键词的图像检索功能。基于关键词的图像检索不需要对图像的内容进行分析和比对,因此,比传统的基于内容的图像检索更加简单、快捷。此外,还可以有效地利用文本检索中的一些已有技术。然而,上述文本描述信息往往存在一些问题。举例来说,(1)准确性低,即主题词不能准确地描述图像的内容。例如,一张北京四合院的照片的文本描述信息为“北京的建筑”,虽然四合院也是一种建筑,但是,用“建筑”不能准确地描述照片中的内容。对于希望找到四合院而非其它建筑的用户来说,难以利用关键词“四合院”找到这幅图像。(2)不完备,即主题词不能涵盖照片中的主要内容。例如照片的内容是青海湖中的天鹅,“天鹅”这个标签只是描述了图片中的部分内容,对于图片中的湖、湖边的树木、天空等内容,都没有对应的标签。(3)有歧义,即用户给定的主题词(标签)通用性不强。例如一张宠物狗的照片的主题词(标签)可能是这只宠物狗的名字,这个主题词(标签)对其他人来说就不具有通用性。上述以及其他问题,限制了直接利用主题词等文本描述信息对图像进行有效地管理,因此,需要对图像的标签进行必要的修正和补充。此外,对于没有标签的图像,需要为其添加适当的标签。
技术实现思路
在下文中给出了关于本专利技术的简要概述,以便提供关于本专利技术的某些方面的基本理解。应当理解,这个概述并不是关于本专利技术的穷举性概述。它并不是意图确定本专利技术的关键或重要部分,也不是意图限定本专利技术的范围。其目的仅仅是以简化的形式给出某些概念,以此作为稍后论述的更详细描述的前序。本专利技术的目的是针对现有技术的上述问题,提出了一种能够对图像的标签进行优化的方法和装置。该方案能够快速、准确地对图像现有的标签进行优化和为没有标签的图像添加适当的标签。为了实现上述目的,根据本专利技术的一个方面,提供了一种图像标注方法,包括:对于给定图像集合中的每一个图像,在所述图像集合中选择在图像特征上与所述图像相近的多个其它图像;通过用所述多个其它图像的图像特征拟合所述图像的图像特征,获得所述图像的多个拟合系数;以及根据所述图像的所述多个拟合系数,利用所述多个其它图像的标签来构造所述图像的标签。根据本专利技术的一个具体实施例,获得所述图像的多个拟合系数进一步包括:通过使得用在图像特征上与给定图像相近的多个其它图像来拟合给定图像的误差最小,获得所述图像的所述多个拟合系数。根据本专利技术的一个具体实施例,构造所述图像的标签以满足预定的约束条件。根据本专利技术的一个具体实施例,所述约束条件包括整个图像集合的标签构造总误差最小。根据本专利技术的一个具体实施例,所述约束条件与标签之间的相关性有关。根据本专利技术的一个具体实施例,所述约束条件与所述图像的原有标签有关。根据本专利技术的一个具体实施例,构造所述图像的标签进一步包括:随机或顺序选择所述图像集合中的一个图像;利用对应于所选图像的多个其它图像的标签,以对应的拟合系数来拟合所选图像的标签;以及重复上述步骤,直至为所述图像集合中的每一个图像构造了标签。根据本专利技术的另一个方面,提供了一种图像标注装置,包括:近邻图像获取模块,用于对于给定图像集合中的每一个图像,在所述图像集合中选择在图像特征上与所述图像相近的多个其它图像;拟合系数获取模块,用于通过用所述多个其它图像的图像特征拟合所述图像的图像特征,获得所述图像的多个拟合系数;以及图像标签构造模块,用于根据所述图像的所述多个拟合系数,利用所述多个其它图像的标签来构造所述图像的标签。根据本专利技术的一个具体实施例,所述图像标签构造模块构造所述图像的标签以满足预定的约束条件。根据本专利技术的一个具体实施例,所述约束条件包括整个图像集合的标签构造总误差最小。根据本专利技术的一个具体实施例,所述约束条件与标签之间的相关性有关。根据本专利技术的一个具体实施例,所述约束条件与所述图像的原有标签有关。另外,根据本专利技术的另一方面,还提供了一种存储介质。所述存储介质包括机器可读的程序代码,当在信息处理设备上执行所述程序代码时,所述程序代码使得所述信息处理设备执行根据本专利技术的上述方法。此外,根据本专利技术的再一方面,还提供了一种程序产品。所述程序产品包括机器可执行的指令,当在信息处理设备上执行所述指令时,所述指令使得所述信息处理设备执行根据本专利技术的上述方法。附图说明参照下面结合附图对本专利技术实施例的说明,会更加容易地理解本专利技术的以上和其它目的、特点和优点。附图中的部件只是为了示出本专利技术的原理。在附图中,相同的或类似的技术特征或部件将采用相同或类似的附图标记来表示。附图中:图1示出了根据本专利技术实施例的图像标注方法的流程图;图2示出了根据本专利技术实施例的图像标注装置的结构方框图;以及图3示出了可用于实施根据本专利技术实施例的方法和装置的计算机的示意性框图。具体实施方式在下文中将结合附图对本专利技术的示范性实施例进行详细描述。为了清楚和简明起见,在说明书中并未描述实际实施方式的所有特征。然而,应该了解,在开发任何这种实际实施例的过程中必须做出很多特定于实施方式的决定,以便实现开发人员的具体目标,例如,符合与系统及业务相关的那些限制条件,并且这些限制条件可能会随着实施方式的不同而有所改变。此外,还应该了解,虽然开发工作有可能是非常复杂和费时的,但对得益于本公开内容的本领域技术人员来说,这种开发工作仅仅是例行的任务。在此,还需要说明的一点是,为了避免因不必要的细节而模糊了本专利技术,在附图中仅仅示出了与根据本专利技术的方案密切相关的装置结构和/或处理步骤,而省略了与本专利技术关系不大的其他细节。另外,还需要指出的是,在本专利技术的一个附图或一种实施方式中描述的元素和特征可以与一个或更多个其它附图或实施方式中示出的元素和特征相结合。本专利技术基于如下的思想:如果孤立地看待一个图像及其标签,标签可能是不准确的。然而,如果从统计的观点来处理所有的图像-标签数据,那么,有很大一部分的标签是正确的。因此,可以借助于其他图像的标签来优化或构造待处理图像的标签。此外,正确的标签总是同图像内容具有对应性,错误的标签则呈现出散乱的特性。因此,可以从大量的图像-标签数据中提取出“具有相同对应性”的图像-标签对,以实现对标签的优化。下面将参照图1描述根据本专利技术的实施例的图像标注方法的流程。图1示出了根据本专利技术实施例的图像标注方法的流程图。如图1所示,根据本专利技术的图像标注方法,包括如下步骤:对于给定图像集合中的每一个图像,在所述图像集合中选择在图像特征上与所述图本文档来自技高网
...
图像标注方法和图像标注装置

【技术保护点】
一种图像标注方法,包括:对于给定图像集合中的每一个图像,在所述图像集合中选择在图像特征上与所述图像相近的多个其它图像;通过用所述多个其它图像的图像特征拟合所述图像的图像特征,获得所述图像的多个拟合系数;以及根据所述图像的所述多个拟合系数,利用所述多个其它图像的标签来构造所述图像的标签。

【技术特征摘要】
1.一种图像标注方法,包括:对于给定图像集合中的每一个图像,在所述图像集合中选择在图像特征上与所述图像相近的多个其它图像;通过用所述多个其它图像的图像特征拟合所述图像的图像特征,获得所述图像的多个拟合系数;以及根据所述图像的所述多个拟合系数,利用所述多个其它图像的标签来构造所述图像的标签;其中,获得所述图像的多个拟合系数进一步包括:通过使得用在图像特征上与给定图像相近的多个其它图像来拟合给定图像的误差最小,获得所述图像的所述多个拟合系数。2.如权利要求1所述的图像标注方法,其中,构造所述图像的标签以满足预定的约束条件。3.如权利要求2所述的图像标注方法,其中,所述约束条件包括整个图像集合的标签构造总误差最小。4.如权利要求2所述的图像标注方法,其中,所述约束条件与标签之间的相关性有关。5.如权利要求2所述的图像标注方法,其中,所述约束条件与所述图像的原有标签有关。6.如权利要求1所述的图像标注方法,其中构造所述图像的标签进一步包括:随机或顺序选择所述图像集合中的一个图像;利用对应于...

【专利技术属性】
技术研发人员:刘汝杰中村秋吾上原祐介
申请(专利权)人:富士通株式会社
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1