基于属性关系进行图像排序的方法和系统技术方案

技术编号:8161561 阅读:187 留言:0更新日期:2013-01-07 19:34
通过为在训练数据集中注释的不同属性训练图像属性检测器,根据与多属性查询的属性的相关性而检索和排序图像。学习来自图像的训练数据集的所注释的属性对之间的成对关系。接着可以通过经训练的属性检测器在图像数据集中搜索包括多属性查询中的属性的图像,其中从该搜索检索图像,所述图像各自包括一个或多个查询属性并且还响应于来自经训练的属性检测器的对应于不是查询的一部分但依据所学习的多个成对关系而与查询属性相关的属性的信息。依据在查询子集的属性中的属性的相应总数而对所检索到的图像进行排序。

【技术实现步骤摘要】

本专利技术涉及使用计算机视觉应用,用以依据视觉外观(appearance )特征在人类图像数据中自动搜索人。
技术介绍
可以搜索摄像机、照相机和其它图像数据馈送(feed),以找到目标物体和个人。例如,为了搜索人,可以向视频档案的管理者提供指示某些个人面部视觉特点的描述信息(例如,戴眼镜、棒球帽等),其中可以手动地扫描档案,以寻找具有类似特征的一个或多个人。这种手动搜索既费时间资源又费人力资源。此外,人的视觉注意力可能是无效的,尤其对于大量图像数据。由于许多因素(示例性地包括很少出现感兴趣的活动、与任务关联的基本枯燥性、以及具有视觉混乱和其它分心事物的环境中对象追踪的较差可靠性),输入信息的人工分析可能既昂贵又无效。已知如下自动输入系统和方法计算机或其它可编程设备直接分析视频数据并尝试通过计算机视觉应用来识别关心的物体、人、事件或活动。一些现有方法针对多个图像属性中的每个学习独立的外观模型,例如,针对秃头、髭(mustache)、络腮胡子(beard)、帽子、太阳镜、浅肤色等。当给定多属性查询时,这样的系统可以将每个单独查询属性的置信度得分(confidencescore)相加。因此,针对(i)男性(ii)戴眼镜和(iii)络腿胡子的搜 索可以检索多个结果,每个结果具有满足所有三个属性的置信度得分,或者每个结果满足一个或多个属性。然而,前一技术可能错过结果,例如,在给定图像中一个属性不清楚,从而导致了该图像被排除。后一技术可能返回太多结果,包括不可能或不太可能满足所有三个属性的结果,诸如,作为年轻女孩的戴着太阳镜的人的图像。因此,所返回的结果可能错过目标,或者返回太多要被高效地分析的命中(hit)。
技术实现思路
在本专利技术的一个实施例中,一种用于根据与多属性查询的属性的相关性(relevance)而检索和排序(rank)多属性查询结果的方法包括为每个在人的图像的训练数据集中注释的不同属性训练图像属性检测器;以及学习(通过处理器等)来自图像的训练数据集的每对注释属性之间的成对关系(pair-wise correlation)。通过经训练的属性检测器在图像数据集中搜索包括多属性查询中的属性的图像,其中从该搜索检索图像,所述图像各自包括一个或多个查询属性并且还响应于来自经训练的属性检测器的对应于不是查询的一部分但依据所学习的多个成对关系而与查询属性相关的属性的信息。依据所检索到的图像的属性也在多个属性的查询子集中的相应总数,对所检索到的图像进行排序。在另一实施例中,一种系统具有处理单元、计算机可读存储器、和具有程序指令的计算机可读存储介质设备,所述程序指令用以为每个在人的图像的训练数据集中注释的不同属性训练图像属性检测器,以及学习来自图像的训练数据集的每对注释属性之间的成对关系。因此,可以通过经训练的属性检测器在图像数据集中搜索包括多属性查询中的属性的图像,其中从该搜索检索图像,所述图像各自包括一个或多个查询属性并且还响应于来自经训练的属性检测器的对应于不是查询的一部分但依据所学习的多个成对关系而与查询属性相关的属性的信息。依据所检索到的图像的属性也在多个属性的查询子集中的相应总数,对所检索到的图像进行排序。在另一实施例中,一种制品具有计算机可读存储介质设备,所述计算机可读存储介质设备中包含计算机可读程序代码,所述计算机可读程序代码包括指令,当计算机处理器执行所述指令时,所述指令使得计算机处理器为每个在人的图像的训练数据集中注释的不同属性训练图像属性检测器,以及学习来自图像的训练数据集的每对注释属性之间的成对关系。因此,可以通过经训练的属性检测器在图像数据集中搜索包括多属性查询中的属性的图像,其中从该搜索检索图像,所述图像各自包括一个或多个查询属性并且还响应于来自经训练的属性检测器的对应于不是查询的一部分但依据所学习的多个成对关系而与查询属性相关的属性的信息。依据所检索到的图像的属性也在多个属性的查询子集中的相应总数,对所检索到的图像进行排序。在另一实施例中,一种用于 根据与多属性查询的属性的相关性而检索多属性查询结果并提供对所述多属性查询结果进行排序的服务的方法包括提供一个或多个物品,所述物品包括图像属性检测器训练器和属性映射器设备,其为每个在人的图像的训练数据集中注释的不同属性训练图像属性检测器,以及学习来自图像的训练数据集的每对注释属性之间的成对关系。还提供多属性检索和排序模型,其通过经训练的属性检测器在图像数据集中搜索包括多属性查询中的属性的图像;从该搜索检索图像,所述图像各自包括一个或多个查询属性并且还响应于来自经训练的属性检测器的对应于不是查询的一部分但依据所学习的多个成对关系而与查询属性相关的属性的信息;以及依据所检索到的图像的属性也在多个属性的查询子集中的相应总数,对所检索到的图像进行排序。附图说明从下面结合附图对本专利技术的各个方面的详细描述中,将更容易理解本专利技术的这些和其它特征,其中图I是根据本专利技术的用于根据与多属性查询的相关性而对多属性查询结果进行排序的方法或系统的实施例的流程图。图2A至图2E是根据本专利技术的实施例的用于提取特征矢量的图像场构造的概略图。图3是根据本专利技术的实施例的、依据多属性查询的示例图像检索和排序的概略图。图4是本专利技术的实施例的计算机实施方式的框图。图5是本专利技术的装置或设备实施例的框图。这些图不一定成比例。这些图仅是示意表示,而不意在刻画本专利技术的具体参数。这些图仅意在描述本专利技术的典型实施例,因此不应被认为是对本专利技术的范围的限制。在这些图中,同样的附图标记表示同样的要素。具体实施方式本领域的技术人员知道,本专利技术的多个方面可以体现为系统、方法或计算机程序产品。因此,本专利技术的多个方面可以采取以下形式完全的硬件实施例、完全的软件实施例(包括固件、驻留软件、微代码等)、或者组合本文一般统称为“电路”、“模块”或“系统”的软件和硬件方面的实施例。此外,本专利技术的方面可以采取体现在一个或多个计算机可读介质中的计算机程序产品的形式,该计算机可读介质中包含计算机可读程序代码。可以使用一个或多个计算机可读介质的任何组合。计算机可读介质可以是计算机可读信号介质或者计算机可读存储介质。计算机可读存储介质例如可以是一但不限于——电的、磁的、光的、电磁的、红外线的、或半导体的系统、装置或器件、或任何以上的合适组合。计算机可读存储介质的更具体的示例(非穷举的列表)将包括以下有一个或多个导线的电连接、便携式计算机磁盘、硬盘、随机存取存储器(RAM)、只读存储器(ROM)、可擦除可编程只读存储器(EPR0M或闪存)、光纤、便携式光盘只读存储器(CD-ROM)、光存储器件、磁存储器件、或者上述的任何合适的组合。在本文件的语境中,计算机可读存储介质可以是任何可包含或存储程序的有形的介质,该程序被指令执行系统、装置或者器件使用或者与其结合使用。 计算机可读信号介质可包括例如在基带中或者作为载波的一部分传播的、其中体现计算机可读程序代码的数据信号。这种传播的信号可以采取多种形式,包括——但不限于——电磁的、光的或其任何合适组合。计算机可读信号介质可以是并非为计算机可读存储介质、但是可以传送、传播或者传输用于由指令执行系统、装置或者器件使用或者与其结合使用的程序的任何计算机可读介质。计算机可读介质上包含的程序本文档来自技高网
...

【技术保护点】
一种用于根据与多属性查询的属性的相关性而检索和排序多属性查询结果的方法,所述方法包括:为在人的图像的训练数据集中注释的多个不同属性中的每个,训练多个图像属性检测器中的每个;通过处理器学习来自图像的所述训练数据集的多个注释的属性中的每对之间的多个成对关系;通过经训练的属性检测器在输入图像数据集中搜索包括多个所注释的属性的多属性查询子集中的至少一个属性的图像;从对所述输入图像数据集的搜索检索多个图像,所述多个图像各自包括所述查询子集的多个属性中的至少一个属性并且响应于来自所述经训练的属性检测器的对应于不是所述查询的一部分但依据所学习的多个成对关系而与所述查询的属性相关的属性的信息;以及依据所检索到的多个图像的属性也在所述查询子集的多个属性中的相应总数,对所检索到的多个图像进行排序。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:A达塔RS费里斯SU潘坎蒂B赛迪奎伊
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1