The disclosure relates to the current image (100) classify the object (10), representing the object shape of a plurality of (111) the first point associated with the current image, the first unique identifier associated with each of the first key point. According to the disclosure, the method includes at least the first key point, obtained (112) description of the current image contains at least the first descriptor for at least the first key point of the selected region; the at least first key point according to the first identifier to select second, when the first identifier and identifier corresponding to the second key points when used in the classifier of the object using the second descriptors; according to the at least first and second according to the descriptor and the descriptor weighted information associated to determine (113) table of confidence information indicating the shape of.
【技术实现步骤摘要】
对图像的对象进行分类的方法和设备及计算机程序产品
本公开涉及计算机视觉,并且更具体地涉及也被称为对象识别的找到并标识图像或视频序列中的给定语义类别(亦即,对象)的计算机视觉问题。更具体地,本公开涉及正确地确定图像中的对象的形状。本公开的原理在诸如面部动画、人机交互、视频会议的视线校正、面部润饰、辩论(forensics)或者检测动物并且估计其确切的身体姿势这样的实现对象识别的任何领域中找到具体的应用。
技术介绍
计算能力增加的主要益处之一是计算机视觉应用的数量的稳定增加。以前不可能在任何合理的时间量内解决的计算机视觉问题已经变得越来越可行。有利地对图像或视频序列中的对象进行检测和分类是计算机视觉的主要挑战之一。检测包括对问题“对象/类别x在图像中?”给出一比特回答(one-bitanswer)。若干机器学习方法已经被应用于该问题,其展示了对象检测准确度和速度的显著提高。另外,在大多数情况下,仅建立对象的存在/不存在是不够的,希望还知道其在图像中的确切位置,或者甚至独立地检测和定位组成对象的部分。如P.Dollar等人所公开的那样(“CascadedPoseRegression”,IEEEComputerVisionandPatternrecognition,2010年,页1078-1085),在其最简单的形式中,定位由标识包含所搜索的对象的图像的最小矩形区域组成,但是更一般地,希望恢复对象的“形状”。形状指的是所铰接的对象(和组成它们的部分)的几何配置,例如人类身体上的肢体的配置或者车辆的布局。更宽泛地,形状是对象的外观中的系统的且可参数化的改变的任何集合 ...
【技术保护点】
一种对当前图像(100)的对象进行分类的方法(10),表示所述对象的形状的多个(111)第一关键点与当前图像(10)相关联,第一唯一标识符与每个第一关键点相关联,所述方法包含:针对在多个(111)第一关键点之中选择的至少第一关键点,获得(112)描述当前图像的包含所选择的至少第一关键点的区域的至少第一描述符;所述至少第一关键点根据其第一标识符来选择;当其第一标识符对应于第二关键点的第二标识符时,选择所述至少第一关键点,在用于对所述对象进行分类的分类器中使用其第二描述符;根据所述至少第一描述符并且根据与所述第二描述符相关联的加权信息来确定(113)表示所述形状的置信度的信息。
【技术特征摘要】
2015.08.28 EP 15306329.21.一种对当前图像(100)的对象进行分类的方法(10),表示所述对象的形状的多个(111)第一关键点与当前图像(10)相关联,第一唯一标识符与每个第一关键点相关联,所述方法包含:针对在多个(111)第一关键点之中选择的至少第一关键点,获得(112)描述当前图像的包含所选择的至少第一关键点的区域的至少第一描述符;所述至少第一关键点根据其第一标识符来选择;当其第一标识符对应于第二关键点的第二标识符时,选择所述至少第一关键点,在用于对所述对象进行分类的分类器中使用其第二描述符;根据所述至少第一描述符并且根据与所述第二描述符相关联的加权信息来确定(113)表示所述形状的置信度的信息。2.根据权利要求1所述的对当前图像的对象进行分类的方法,其中,所述确定表示置信度的信息包含:比较(1131)所述至少第一描述符和与所述至少第二描述符相关联的阈值。3.根据权利要求1或2所述的对当前图像的对象进行分类的方法,其中,对表示置信度的所述信息进行归一化(1132)以提供置信度的概率值。4.根据权利要求1或2所述的对当前图像的对象进行分类的方法,其中,所述分类器是实现多个迭代的迭代(1040)分类器,其中,从第二迭代开始,每次迭代使用先前迭代的结果。5.根据权利要求1或2所述的对当前图像的对象进行分类的方法,其中,所述第一和第二描述符是相同类型的,所述类型属于包含以下的分组:有向梯度的直方图;表示轮廓的信息;亮度值;强度值;纹理值。6.根据权利要求1或2所述的对当前图像的对象进行分类的方法,其中,所述方法包含对所述分类器的先前训练(1020)。7.根据权利要求1或2所述的对当前图像的对象进行分类的方法,其中,所述方法包含所述当前图像的所述对象的先前关键点注释(1102)。8.一种对当前图像的对象进行分类的设备,表示所述对象的形...
【专利技术属性】
技术研发人员:X布尔戈斯,N卡巴伊,F勒克莱尔,
申请(专利权)人:汤姆逊许可公司,
类型:发明
国别省市:法国,FR
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。