【技术实现步骤摘要】
【国外来华专利技术】用于提供图像分类器的系统和方法
本申请总体上涉及计算机视觉处理,并且更具体地涉及高效图像分类。
技术介绍
计算机视觉领域通常要求被训练用于检测诸如面部和人之类的对象的分类器,考虑到实现与人和真实世界对象交互的应用。存在各种分类器,因为计算机视觉研究人员一直在寻求更加资源高效的方法来准确定位和识别图像中的各种对象。图1中所描述的一种识别特定类的对象的已知方法使用定向梯度直方图(HoG)与训练图像和学习系统结合。HoG已被用于针对各种背景来检测人类,以及面部、动物、车辆和其他对象。由于HoG使用相对紧凑的参考描述符,因此其已成功用于实时分类流视频中的对象。它也被证明能够在存在旋转、缩放和照明条件方面变化的情况下实现鲁棒检测。图1示出了本领域已知用于使用HoG与支持向量机(SVM)算法结合——在本领域合适地称为HoG/SVM——对图像中的对象进行分类的过程100。所描述的过程使用由Dalal和Triggs在其2005年所著的以下文章中识别的参数:“Histogramsoforientedgradientsforhumandetection,InternationalConferenceonComputerVisionandPatternRecognition,第2卷,第886-893页,2005年6月,其通过引用整体并入本文。首先,针对特定单元内的每个像素计算梯度值(图1中的步骤102)。如示出该过程的图2所示,将所定义的矩形HoG检测窗口202应用于图像的一部分,这将像素划分为离散单元204。例如,HoG单元204可以包括在每一侧上8个像素,总计每个单元204 ...
【技术保护点】
1.一种用于图像分类的计算机实现的方法,包括:根据一组训练图像生成表示图像窗口的相关部分的非矩形轮廓;根据所述轮廓生成识别少于矩形检测窗口内所有单元的非矩形位图,所述矩形检测窗口具有预确定的单元宽度和预确定的单元高度;接收用于分类的图像,所述图像包括一单元宽度和一单元高度;将所述矩形检测窗口应用于所述图像中的具有所述矩形检测窗口的所述单元宽度和所述单元高度的部分,其中,应用所述检测窗口包括识别所述图像部分内的与所述非矩形位图的已识别单元匹配的单元;针对所述图像部分内的所述已识别单元中的每个已识别单元,生成所述单元内的像素的取向的直方图;建立重叠的单元区块,每个单元区块具有来自所述图像部分的多个连续的已识别单元;针对每个单元区块生成描述符,所述描述符包括所述单元区块中的所述已识别单元中的每个已识别单元的直方图,其中,所述描述符内的每个直方图被归一化到所述描述符内的所有直方图;以及针对所述一组训练图像评估所生成的描述符,以便确定是否将所述图像部分识别为包括与所述一组训练图像相关联的对象类别。
【技术特征摘要】
【国外来华专利技术】2015.12.17 US 14/973,2721.一种用于图像分类的计算机实现的方法,包括:根据一组训练图像生成表示图像窗口的相关部分的非矩形轮廓;根据所述轮廓生成识别少于矩形检测窗口内所有单元的非矩形位图,所述矩形检测窗口具有预确定的单元宽度和预确定的单元高度;接收用于分类的图像,所述图像包括一单元宽度和一单元高度;将所述矩形检测窗口应用于所述图像中的具有所述矩形检测窗口的所述单元宽度和所述单元高度的部分,其中,应用所述检测窗口包括识别所述图像部分内的与所述非矩形位图的已识别单元匹配的单元;针对所述图像部分内的所述已识别单元中的每个已识别单元,生成所述单元内的像素的取向的直方图;建立重叠的单元区块,每个单元区块具有来自所述图像部分的多个连续的已识别单元;针对每个单元区块生成描述符,所述描述符包括所述单元区块中的所述已识别单元中的每个已识别单元的直方图,其中,所述描述符内的每个直方图被归一化到所述描述符内的所有直方图;以及针对所述一组训练图像评估所生成的描述符,以便确定是否将所述图像部分识别为包括与所述一组训练图像相关联的对象类别。2.根据权利要求1所述的方法,还包括:将所述图像重新缩放到不同的单元宽度和不同的单元高度;以及将所述矩形检测窗口应用于所重新缩放的图像中的具有所述矩形检测窗口的所述单元宽度和所述单元高度的部分。3.根据权利要求1所述的方法,其中,生成所述非矩形轮廓包括一个或者:对所述一组训练图像取平均,应用计算机视觉算法,或者应用深度学习,以确定所述图像窗口的相关部分。4.根据权利要求1所述的方法,其中,生成所述非矩形轮廓包括:针对来自所述一组训练图像的每个训练图像确定每个位置中所有像素的强度值;使针对来自所述一组训练图像的每个位置的所述所有像素的强度值相加以生成结果值;以及使针对来自所述一组训练图像的每个位置的所述结果值除以来自所述一组训练图像的训练图像的数量。5.根据权利要求1所述的方法,其中,针对所述图像部分内的所述已识别单元中的每个已识别单元生成所述单元内的像素的取向的直方图包括:计算梯度,每个梯度具有幅值和对应取向;将每个对应取向与多个区间中的一个区间进行关联;以及将每个幅值添加到所述多个区间中的与所述对应取向相关联的所述一个区间。6.根据权利要求1所述的方法,其中,每个单元区块包括来自所述图像部分的二乘二的所述连续的已识别单元。7.根据权利要求1所述的方法,其中,针对每个单元区块生成描述符包括级联所述单元区块中的所述已识别单元中的每个已识别单元的直方图。8.根据权利要求1所述的方法,还包括确定所述对象类别是以下中的一个:人;面部;非矩形几何形状;或者非几何形状。9.一种用于图像分类的计算设备,包括:存储器,其被配置为存储一组训练图像、表示来自所述一组训练图像的图像窗口的相关部分的非矩形轮廓以及识别少于矩形检测窗口内所有单元的非矩形位图,所述矩形检测窗口具有预确定的单元宽度和预确定的单元高度;硬件加速器,其耦合到所述存储器,所述硬件加速器被配置为:接收用于分类的图像作为输入,所述图像包括一单元宽度和一单元高度,通过识别图像部分内的与所述非矩形位图的已识别单元匹配的单元,将所存储的矩形检测窗口应用于所述图像中的具有所述矩形检测窗口的所述单元宽度和所述单元高度的部分,针对所述图像部分内的所述已识别单元中的每个已识别单元,生成并且存储所述单元内的像素的取向的直方图,以及建立重叠的单元区块,每个单元区块具有来自所述图像部分的多个连续的已识别单元;以及处理器,其耦合到所述硬件加速器和所述存储器,所述处理器被配置为:针对每个单元区块生成描述符,所述描述符包括所述单元区块中的所述已识别单元中的每个已识别单元的直方图,其中,所述描述符内的每个直方图被归一化到所述描述符内的所有直方图,以及针对所存储的一组训练图像评估所生成的描述符,以便确定是否将所述图像部分识别为包括与所述一组训练图像相关联的对象类别。10.根据权利要求9所述的计算设备,其中,所述硬件加速器还被配置为:将所述图像重新缩放...
【专利技术属性】
技术研发人员:D·莫洛尼,A·德加尼,
申请(专利权)人:线性代数技术有限公司,
类型:发明
国别省市:爱尔兰,IE
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。