用于检测图像中的实体的设备和方法技术

技术编号:16112836 阅读:168 留言:0更新日期:2017-08-30 06:11
本发明专利技术涉及一种用于在数字图像(I)中检测实体的设备(1)和方法,其中所述设备包括计算装置(11),其被配置为基于根据梯度和分区信息所确定的直方图向量(V)来在图像(I)中检测所述实体中的至少一个的存在;发信装置(15),其与计算装置(11)进行信号通信并且被配置为当计算装置(11)在图像(I)中检测到所述实体中的至少一个的存在时被激活;存储器装置(12),其包含分区信息并且被配置为允许基于所述梯度信息来访问所述分区信息,其中每条划分信息标识允许计算装置(11)对所述梯度信息进行量化的、所述分区元素中的至少一个。

【技术实现步骤摘要】
【国外来华专利技术】用于检测图像中的实体的设备和方法本专利技术涉及一种用于检测图像中的实体的设备和方法。众所周知,安全和安保在现代社会中非常重要。多年来,允许对数字图像(像通常由摄像机获取的数字图像)中可能存在的实体(比如人和/或物体)进行自动检测的系统变得越来越广泛。安全系统的第一个示例由市面上现有的许多汽车中包含的行人检测系统给出;这种系统从摄像机(通常定位在挡风玻璃的上部)获取数字图像,并且对其进行处理以检测可能位于车辆前方的行人并估计与其的距离,以便能够确定是否需要进行辅助操作以保护行人(例如增加制动系统中的压力、紧急制动、避让行人等等)。安保系统的示例由视频监控系统给出,该系统能够自动检测图像中人和/或车辆的存在(甚至车辆的类型)并且采取必要的行动(例如,开始记录视频流,通过叠加在视频流上的图片突出显示实体,警告监控操作者等),因此不需要实际的监控操作者持续观看视频流。这两个应用都通过被配置为来执行基于方向梯度直方图(HOG)和支持向量机(SVM)技术的检测方法的计算机设备来实现。在这种应用中,这些检测方法的最重要的要求之一是产生尽可能少的误报/漏报,因为误报和漏报两者都可能导致不良的后果;事实上,漏报可能导致例如行人被撞倒或者监控操作者没有受到有关入侵企图的警告,而误报可能导致例如不必要的紧急制动(具有追尾的风险),或者向视频监控操作者发送太多假警报(具有降低操作者的注意力水平的风险)。减少由基于HOG/SVM的方法生成的误报/漏报的数量的一种方式是提高由这些方法所处理的图像的分辨率,以便能够生成具有更多类别和/或在各个类别所包含的单元之间具有更大差异的方向梯度直方图,从而确保了更高的实体检测精度(减少误报/漏报的数量)和/或对更大数量的不同实体的识别;在后一种情况下,能够使用基于HOG/SVM的方法来在穿越街道的行人和沿着街道边缘行进的人之间进行区分,或者在正常着装的人和戴着巴拉克拉法帽(可能为了在进行犯罪行为时不被认出)的人之间进行识别。然而,提高的分辨率意味着可用的计算能力相等而计算负荷增加,这限制了基于HOG/SVM的方法在如上所述的实际应用中的使用,这是因为需要满足使这些应用成为实时应用的严格的时间限制。为了满足这些时间限制,因此需要增加被配置来执行实现基于HOG/SVM的图像检测方法的指令的设备在时间单位内能够处理的图像的点(像素)的数量。本专利技术旨在通过提供如所附权利要求书中所阐述的用于实体检测的设备和方法来解决这些和其他问题。本专利技术的基本思想是基于预定的分区元素(组)通过选择一个数据(datum)来对图像的至少一个点的梯度的角度进行量化,所述数据标识至少一个所述分区元素并且被包含在存储器装置中,所述存储器装置被配置为允许基于所述梯度的特性(优选为所述梯度的水平和垂直分量)来访问所述分区元素中的至少一个。本专利技术的另一基本思想在于通过选择所述存储器装置中所包含的第二数据来计算梯度的模在至少一个分区元素上的投影,所述存储器装置被配置为允许基于所述梯度的特性来访问所述第二数据。这些特征允许减少需要由硬件组件执行的浮点运算的数量和/或将该数量减少为零,从而降低了根据本专利技术的方法的时间复杂度,即加快对与图像的点相关的梯度的处理而计算能力相等。这增加了每时间单位能够处理的图像点的数量。由这些技术特征产生的另一效果是减少了实现本专利技术的方法所需的电路组件的数量,使得电路的空间占用(也称为硅占用)降低。此外,所获取的图像的分辨率和可用计算能力相等,上述技术特征允许减少用于在照片中检测特定实体所需的时间,从而使得本专利技术的设备和方法也特别适于数字摄影应用,其中对对象进行自动对焦通常需要检测其任一部分(例如脸部)。通过这种方式,能够减少机器进行对焦所花费的时间,从而也减少了获得合适的对焦照片所需的时间。本专利技术的其他有利特征将在所附权利要求书中进行阐述。从以下通过非限制性示例提供的附图所示的其实施例的描述中,本专利技术的这些特征以及其他优势将变得更加明显,其中:图1是根据本专利技术的电子设备的框图;图2是示出能够由图1的电子设备执行的、基于HOG(方向梯度直方图)和SVM(支持向量机)技术的检测方法的各个阶段的流程图;图3示出一种可能的方式,其中在图2的直方图确定阶段期间能够计算图像的水平和垂直梯度;图4示出依照本专利技术实现图3的直方图向量确定子阶段的逻辑方案。在本说明书中,对“实施例”的任何提及表示关于本专利技术的实施方式所描述的特定的配置、结构或特征被包括在至少一个实施例中。因此,可能存在于本书明书的不同部分中的短语“在实施例中”或其他相似短语,未必都关于同一个实施例。此外,可以以任何被视为适合的方式来将任何特定的配置、结构或特征在一个或更多个实施例中结合起来。因此,仅为了简单的目的而使用以下参考,而不限制各个实施例的保护范围或扩展。参照图1,根据本专利技术的电子设备1包括以下组件:-至少计算装置11(例如,CPU、FPGA、CPLD等等),其被配置为读取或计算表示图像的梯度的数据并且执行用于实施根据本专利技术的、用于检测可能存在于所述图像中的一个或更多个实体的方法的指令;特别地,计算装置11检测图像中具有某些特征的一组点(或区域)的存在,例如,使得该组点(或区域)与预先定义的特定实体(例如,人、车辆等)相似的某种梯度角度分布;-存储器装置12,其包含至少一个数据集,并且被配置为允许根据图像的至少一个点的梯度的至少一个特征的值来访问所述数据中的至少一个,其中所述数据中的每一个允许计算装置11基于预定的分区元素(组)来对所述点的梯度的角度进行量化;此外,所述数据中的每一个还可以允许计算梯度模在分区元素中的至少一个上的投影;-图像获取装置13,其被配置为获取一个或更多个数字格式的图像,所述图像然后由计算装置11进行处理;这种图像获取装置13可以包括例如USB、火线、RS232、IEEE1284、以太网或WiFi适配器等等。-输入/输出(I/O)装置14,其能够例如用于连接到所述设备的人机界面外围设备(也被称为HID外围设备,比如键盘、鼠标等等),所述人机界面外围设备允许操作人员控制设备1的运行(例如设置运行模式、选择特定的视频源等等);这种输入/输出装置14可以包括例如USB、火线、RS232、IEEE1284、以太网或WiFi适配器等等;-发信装置15,其被配置为当所述计算装置11在通过图像获取装置13获取的图像中检测到具有与先前定义的实体的特征相似的特征的一组点的存在时由计算装置11激活;这种发信装置15可以包括被配置为发送数据总线(例如,汽车的CAN总线)上的中断的声音警报装置、可以例如激活汽车的制动电路等等的激活装置;-通信总线16,其允许在计算装置11、存储器装置12、图像获取装置13、输入/输出装置14和发信装置15之间交换信息。作为通信总线16的替代,计算装置11、存储器装置12、图像获取装置13、输入/输出装置14和发信装置15可以通过星形架构连接。此外,设备1可以优选地还包括与至少计算装置11和存储器装置12进行信号通信的视频适配器(附图中未示出),其中所述视频适配器能够在显示装置(例如,LCD或等离子面板等等,未附图中未示出)上显示未处理的图像和/或处理结果,例如通过以叠加在图像上的亮色(例如红色,绿色等等)连续本文档来自技高网...
用于检测图像中的实体的设备和方法

【技术保护点】
一种适于在包括多个点的数字图像(I)中检测实体的设备(1),包括‑计算装置(11),其被配置为:o读取或确定与所述图像(I)的点中的一个相关的至少一条梯度信息,o基于至少所述梯度信息以及对至少所述梯度信息进行量化所参照的分区元素来生成直方图向量(V),以及o基于所述直方图向量(V)来检测所述图像(I)中的所述实体中至少一个的存在,‑发信装置(15),其与所述计算装置(11)进行信号通信,并且被配置为当所述计算装置(11)检测到所述图像(I)中的所述实体中的至少一个的存在时被激活,其特征在于:所述设备还包括存储器装置(12),所述存储器装置(12)包含至少多条分区信息,并且被配置为允许基于所述梯度信息来访问所述多条分区信息中的至少一条,并且其中所述多条分区信息中的每一条标识允许对所述梯度信息进行量化的所述分区元素中的至少一个,以便允许生成所述直方图向量(V)。

【技术特征摘要】
【国外来华专利技术】1.一种适于在包括多个点的数字图像(I)中检测实体的设备(1),包括-计算装置(11),其被配置为:o读取或确定与所述图像(I)的点中的一个相关的至少一条梯度信息,o基于至少所述梯度信息以及对至少所述梯度信息进行量化所参照的分区元素来生成直方图向量(V),以及o基于所述直方图向量(V)来检测所述图像(I)中的所述实体中至少一个的存在,-发信装置(15),其与所述计算装置(11)进行信号通信,并且被配置为当所述计算装置(11)检测到所述图像(I)中的所述实体中的至少一个的存在时被激活,其特征在于:所述设备还包括存储器装置(12),所述存储器装置(12)包含至少多条分区信息,并且被配置为允许基于所述梯度信息来访问所述多条分区信息中的至少一条,并且其中所述多条分区信息中的每一条标识允许对所述梯度信息进行量化的所述分区元素中的至少一个,以便允许生成所述直方图向量(V)。2.根据权利要求1所述的设备(1),其中,所述梯度信息包括与所述图像(I)的所述点相关联的垂直梯度值GV(x,y)和水平梯度值GH(x,y)。3.根据权利要求2所述的设备(1),其中,所述存储器装置(12)还包含包括校正因子的多条模信息,其中,所述存储器装置(12)还被配置为允许基于所述梯度信息来访问所述多条模信息中的至少一条,并且其中,每个校正因子允许通过将所述校正因子乘以所述垂直梯度值(GV(x,y))与水平梯度值(GH(x,y))之和来计算与所述图像(I)的所述点相关联的梯度的模。4.根据权利要求2所述的设备(1),其中,所述存储器装置(12)还包含多条投影信息,并且还被配置为允许基于所述梯度信息来访问所述多条投影信息中的至少一条,并且其中,每条投影信息包括第一校正因子,所述第一校正因子允许通过将所述校正因子乘以所述垂直梯度值(GV(x,y))与水平梯度值(GH(x,y))之和来计算与所述图像(I)的所述点相关联的梯度在基于所述梯度信息从所述存储器装置(12)获得的分区元素上的投影的模。5.根据权利要求4所述的设备(1),其中,所述多条分区信息中的每条信息还包括第二分区元素,并且其中每条投影信息还包括第二校正因子,所述第二校正因子允许通过将所述第二校正因子乘以所述垂直梯度值(GV(x,y))与水平梯度值(GH(x,y))之和来计算与所述图像(I)的所述点相关联的梯度在所述第二分区元素上的投影的模。6.根据权利要求2至5中任一项所述的设备(1),包括标准化装置(41),其被配置为被输入所述垂直梯度值GV(x,y)和水平梯度值GH(x,y)并且输出用于访问所述存储器装置(12)的一对标准化值(GH(x,y)*,GV(x,y)*),并且其中,通过使所述垂直梯度值和水平梯度值(GV(x,y),GH(x,y))两者朝向最高有效位进行相同数量...

【专利技术属性】
技术研发人员:罗伯特·詹姆斯
申请(专利权)人:萨罗尼科斯贸易与服务一人有限公司
类型:发明
国别省市:葡萄牙,PT

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1