视觉对象和事件检测以及使用扫视的预测系统技术方案

技术编号:15792427 阅读:121 留言:0更新日期:2017-07-10 00:37
一种操作图像检测装置的方法包含接收图像,将所述图像分割为多个块,群组所述多个块中的几个,通所述图像的所述多个块生成扫视路径的集合,为每个扫视路径生成集群‑方向序列,使用所述集群‑方向序列的组合生成用于识别新图像内对象的策略函数,以及使用所述策略函数操作所述图像检测装置以识别所述新图像中的对象。

【技术实现步骤摘要】
视觉对象和事件检测以及使用扫视的预测系统
本公开涉及机器视觉,以及更具体地涉及配置为用于扫视视觉的计算机视觉系统。
技术介绍
许多机器学习的方法寻求通过图像内所有像素的并行处理来识别图像内的对象。这些方法在计算上可以是昂贵的。
技术实现思路
根据本专利技术示例性实施例,操作图像检测装置的方法包含接收图像、将图像分割为多个块、群组多个块中的几个、通过图像的多个块生成扫视路径的集合、为每个扫视路径生成集群-方向序列、使用集群-方向序列的组合生成用于识别新图像中对象的策略函数以及使用策略函数操作图像检测装置以识别新图像中的对象。根据本专利技术示例性实施例,操作图像检测装置的方法包含接收图像、将图像分割为多个块、为将要探测的多个扫视路径的每个生成集群-方向序列,其中多个扫视路径由策略矩阵给出以及使用集群-方向序列识别图像中的对象。如这里所用,“促进”行为包含执行行为、使得行为更容易、帮助行为执行或者导致行为将被执行。因此,作为示例但不限制,通过发送恰当的数据或者命令来引起或帮助将要被执行的行为,执行在一个处理器上的指令可促进由在远程处理器上执行的指令完成的行为。为了避免疑惑,其中行动者通过除了执行行为之外的行为来促进行为,行为仍由一些实体或者实体的组合执行。专利技术或其元件的一个或多个实施例可以以包含具有用于执行所指示的方法步骤的计算机可用程序代码的计算机可读储存介质的计算机程序产品的形式被实施。此外,专利技术或其元件的一个或多个实施例可以以包含存储器、耦合到存储器以及可操作地执行示例性方法步骤的至少一个处理器的系统(或装置)的形式被实施。然而此外,在另一方面,本专利技术或其元件的一个或多个实施例可以以用于完成一个或多个在此描述的方法步骤的器件的形式被实施;器件可以包含(i)硬件模块、(ii)存储在计算机可读储存媒介(或多个这样的介质)内的且在硬件处理器上实施的软件模块,或者(iii)(i)和(ii)的组合;(i)-(iii)的任意实施设置于此的具体技术。本专利技术的技术可以提供实质有益的技术效果。例如,一个或多个实施例可提供一个或多个以下优点:·依照情境的相关对象的快速识别,·通过一系列如视频中的帧的一个或多个对象的暂时跟随,其中每个帧清楚地与前一个有关,以及·低能耗,仅通过图像的部分处理。本专利技术的这些以及其它特征和优点将从其以下说明性实施例的详细描述中变得显而易见,其将结合附图被理解。附图说明本专利技术的优选实施例将在下方中结合附图更详细地描述:图1是根据本专利技术示例性实施例示出用于训练策略函数方法的流程图;图2根据本专利技术示例性实施例示出训练图像和块映射;图3根据本专利技术示例性实施例示出图像的示例性编码;图4根据本专利技术示例性实施例示出训练图像和集群ID映射;图5根据本专利技术示例性实施例示出训练图像、集群表示和重建;图6根据本专利技术示例性实施例示出示例性路径、方向编码以及扫视路径编码;图7根据本专利技术示例性实施例示出训练图像、示例性扫视路径、集群ID、扫视路径编码以及集群序列编码;图8根据本专利技术示例性实施例示出用于使用策略函数分析图像的方法的流程图;图9根据本专利技术示例性实施例使用学习的策略来引导扫视路径与随机选取的方向性步骤的测试集精度图表;图10是根据本专利技术示例性实施例的序列频率表格;图11是根据本专利技术示例性实施例的序列频率表格;图12是根据本专利技术示例性实施例的在测试集上的计算机视觉系统的精度图表;图13是根据本专利技术实施例的训练方法的流程图图14是根据本专利技术示例性实施例描述体现用于使用策略函数分析图像的方法的示例性计算机系统的方框图。具体实施方式根据本专利技术示例性实施例,发展了用于扫视视觉(saccadicvision)的策略,其配置为用于识别对象。策略的目标是提供发现图像的连续部分从而导致识别感兴趣对象的高可能性遵循的最佳方向的指导。根据本专利技术的实施例,计算机视觉系统通过在图像内部的初始位置处开始以及确定通过图像的路径来识别图像中的对象,其中所述路径用来识别对象的身份。根据本专利技术的一个实施例,图像的情境(context)可以同样被考虑且可以包含之前的观察物以及用于正在被寻找对象的目标。计算机视觉系统配置为具有包含依赖于情境的相关对象的快速识别,通过一系列帧暂时跟随如视频中一个或多个对象,其中每个帧清楚地与前一个有关,以及低能耗,仅通过图像的部分处理的优点的扫视视觉。根据本专利技术示例性实施例,用于训练策略函数100的方法包含将训练集内的每个图片分割为许多更小的子图片,被称为块(patch)101。块可相互重叠(为了清楚没有在这里示出)。如图2中所示,图像201被分割为16个块以及如202所示的对应的块ID。在本专利技术的至少一个实施例中,不同块具有不同尺寸。就相同图像可以被在不同分辨率处理而言块可以为不同尺寸,涉及不同尺寸的块,或者在相同图像内,例如,更大的,中心块可由更小的外围块环绕。在方框102处,生成在训练集中块的大型采样的稀疏表示(sparserepresentation)。稀疏表示可以由稀疏自动编码器生成。所述表示包含隐蔽层内的单元以及具有连续改变的值。例如,图3示出图2的图像编码301,其包含用于2560个表示块的100个单元的稀疏表示。在编码301内,白色斑点指示更高值。在方框103处,块群聚以将块群组为离散集群(cluster)。根据本专利技术一个实施例,可以使用k-means聚类算法执行群聚。在图4和图5示出的示例中,通过使用k-means聚类以及对应的集群ID将稀疏表示群组为32个集群来发现集群。以另一种方式陈述,图4和图5说明了微扫视策略。图4示出对应于训练图像401的确定集群的集群ID402。图5说明训练图像501、集群表示502以及使用集群表示503的块的示例性重建。在方框104处,生成一组可以被应用于全部图像的扫视路径(见601,图6)。这可以是图像内全部可能的路径(例如,可在小图像内实行)或者它们的子集(例如,更好的适用于大图像)。每个路径以诸如[(块ID1)(方向1)(块ID2)(方向2)(块ID3)…(方向n)(块IDn+1)]的格式编码,其中,对于n步的扫视,块IDi是在步骤i的块位置,方向i是从块i到块i+1的方向。方向可以被编码,例如,如602所示其中上方向对应“2”,右方向对应“4”,等等。使用602的示例性方向性编码以编码路径601产生扫视路径编码603,包含块ID6、10、11和12以及方向4、6和6。在方框105处,使用集合内的每个扫视路径扫描训练集内,例如701内,的每个图像。对于每个扫描路径,例如702,在由图像内发现的集群ID代替块ID处创建序列(见703):[(集群ID1)(方向1)(集群ID2)(方向2)(集群ID3)…(方向n)(集群IDn+1)],自此被称作集群-方向序列704。在方框106处,对于每个这样的序列,其可标记有序列ID,系统记录以及计数用于发现它的图像标签。这个过程创建具有每个序列ID以及具有对于每个图像标签出现的序列的频率的表格,自此被称作序列-频率表格(见例如,表格1000,图10)。最显著序列是那些对于图像标签的仅一个或小数量具有高频率的序列。显著和非显著序列的示例如表格1000所示。高亮行1001示出显著序列,数位(digit)5远比其它数字出现得更频繁。根据本本文档来自技高网...
视觉对象和事件检测以及使用扫视的预测系统

【技术保护点】
一种操作图像检测装置的方法包含:接收图像;将所述图像分割为多个块;群组所述多个块中的几个;通过所述图像的所述多个块生成扫视路径的集合;为每个扫视路径生成集群‑方向序列;使用所述集群‑方向序列的组合生成用于识别新图像中对象的策略函数;以及使用所述策略函数操作所述图像检测装置以识别所述新图像中的对象。

【技术特征摘要】
2015.12.31 US 14/985,5961.一种操作图像检测装置的方法包含:接收图像;将所述图像分割为多个块;群组所述多个块中的几个;通过所述图像的所述多个块生成扫视路径的集合;为每个扫视路径生成集群-方向序列;使用所述集群-方向序列的组合生成用于识别新图像中对象的策略函数;以及使用所述策略函数操作所述图像检测装置以识别所述新图像中的对象。2.如权利要求1所述的方法,还包括在执行所述群组之前生成所述多个块的稀疏表示。3.如权利要求1所述的方法,还包括生成所述集群方向序列的组合。4.如权利要求3所述的方法,还包括:实例化序列-频率表格;以及用所述集群-方向序列填充所述序列-频率表格,其中所述序列-频率表格给出出现在所述集群-方向序列中的不同序列的计数。5.如权利要求1所述的方法,还包括将所述策略函数存储到所述图像检测装置内作为通过所述新图像的块引导方向选择的策略矩阵。6.一种操作图像检测装置的方法包括:接收图像;将所述图像分割为多个块;生成用于将被探测的多个扫视路径的每个的集群-方向序列,其中所述多个扫视路径由策略矩阵给出;以及使用所述集群-方向序列识别所述图像中的对象。7.如权利要求6所述的方法,其中生成用于将被探测的多个扫视路径的每个的集群-方向序列还包括:分配所述图像属于由所述策略矩阵定义的每个种类的可能性;以及使用所述集群-方向序列上的所述可能性的平均值识别所述图像中的所述对象。8.如权利要求7所述的方法,还包括...

【专利技术属性】
技术研发人员:B卡瓦斯A库马尔J马雷茨基SU潘坎蒂
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1