用于图像中的对象检测的基于上下文的先验制造技术

技术编号:17573352 阅读:27 留言:0更新日期:2018-03-28 20:49
基于上下文的先验在机器学习网络(例如,神经网络)中被利用来在图像中检测对象。对象的可能位置是基于上下文标记来估计的。机器学习网络标识整个图像的上下文标记。基于此,网络选择用于在该图像中检测感兴趣的对象的一组可能区域。

【技术实现步骤摘要】
【国外来华专利技术】用于图像中的对象检测的基于上下文的先验相关申请的交叉引用本申请要求于2015年7月9日提交且题为“REAL-TIMEOBJECTDETECTIONINIMAGESVIAONEGLOBAL-LOCALNETWORK(经由一个全局-局部网络进行的图像中的实时对象检测)”的美国临时专利申请No.62/190,685的权益,其公开内容通过援引全部明确纳入于此。背景领域本公开的某些方面一般涉及机器学习,并尤其涉及利用机器学习网络中的基于上下文的先验来在图像中检测对象。
技术介绍
可包括一群互连的人工神经元(例如,神经元模型)的人工神经网络是一种计算设备或者表示将由计算设备执行的方法。卷积神经网络是一种前馈人工神经网络。卷积神经网络可包括神经元集合,其中每一个神经元具有感受野并且共同地拼出一输入空间。卷积神经网络(CNN)具有众多应用。具体而言,CNN已被广泛使用于模式识别和分类领域。深度学习架构(诸如深度置信网络和深度卷积网络)是分层神经网络架构,其中第一层神经元的输出变成第二层神经元的输入,第二层神经元的输出变成第三层神经元的输入,依此类推。深度神经网络可被训练以识别特征阶层并且因此它们已被越来越多地用于对象识别应用。类似于卷积神经网络,这些深度学习架构中的计算可分布在处理节点群体上,其可被配置在一个或多个计算链中。这些多层架构可每次训练一层并可使用反向传播来细调。其他模型也可用于对象识别。例如,支持向量机(SVM)是可被应用于分类的学习工具。支持向量机包括对数据进行归类的分离超平面(例如,决策边界)。该超平面由监督式学习来定义。期望的超平面增加训练数据的裕量。换言之,超平面应该具有到训练示例的最大的最小距离。尽管这些解决方案在数个分类基准上达到了优异的结果,但它们的计算复杂度可能极其高。另外,模型的训练可能是有挑战性的。概述在一个方面,公开了一种对象检测的方法。该方法包括标识整个图像的上下文标记。该方法还包括基于所标识的上下文标记选择用于在该图像中检测感兴趣的对象的一组可能区域。另一方面公开了一种用于对象检测的装置,其具有存储器以及耦合至该存储器的至少一个处理器。(诸)处理器被配置成标识整个图像的上下文标记。(诸)处理器还被配置成基于所标识的上下文标记选择用于在该图像中检测感兴趣的对象的一组可能区域。另一方面公开了一种用于对象检测的非瞬态计算机可读介质。该非瞬态计算机可读介质上记录有非瞬态程序代码,该非瞬态程序代码在由(诸)处理器执行时,使得(诸)处理器执行标识整个图像的上下文标记的操作。该程序代码还使得(诸)处理器基于所标识的上下文标记选择用于在该图像中检测感兴趣的对象的一组可能区域。另一方面公开了一种用于对象检测的装备,并且包括用于标识整个图像的上下文标记的装置。该方法还包括用于基于所标识的上下文标记选择用于在图像中检测感兴趣的对象的一组可能区域的装置。本公开的附加特征和优点将在下文描述。本领域技术人员应当领会,本公开可容易地被用作修改或设计用于实施与本公开相同的目的的其他结构的基础。本领域技术人员还应认识到,这样的等效构造并不脱离所附权利要求中所阐述的本公开的教导。被认为是本公开的特性的新颖特征在其组织和操作方法两方面连同进一步的目的和优点在结合附图来考虑以下描述时将被更好地理解。然而,要清楚理解的是,提供每一幅附图均仅用于解说和描述目的,且无意作为对本公开的限定的定义。附图简述在结合附图理解下面阐述的详细描述时,本公开的特征、本质和优点将变得更加明显,在附图中,相同附图标记始终作相应标识。图1解说了根据本公开的某些方面的使用片上系统(SOC)(包括通用处理器)来设计神经网络的示例实现。图2解说了根据本公开的各方面的系统的示例实现。图3A是解说根据本公开的各方面的神经网络的示图。图3B是解说根据本公开的各方面的示例性深度卷积网络(DCN)的框图。图4是解说根据本公开的各方面的可将人工智能(AI)功能模块化的示例性软件架构的框图。图5是解说根据本公开的各方面的智能手机上的AI应用的运行时操作的框图。图6解说了用于在图像中标识对象的示例边界框。图7解说了用于多边界框搜索方法的N个先验。图8解说了根据本公开诸方面的利用上下文来在图像中检测对象的总体方法的示例。图9解说了根据本公开诸方面的用于在图像中检测对象的示例网络架构。详细描述以下结合附图阐述的详细描述旨在作为各种配置的描述,而无意表示可实践本文中所描述的概念的仅有的配置。本详细描述包括具体细节以便提供对各种概念的透彻理解。然而,对于本领域技术人员将显而易见的是,没有这些具体细节也可实践这些概念。在一些实例中,以框图形式示出众所周知的结构和组件以避免湮没此类概念。基于本教导,本领域技术人员应领会,本公开的范围旨在覆盖本公开的任何方面,不论其是与本公开的任何其他方面相独立地还是组合地实现的。例如,可以使用所阐述的任何数目的方面来实现装置或实践方法。另外,本公开的范围旨在覆盖使用作为所阐述的本公开的各个方面的补充或者与之不同的其他结构、功能性、或者结构及功能性来实践的此类装置或方法。应当理解,所披露的本公开的任何方面可由权利要求的一个或多个元素来实施。措辞“示例性”在本文中用于表示“用作示例、实例、或解说”。本文中描述为“示例性”的任何方面不必被解释为优于或胜过其他方面。尽管本文描述了特定方面,但这些方面的众多变体和置换落在本公开的范围之内。虽然提到了优选方面的一些益处和优点,但本公开的范围并非旨在被限定于特定益处、用途或目标。相反,本公开的各方面旨在能宽泛地应用于不同的技术、系统配置、网络和协议,其中一些作为示例在附图以及以下对优选方面的描述中解说。详细描述和附图仅仅解说本公开而非限定本公开,本公开的范围由所附权利要求及其等效技术方案来定义。本公开的诸方面涉及用于在图像中检测(定位)对象的深度神经网络架构。具体而言,本公开的诸方面利用基于上下文的先验来进行对象检测。本公开的进一步的方面包括训练内部反馈机制。图1解说了根据本公开的某些方面使用片上系统(SOC)100的前述深度神经网络架构的示例实现100,该SOC100可包括通用处理器(CPU)或多核通用处理器(CPU)102。变量(例如,神经信号和突触权重)、与计算设备相关联的系统参数(例如,带有权重的神经网络)、延迟、频率槽信息、以及任务信息可被存储在与神经处理单元(NPU)108相关联的存储器块、与CPU102相关联的存储器块、与图形处理单元(GPU)104相关联的存储器块、与数字信号处理器(DSP)106相关联的存储器块、专用存储器块118中,或可跨多个块分布。在通用处理器102处执行的指令可从与CPU102相关联的程序存储器加载或可从专用存储器块118加载。SOC100还可包括为具体功能定制的附加处理块(诸如GPU104、DSP106、连通性块110(其可包括第四代长期演进(4GLTE)连通性、无执照Wi-Fi连通性、USB连通性、蓝牙连通性等))以及例如可检测和识别姿势的多媒体处理器112。在一种实现中,NPU实现在CPU、DSP、和/或GPU中。SOC100还可包括传感器处理器114、图像信号处理器(ISP)116、和/或导航120(其可包括全球定位系统)。SOC可基于ARM指令集。本文档来自技高网...
用于图像中的对象检测的基于上下文的先验

【技术保护点】
一种对象检测方法,包括:标识整个图像的上下文标记;以及至少部分基于所标识的上下文标记选择用于在所述图像中检测感兴趣的对象的一组可能区域。

【技术特征摘要】
【国外来华专利技术】2015.07.09 US 62/190,685;2015.10.13 US 14/882,3731.一种对象检测方法,包括:标识整个图像的上下文标记;以及至少部分基于所标识的上下文标记选择用于在所述图像中检测感兴趣的对象的一组可能区域。2.如权利要求1所述的方法,其特征在于,进一步包括训练神经网络以细化所述一组可能区域。3.如权利要求1所述的方法,其特征在于,进一步包括至少部分基于用户输入创建所述上下文标记。4.如权利要求1所述的方法,其特征在于,进一步包括至少部分基于无监督式学习创建所述上下文标记。5.如权利要求1所述的方法,其特征在于,进一步包括至少部分基于所述上下文标记生成所述一组可能区域。6.如权利要求1所述的方法,其特征在于,进一步包括:标识另一上下文标记;以及至少部分基于所标识的另一上下文标记选择在所述图像中检测感兴趣的对象的另一组可能区域。7.如权利要求1所述的方法,其特征在于,进一步包括训练神经网络以对于每个所述可能区域确定感兴趣的对象是否存在。8.如权利要求1所述的方法,其特征在于,进一步包括训练神经网络以根据所述上下文标记分类每个所述可能区域。9.一种用于对象检测的装置,包括:存储器;以及耦合至所述存储器的至少一个处理器,所述至少一个处理器被配置成:标识整个图像的上下文标记;以及至少部分基于所标识的上下文标记选择用于在所述图像中检测感兴趣的对象的一组可能区域。10.如权利要求9所述的装置,其特征在于,所述至少一个处理器被进一步配置成训练神经网络以细化所述一组可能区域。11.如权利要求9所述的装置,其特征在于,所述至少一个处理器被进一步配置成至少部分基于用户输入来创建所述上下文标记。12.如权利要求9所述的装置,其特征在于,所述至少一个处理器被进一步配置成至少部分基于无监督式学习来创建所述上下文标记。13.如权利要求9所述的装置,其特征在于,所述至少一个处理器被进一步配置成至少部分基于所述上下文标记来生成所述一组可能区域。14.如权利要求9所述的装置,其特征在于,所述至少一个处理器被进一步配置成:标识另一上下文标记;以及至少部分基于所标识的另一上下文标记选择在所述图像中检测感兴趣的对象的另一组可能区域。15.如权利要求9所述的装...

【专利技术属性】
技术研发人员:D·H·F·德克曼R·B·托瓦V·S·R·安纳普莱蒂
申请(专利权)人:高通股份有限公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1