目标对象的识别方法和装置,及机器人制造方法及图纸

技术编号:17442410 阅读:45 留言:0更新日期:2018-03-10 15:14
本发明专利技术公开了一种目标对象的识别方法和装置,及机器人。其中,该方法包括:获取至少一个滑动窗口,其中,每个滑动窗口内的图像中包含待识别的目标对象;采用至少一个卷积神经网络对至少一个滑动窗口内的图像进行识别,得到至少一个滑动窗口的识别结果,其中,识别结果至少包括:识别类型和置信度;在任意一个滑动窗口的置信度达到一个或多个卷积神经网络的置信度阈值的情况下,标记待识别的目标对象的类型为任意一个滑动窗口的识别类型。本发明专利技术解决了传统的目标对象的识别方法运行速度慢,精度低的技术问题。

【技术实现步骤摘要】
目标对象的识别方法和装置,及机器人
本专利技术涉及物体识别领域,具体而言,涉及一种目标对象的识别方法和装置,及机器人。
技术介绍
物体识别是计算机视觉领域的关键问题,同时也是人工智能领域判断机器是否拥有“智能”特征的重要意义。一项成熟稳定的物体识别技术对帮助计算机理解获取视觉范围内的物体布局并进一步提取视觉范围类的深层次信息(例如判断当前场景,发生的事件,时间等)。传统的物体识别技术都使用了滑动窗口技术,使用传统的判别方法来判断不同滑动窗口下的物体类型。传统的物体识别方法不仅精度不够(使用传统的分类器),而且其核心技术依赖于大量的滑动窗口(会导致识别的时间特别长)。因此,在精度和速度两方面传统的方法在实用场景下都效果不好。虽然目前在滑动传统技术的基础上提出了一些改进,比如选择性搜索算法,它将详尽搜索算法和图片分割技术相结合,能够智能地将分割的图片选择性地结合起来从而提升算法的效率和精度。尽管如此,由于在本质上仍然类似于遍历性的滑框技术并且依次对不同边框进行识别,在对单个窗口的识别速度提升不大的条件下,这些改进对传统算法的提升并不高。针对传统的目标对象的识别方法运行速度慢,精度低的问题,目前尚未提出有效的解决方案。
技术实现思路
本专利技术实施例提供了一种目标对象的识别方法和装置,及机器人,以至少解决传统的目标对象的识别方法运行速度慢,精度低的技术问题。根据本专利技术实施例的一个方面,提供了一种目标对象的识别方法,包括:获取至少一个滑动窗口,其中,每个滑动窗口内的图像中包含待识别的目标对象;采用至少一个卷积神经网络对至少一个滑动窗口内的图像进行识别,得到任意一个滑动窗口的识别结果,其中,识别结果至少包括:识别类型和置信度;在任意一个滑动窗口的置信度达到一个或多个卷积神经网络的置信度阈值的情况下,标记待识别的目标对象的类型为任意一个滑动窗口的识别类型。根据本专利技术实施例的另一方面,还提供了一种目标对象的识别装置,包括:获取模块,用于获取至少一个滑动窗口,其中,每个滑动窗口内的图像中包含待识别的目标对象;处理模块,用于采用至少一个卷积神经网络对至少一个滑动窗口内的图像进行识别,得到任意一个滑动窗口的识别结果,其中,识别结果至少包括:识别类型和置信度;标记模块,用于在任意一个滑动窗口的置信度达到一个或多个卷积神经网络的置信度阈值的情况下,标记待识别的目标对象的类型为任意一个滑动窗口的识别类型。根据本专利技术实施例的另一方面,还提供了一种机器人,包括:上述实施例中任意一项的目标对象的识别装置。在本专利技术实施例中,可以在获取至少一个滑动窗口之后,通过至少一个卷积神经网络对至少一个滑动窗口内的图像进行识别,得到至少一个滑动窗口的识别结果,并在任意一个滑动窗口的置信度达到一个或多个卷积神经网络的置信度阈值的情况下,标记待识别的目标对象的类型为任意一个滑动窗口的识别类型,从而实现对目标对象的识别,因此,通过本专利技术上述实施例,可以通过多个卷积神经网络对滑动窗口进行识别,提高目标对象的识别精度,并通过对滑动窗口的置信度进行判断,对滑动窗口进行筛选,提高目标对象的识别速度,从而在从识别精度和速度两个方面双管齐下,提高物体识别技术的实际效用。附图说明此处所说明的附图用来提供对本专利技术的进一步理解,构成本申请的一部分,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。在附图中:图1是根据本专利技术实施例的一种目标对象的识别方法的流程图;图2是根据本专利技术实施例的一种可选的目标对象的识别方法的流程图;图3是根据本专利技术实施例的一种目标对象的识别装置的示意图;图4是根据本专利技术实施例的一种可选的目标对象的识别装置的示意图;图5是根据本专利技术实施例的一种可选的目标对象的识别装置的示意图;图6是根据本专利技术实施例的一种可选的目标对象的识别装置的示意图;以及图7是根据本专利技术实施例的一种可选的目标对象的识别装置的示意图。具体实施方式为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围。需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本专利技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。实施例1根据本专利技术实施例,提供了一种目标对象的识别方法实施例,需要说明的是,在附图的流程图示出的步骤可以在诸如一组计算机可执行指令的计算机系统中执行,并且,虽然在流程图中示出了逻辑顺序,但是在某些情况下,可以以不同于此处的顺序执行所示出或描述的步骤。图1是根据本专利技术实施例的一种目标对象的识别方法的流程图,如图1所示,该方法包括如下步骤:步骤S102,获取至少一个滑动窗口,其中,每个滑动窗口内的图像中包含待识别的目标对象。步骤S104,采用至少一个卷积神经网络对至少一个滑动窗口内的图像进行识别,得到至少一个滑动窗口的识别结果,其中,识别结果至少包括:识别类型和置信度。具体的,上述识别类型可以是通过卷积神经网络识别,识别出的待识别的目标对象的类型,并不一定是待识别的目标对象的实际类型。此处需要说明的是,卷积神经网络可以通过一个深度神经网络对输入图片的每个像素点进行逐层抽象并最终通过高度抽象的数学方法提取出不同类型物体的本质特征,从而使较高精度的物体识别成为可能。步骤S106,在任意一个滑动窗口的置信度达到一个或多个卷积神经网络的置信度阈值的情况下,标记待识别的目标对象的类型为任意一个滑动窗口的识别类型。具体的,上述置信度阈值可以根据实际需要进行设定,例如可以是40%-50%,本专利技术对此不做具体限定。此处需要说明的是,为了实现较高精度的物体识别分类,我们往往需要用到具有多层复杂结构的卷积神经网络,因此识别速度甚至比传统分类器还要低。为了解决大量滑动窗口带来的运算速度方面的瓶颈,可以采用层瀑式的判别结构来减少需要通过较高精度的卷积神经网络分类的窗口数目。简单来讲,我们可以用一个决策树的判断结构来对每一个滑动窗口进行判断。可选的,根据本专利技术上述实施例,在任意一个滑动窗口的置信度未达到至少一个卷积神经网络的置信度阈值的情况下,丢弃任意一个滑动窗口。在一种可选的方案中,在获取到多个滑动窗口之后,可以采用多层不同的卷积神经网络对每个滑动窗口进行识别,在任意一层卷积神经网络对每个滑动窗口进行识别之后,对每个滑动窗口的置信度进行判断,在任意一个滑动窗口的置信度达到该层积神经网络的置信度阈值,确定该滑动窗口为有效滑动窗口;在任意一层卷积神经网络对每个滑动窗口进行识别之后,对每个滑动窗口的置信度进行判断,在任意一个滑动窗口的置信度未达到该层积本文档来自技高网
...
目标对象的识别方法和装置,及机器人

【技术保护点】
一种目标对象的识别方法,其特征在于,包括:获取至少一个滑动窗口,其中,每个滑动窗口内的图像中包含待识别的目标对象;采用至少一个卷积神经网络对所述至少一个滑动窗口内的图像进行识别,得到所述至少一个滑动窗口的识别结果,其中,所述识别结果至少包括:识别类型和置信度;在任意一个滑动窗口的置信度达到一个或多个卷积神经网络的置信度阈值的情况下,标记所述待识别的目标对象的类型为所述任意一个滑动窗口的识别类型。

【技术特征摘要】
1.一种目标对象的识别方法,其特征在于,包括:获取至少一个滑动窗口,其中,每个滑动窗口内的图像中包含待识别的目标对象;采用至少一个卷积神经网络对所述至少一个滑动窗口内的图像进行识别,得到所述至少一个滑动窗口的识别结果,其中,所述识别结果至少包括:识别类型和置信度;在任意一个滑动窗口的置信度达到一个或多个卷积神经网络的置信度阈值的情况下,标记所述待识别的目标对象的类型为所述任意一个滑动窗口的识别类型。2.根据权利要求1所述的方法,其特征在于,在任意一个滑动窗口的置信度未达到所述至少一个卷积神经网络的置信度阈值的情况下,丢弃所述任意一个滑动窗口。3.根据权利要求1所述的方法,其特征在于,在所述至少一个卷积神经网络中包含多个卷积神经网络的情况下,采用至少一个卷积神经网络对所述至少一个滑动窗口内的图像进行识别,得到所述至少一个滑动窗口的识别结果,包括:采用第一卷积神经网络对所述至少一个滑动窗口内的图像进行识别,得到所述至少一个滑动窗口的识别结果;在所述任意一个滑动窗口的置信度达到所述第一卷积神经网络的置信度阈值的情况下,确定所述任意一个滑动窗口为第一滑动窗口;采用第二卷积神经网络对至少一个第一滑动窗口内的图像进行识别,得到所述至少一个第一滑动窗口的识别结果;其中,所述第二卷积神经网络的复杂度与所述第一卷积神经网络的复杂度不同。4.根据权利要求3所述的方法,其特征在于,在所述任意一个滑动窗口的置信度未达到所述第一卷积神经网络的置信度阈值的情况下,丢弃所述任意一个滑动窗口。5.根据权利要求3所述的方法,其特征在于,所述第二卷积神经网络的置信度阈值大于所述第一卷积神经网络的置信度阈值;在任意一个第一滑动窗口的置信度未达到所述第二卷积神经网络的置信度阈值的情况下,丢弃所述任意一个第一滑动窗口。6.根据权利要求1至5中任意一项所述的方法,其特征在于,采用至少一个卷积神经网络对所述至少一个滑动窗口内的图像进行识别,得到所述至少一个滑动窗口的识别结果,包括:采用卷积核提取所述至少一个滑动窗口内的图像的特征向量;采用分类算法对每个滑动窗口内的图像的特征向量进行分类,得到所述每个滑动窗口的识别类型和置信度。7.根据权利要求6所述的方法,其特征在于,在采用至少一个卷积神经网络对所述至少一个滑动窗口内的图像进行识别,得到所述至少一个滑动窗口的识别结果之前,所述方法还包括:获取预设的训练集,其中,所述训练集至少包括:不同类型的多个目标对象,所述不同类型至少包括:所述识别类型;根据所述训练集,得到所述至少一个卷积神经网络的模型参数;保存所述至少一个卷积神经网络的模型参数,并设定相应的置信度阈值。8.根据权利要求7所述的方法,其特征在于,获取预设的训练集包括:构建所述不同类型的多个目标对象的图像集合;将所述图像集合转化为预定的输入格式,并插入每个目标对象的标签信息,得到所述预设的训练集,其中,所述每个目标对象的标签信息用于表征所述每个目标对象的类型。9.根据...

【专利技术属性】
技术研发人员:不公告发明人
申请(专利权)人:深圳光启合众科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1