视觉分类方法、系统、装置及计算机可读介质制造方法及图纸

技术编号:33969140 阅读:19 留言:0更新日期:2022-06-30 02:03
本申请涉及一种视觉分类方法、系统、装置及计算机可读介质,该方法包括:获取同一物体的m个视角的图像,m为大于等于2的正整数;将图像分别输入基础分类器模型中进行分类,得到每个图像对应的基础分类结果,基础分类结果包括位置、类别和置信度的列表;将m个图像的基础分类结果中类别相同的项进行置信度融合计算,得到第一分类结果,第一分类结果包括类别和置信度的列表;根据第一分类结果中的置信度确定物体的类别。本申请的视觉分类方法通过采用多视角的图像,能够获取到更多视角的信息,且对多视角的图像的基础分类结果中类别相同的项进行置信度融合计算,有效地增强了分类的准确性和可信度。和可信度。和可信度。

【技术实现步骤摘要】
视觉分类方法、系统、装置及计算机可读介质


[0001]本申请主要涉及计算机视觉领域,具体地涉及一种视觉分类方法、系统、装置及计算机可读介质。

技术介绍

[0002]在自动化物品识别分类领域,基于视觉的分类技术一般有两种。一种是模板匹配的技术,模板匹配的目标检测算法对灯光,背景、相机定位等要求较高,对形状比较单一的物体识别效果较好。但在目标多样的复杂识别场景,如垃圾分类等场景难以实际应用。另外一种是使用机器学习的分类算法,使用机器学习技术进行分类。
[0003]目前使用机器学习的分类算法一般使用单摄像头,物体仅有一个视角的图像,在实际应用场景下,识别率往往不是很高。以机器人进行自动化垃圾分拣为例,在实际分拣场景下,会出现两个以上不同种类的垃圾堆叠在一起的情形。由于一个物体被另一个物体遮盖,从某些视角观察不到被遮盖的物体,换一个视角则可以被观察到。仅使用一个视角的图像进行机器学习分类的算法由于缺少其他视角的图像的信息,容易导致识别错误。如果这种堆叠的垃圾被机器人抓取分类,有可能把垃圾放置进错误的分类箱。
[0004]因此,亟需一种能增强分类的准确性和可信度的视觉分类方法、系统、装置及计算机可读介质。

技术实现思路

[0005]本申请所要解决的技术问题是提供一种多视角的视觉分类方法、系统、装置及计算机可读介质,解决单视角视觉分类方法分类准确性低的问题。
[0006]为了解决上述技术问题,本申请提供一种视觉分类方法,包括如下步骤:获取同一物体的m个视角的图像,m为大于等于2的正整数;将所述图像分别输入基础分类器模型中进行分类,得到每个图像对应的基础分类结果,所述基础分类结果包括位置、类别和置信度的列表;将m个图像的基础分类结果中类别相同的项进行置信度融合计算,得到第一分类结果,所述第一分类结果包括类别和置信度的列表;以及根据所述第一分类结果中的置信度确定所述物体的类别。
[0007]在本申请的一实施例中,所述m个视角的图像之间的视差角为60
°
~180
°

[0008]在本申请的一实施例中,所述基础分类器模型是基于深度学习的目标检测模型。
[0009]在本申请的一实施例中,每个所述视角对应一个所述基础分类器模型,各个所述视角对应的所述基础分类器模型使用相同的模型。
[0010]在本申请的一实施例中,使用如下公式将m个图像的基础分类结果中类别相同的项进行置信度融合计算:
其中,m为视角数目,n为类别数目,为第m个视角在第n种类别上的置信度,a是对数函数的底数且,是一维数组,表示各种类别下的置信度。
[0011]在本申请的一实施例中,根据所述第一分类结果中的置信度确定所述物体的类别的步骤包括:从所述第一分类结果中取置信度最高的项作为第一候选项,如果所述第一候选项的置信度大于等于第一阈值,则将所述第一候选项的类别作为所述物体的类别。
[0012]在本申请的一实施例中,方法还包括:如果所述第一候选项的置信度小于所述第一阈值,则继续取置信度第二高的项,求所述第一候选项的置信度与所述第二高的项的置信度的差值;如果所述差值小于第二阈值,则根据所述m个图像的基础分类结果计算输入特征,将所述输入特征输入到冲突判别器中进行判别,得到第二分类结果,所述第二分类结果包括类别和置信度的列表;从所述第二分类结果中取置信度最高的项作为第二候选项,如果所述第二候选项的置信度大于等于第三阈值,则将所述第二候选项的类别作为所述物体的类别。
[0013]在本申请的一实施例中,所述输入特征包括以下之一或其组合:各个所述图像的基础分类结果中位置之间的交并比、偏心距离和位置形态,各个图像的基础分类结果中最高的置信度以及模型混淆矩阵。
[0014]在本申请的一实施例中,所述冲突判别器是由支持向量机、人工神经网络或随机森林的方式构建的分类器模型。
[0015]为了解决上述技术问题,本申请提供一种视觉分类系统,包括:图像获取单元,用于获取同一物体的m个视角的图像,m为大于等于2的正整数;分类单元,用于将所述图像进行分类,得到每个图像对应的基础分类结果,所述基础分类结果包括位置、类别和置信度的列表;融合单元,用于将m个图像的基础分类结果中类别相同的项进行置信度融合计算,得到第一分类结果,所述第一分类结果包括类别和置信度的列表;以及判断单元,用于根据所述第一分类结果中的置信度确定所述物体的类别。
[0016]在本申请的一实施例中,所述m个视角的图像之间的视差角为60
°
~180
°

[0017]在本申请的一实施例中,使用如下公式将m个图像的基础分类结果中类别相同的项进行置信度融合计算:
其中,m为视角数目,n为类别数目,为第m个视角在第n种类别上的置信度,a是对数函数的底数且,是一维数组,表示各种类别下的置信度。
[0018]在本申请的一实施例中,根据所述第一分类结果中的置信度确定所述物体的类别包括:从所述第一分类结果中取置信度最高的项作为第一候选项,如果所述第一候选项的置信度大于等于第一阈值,则将所述第一候选项的类别作为所述物体的类别。
[0019]在本申请的一实施例中,系统还包括:冲突判别单元,用于当所述第一候选项的置信度小于所述第一阈值,则继续取置信度第二高的项,求所述第一候选项的置信度与所述第二高的项的置信度的差值,如果所述差值小于第二阈值,根据 m个图像的基础分类结果计算输入特征,根据所述输入特征进行判别,得到第二分类结果,所述第二分类结果包括类别和置信度的列表,从所述第二分类结果中取置信度最高的项作为第二候选项,如果所述第二候选项的置信度大于等于第三阈值,则将所述第二候选项的类别作为所述物体的类别。
[0020]为了解决上述技术问题,本申请提供一种视觉分类装置,包括:移动装置;如上所述的视觉分类系统,所述视觉分类系统中的图像获取单元呈60
°
~180
°
的视差角固定安装在所述移动装置上;以及机械手,安装在所述移动装置上,通过所述视觉分类系统输出的物体的类别抓取物体。
[0021]为了解决上述技术问题,本申请提供一种视觉分类装置,装置包括:存储器,用于存储可由处理器执行的指令;处理器,用于执行指令以实现上述分类方法。
[0022]为了解决上述技术问题,本申请提供一种存储有计算机程序代码的计算机可读介质,计算机程序代码在由处理器执行时实现上述分类方法。
[0023]本申请的视觉分类方法通过采用多视角的图像,能够获取到更多视角的信息,且对多视角的图像的基础分类结果中类别相同的项进行置信度融合计算,有效地增强了分类的准确性和可信度;通过采用冲突判别器对存在疑似冲突的结果进行继续判别,能进一步提高分类的准确性。
附图说明
[0024]为让本申请的上述目的、特征和优点能更明显易懂,以下结合附图对本申请的具体实施方式作详细说明,其中:图1是本申请一实施例的视觉分类方法的示例性流程示意图;图2是本申本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种视觉分类方法,其特征在于,包括:获取同一物体的m个视角的图像,m为大于等于2的正整数;将所述图像分别输入基础分类器模型中进行分类,得到每个图像对应的基础分类结果,所述基础分类结果包括位置、类别和置信度的列表;将m个图像的基础分类结果中类别相同的项进行置信度融合计算,得到第一分类结果,所述第一分类结果包括类别和置信度的列表;以及根据所述第一分类结果中的置信度确定所述物体的类别。2.如权利要求1所述的视觉分类方法,其特征在于,所述m个视角的图像之间的视差角为60
°
~180
°
。3.如权利要求1所述的视觉分类方法,其特征在于,所述基础分类器模型是基于深度学习的目标检测模型。4.如权利要求1所述的视觉分类方法,其特征在于,每个所述视角对应一个所述基础分类器模型,各个所述视角对应的所述基础分类器模型使用相同的模型。5.如权利要求1所述的视觉分类方法,其特征在于,使用如下公式将m个图像的基础分类结果中类别相同的项进行置信度融合计算:其中,m为视角数目,n为类别数目,为第m个视角在第n种类别上的置信度,a是对数函数的底数且,是一维数组,表示各种类别下的置信度。6.如权利要求1所述的视觉分类方法,其特征在于,根据所述第一分类结果中的置信度确定所述物体的类别的步骤包括:从所述第一分类结果中取置信度最高的项作为第一候选项,如果所述第一候选项的置信度大于等于第一阈值,则将所述第一候选项的类别作为所述物体的类别。7.如权利要求6所述的视觉分类方法,其特征在于,还包括:如果所述第一候选项的置信度小于所述第一阈值,则继续取置信度第二高的项,求所述第一候选项的置信度与所述第二高的项的置信度的差值;如果所述差值小于第二阈值,则根据所述m个图像的基础分类结果计算输入特征,将所述输入特征输入到冲突判别器中进行判别,得到第二分类结果,所述第二分类结果包括类别和置信度的列表;从所述第二分类结果中取置信度最高的项作为第二候选项,如果所述第二候选项的置信度大于等于第三阈值,则将所述第二候选项的类别作为所述物体的类别。8.如权利要求7所述的视觉分类方法,其特征在于,所述输入特征包括以下之一或其组合:各个所述图像的基础分类结果中位置之间的交并比、偏心距离和位置形态,各个图像的
基础分类结果中最高的置信度以及模型混淆矩阵。9.如权利要求7所述的视觉分类方法,其特征在于,所述冲突判别器是由支持向量机、人工神经网络或随机森林的方式构建的分类器模型。10.一种视觉分类系统,其特征在于,包括:图像获取单元,用于获取同一物体的...

【专利技术属性】
技术研发人员:范东平李峰
申请(专利权)人:上海捷勃特机器人有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1