目标对象的识别方法和装置制造方法及图纸

技术编号:29619136 阅读:31 留言:0更新日期:2021-08-10 18:41
本公开实施例公开了一种目标对象的识别方法、装置和系统,所述方法包括:对目标图像中的待识别目标对象进行分类,确定所述待识别目标对象的预测类别;根据所述待识别目标对象的隐层特征,确定所述预测类别是否正确;响应于所述预测类别不正确,输出提示信息。

【技术实现步骤摘要】
【国外来华专利技术】目标对象的识别方法和装置相关申请的交叉引用本申请要求2020年08月01日提交的申请号为10202007348T的新加坡专利申请的优先权,该专利申请的全部内容以引用的方式并入此处。
本公开涉及计算机视觉
,尤其涉及目标对象的识别方法和装置。
技术介绍
在日常生产和生活中,常常需要对一些目标对象进行识别。以桌游这一娱乐场景为例,在某些桌游中需要对桌面上的游戏币进行识别,以获取游戏币的类别和数量信息。然而,传统的识别方式识别准确率较低,且无法判断不属于当前场景下的目标对象。
技术实现思路
本公开提供了一种目标对象的识别方案。根据本公开的一方面,提供了一种目标对象的识别方法,所述方法包括:对目标图像中的待识别目标对象进行分类,确定所述待识别目标对象的预测类别;根据所述待识别目标对象的隐层特征,确定所述预测类别是否正确;响应于所述预测类别不正确,输出提示信息。结合本公开提供的任一实施方式,所述方法还包括:响应于所述预测类别正确,将所述预测类别确定为所述待识别目标对象的最终类别,并输出所述待识别目标对象的最终类别。结合本公开提供的任一实施方式,根据所述待识别目标对象的隐层特征,确定所述预测类别是否正确,包括:将所述待识别目标对象的隐层特征输入与所述预测类别对应的真伪识别模型,以使所述真伪识别模型输出概率值;其中,所述预测类别对应的真伪识别模型反映该预测类别的目标对象的隐层特征分布规律,所述概率值表征所述待识别目标对象的最终类别为所述预测类别的概率;在所述概率值小于概率阈值时,确定所述预测类别不正确;在所述概率值大于或等于所述概率阈值时,确定所述预测类别正确。结合本公开提供的任一实施方式,所述目标图像中包括叠放着的多个待识别目标对象;对所述目标图像中的待识别目标对象进行分类,确定所述待识别目标对象的预测类别,包括:将所述目标图像的高度调整至预设高度,其中,所述目标图像是根据采集到的图像中叠放着的多个待识别目标对象的检测框从所述采集到的图像中裁剪得到的,且所述目标图像的高度方向为所述叠放着的多个待识别目标对象的叠放的方向;对调整后的目标图像中的待识别目标对象进行分类,确定所述待识别目标对象的预测类别。结合本公开提供的任一实施方式,将所述目标图像的高度调整至所述预设高度,包括:将所述目标图像的高度和宽度等比例缩放,直至所述目标图像的宽度达到预设宽度;在缩放后的目标图像的宽度达到所述预设宽度,而所述缩放后的目标图像高度大于所述预设高度的情况下,将所述缩放后的目标图像的高度和宽度等比例缩小,直至缩小后的目标图像的高度等于所述预设高度。结合本公开提供的任一实施方式,将所述目标图像的高度调整至所述预设高度,包括:将所述目标图像的高度和宽度等比例缩放,直至所述目标图像的宽度达到所述预设宽度;在所述缩放后的目标图像的宽度达到所述预设宽度,而所述缩放后的目标图像的高度小于所述预设高度的情况下,利用第一像素对所述缩放后的目标图像进行填充,使得填充后的目标图像的高度为所述预设高度。结合本公开提供的任一实施方式,对所述调整后的目标图像中的待识别目标对象进行分类,确定所述待识别目标对象的预测类别,包括:对所述调整后的目标图像进行特征提取,得到特征图,所述特征图的高度维度与所述目标图像的高度方向对应;沿着所述特征图的宽度维度对所述特征图进行平均池化,得到池化后的特征图;将所述池化后的特征图沿着高度维度分段,得到预设数量的特征;根据各个特征确定所述叠放着的多个待识别目标对象中各个待识别目标对象的预测类别。结合本公开提供的任一实施方式,对所述调整后的目标图像中的待识别目标对象进行分类确定所述待识别目标对象的预测类别是由神经网络执行的,所述神经网络包括分类网络;其中,所述分类网络中包括K个分类器,其中,K为进行分类时已知类别的数量,k为正整数;根据所述各个特征确定所述叠放着的多个待识别目标对象中所述各个待识别目标对象的预测类别,包括:分别计算所述各个特征与各个分类器的权重向量之间的余弦相似度;根据所述计算的余弦相似度确定所述叠放着的多个待识别目标对象中所述各个待识别目标对象的预测类别。结合本公开提供的任一实施方式,对所述调整后的目标图像中的所述待识别目标对象进行分类确定所述待识别目标对象的预测类别是由神经网络执行的,所述神经网络包括特征提取网络,所述特征提取网络包括多个卷积层,所述特征提取网络的所述多个卷积层中的最后N个卷积层在所述特征图的高度维度上的步长为1,N为正整数。结合本公开提供的任一实施方式,对所述目标图像中的待识别目标对象进行分类是利用神经网络进行分类的,所述预测类别对应的真伪识别模型采用该预测类别的认证目标对象的隐层特征建立,所述认证目标对象在所述神经网络训练阶段和/或测试阶段正确预测。根据本公开的一方面,提供了一种目标对象的识别装置,所述装置包括:分类单元,用于对目标图像中的待识别目标对象进行分类,确定所述待识别目标对象的预测类别;确定单元,用于根据所述待识别目标对象的隐层特征,确定所述预测类别是否正确;提示单元,用于响应于所述预测类别不正确,输出提示信息。结合本公开提供的任一实施方式,所述装置还包括输出单元,用于响应于所述预测类别正确,将所述预测类别确定为所述待识别目标对象的最终类别,并输出所述待识别目标对象的所述最终类别。结合本公开提供的任一实施方式,所述确定单元用于:将所述待识别目标对象的隐层特征输入与预测类别对应的真伪识别模型,以使所述真伪识别模型输出概率值;其中,所述预测类别对应的真伪识别模型反映该预测类别的目标对象的隐层特征的分布规律,所述概率值表征所述待识别目标对象的最终类别为所述预测类别的概率;在所述概率值小于概率阈值时,确定所述预测类别不正确;在所述概率值大于或等于所述概率阈值时,确定所述预测类别正确。结合本公开提供的任一实施方式,所述目标图像中包括叠放着的多个待识别目标对象;所述分类单元用于:将所述目标图像的高度调整至预设高度,其中,所述目标图像是根据采集到的图像中叠放着的多个待识别目标对象的检测框从所述采集到的图像中裁剪得到的,且所述目标图像的高度方向为所述叠放着的多个待识别目标对象的叠放的方向;对调整后的目标图像中的待识别目标对象进行分类,确定所述待识别目标对象的预测类别。结合本公开提供的任一实施方式,所述分类单元用于:将所述目标图像的高度和宽度等比例缩放,直至所述目标图像的宽度达到预设宽度;在缩放后的目标图像的宽度达到所述预设宽度,而所述缩放后的目标图像高度大于所述预设高度的情况下,将所述缩放后的目标图像的高度和宽度等比例缩小,直至缩小后的目标图像的高度等于所述预设高度。结合本公开提供的任一实施方式,所述分类单元用于:将所述目标图像的高度和宽度等比例缩放,直至所述目标图像的宽度达到所述预设宽度;在缩放后的目标图像的宽度达到所述预设宽度,而所述缩放后的目标图像的高度小于所述预设高度的情况下,利用第一像素对所述缩放后的目标图像进行填充,使得填充后的目标图像的高度为所述预设高度。...

【技术保护点】
1.一种目标对象识别方法,其特征在于,所述方法包括:/n对目标图像中的待识别目标对象进行分类,确定所述待识别目标对象的预测类别;/n根据所述待识别目标对象的隐层特征,确定所述预测类别是否正确;/n响应于所述预测类别不正确,输出提示信息。/n

【技术特征摘要】
【国外来华专利技术】20200801 SG 10202007348T1.一种目标对象识别方法,其特征在于,所述方法包括:
对目标图像中的待识别目标对象进行分类,确定所述待识别目标对象的预测类别;
根据所述待识别目标对象的隐层特征,确定所述预测类别是否正确;
响应于所述预测类别不正确,输出提示信息。


2.根据权利要求1所述的方法,其特征在于,所述方法还包括:
响应于所述预测类别正确,将所述预测类别确定为所述待识别目标对象的最终类别,并输出所述待识别目标对象的所述最终类别。


3.根据权利要求1或2所述的方法,其特征在于,根据所述待识别目标对象的隐层特征,确定所述预测类别是否正确,包括:
将所述待识别目标对象的隐层特征输入与所述预测类别对应的真伪识别模型,以使所述真伪识别模型输出概率值;其中,所述预测类别对应的真伪识别模型反映该预测类别的目标对象的隐层特征的分布规律,所述概率值表征所述待识别目标对象的最终类别为所述预测类别的概率;
在所述概率值小于概率阈值时,确定所述预测类别不正确;
在所述概率值大于或等于所述概率阈值时,确定所述预测类别正确。


4.根据权利要求1-3任一所述的方法,其特征在于,所述目标图像中包括叠放着的多个待识别目标对象,
对所述目标图像中的待识别目标对象进行分类,确定所述待识别目标对象的预测类别,包括:
将所述目标图像的高度调整至预设高度,其中,所述目标图像是根据采集到的图像中叠放着的多个待识别目标对象的检测框从所述采集到的图像中裁剪得到的,且所述目标图像的高度方向为所述叠放着的多个待识别目标对象的叠放的方向;
对调整后的目标图像中的待识别目标对象进行分类,确定所述待识别目标对象的预测类别。


5.根据权利要求4所述的方法,其特征在于,将所述目标图像的高度调整至所述预设高度,包括:
将所述目标图像的高度和宽度等比例缩放,直至所述目标图像的宽度达到预设宽度;
在缩放后的目标图像的宽度达到所述预设宽度,而所述缩放后的目标图像的高度大于所述预设高度的情况下,将所述缩放后的目标图像的高度和宽度等比例缩小,直至缩小后的目标图像的高度等于所述预设高度。


6.根据权利要求4所述的方法,其特征在于,将所述目标图像的高度调整至所述预设高度,包括:
将所述目标图像的高度和宽度等比例缩放,直至所述目标图像的宽度达到所述预设宽度;
在所述缩放后的目标图像的宽度达到所述预设宽度,而所述缩放后的目标图像的高度小于所述预设高度的情况下,利用第一像素对所述缩放后的目标图像进行填充,使得填充后的目标图像的高度为所述预设高度。


7.根据权利要求4所述的方法,其特征在于,对所述调整后的目标图像中的所述待识别目标对象进行分类,确定所述待识别目标对象的预测类别,包括:
对所述调整后的目标图像进行特征提取,得到特征图,所述特征图的高度维度与所述目标图像的高度方向对应;
沿着所述特征图的宽度维度对所述特征图进行平均池化,得到池化后的特征图;
将所述池化后的特征图沿着高度维度分段,得到预设数量的特征;
根据各个特征确定所述叠放着的多个待识别目标对象中各个待识别目标对象的预测类别。


8.根据权利要求7所述的方法,其特征在于,对所述调整后的目标图像中的所述待识别目标对象进行分类确定所述待识别目标对象的预测类别是由神经网络执行的,所述神经网络包括分类网络;其中,所述分类网络中包括K个分类器,K为进行分类时已知类别的数量,k为正整数;
根据所述各个特征确定所述叠放着的多个待识别目标对象中所述各个待识别目标对象的预测类别,包括:
分别计算所述各个特征与各个分类器的权重向量之间的余弦相似度;
根据所述计算的余弦相似度确定所述叠放着的多个待识别目标对象中所述各个待识别目标对象的预测类别。


9.根据权利要求7所述的方法,其特征在于,对所述调整后的目标图像中的所述待识别目标对象进行分类确定所述待识别目标对象的预测类别是由神经网络执行的,所述神经网络包括特征提取网络,所述特征提取网络包括多个卷积层,所述特征提取网络的所述多个卷积层中的最后N个卷积层在所述特征图的高度维度上的步长为1,N为正整数。


10.根据权利要求3所述的方法,其特征在于,对所述目标图像中的所述待识别目标对象进行分类是利用神经网络进行分类的,所述预测...

【专利技术属性】
技术研发人员:田茂清吴进伊帅
申请(专利权)人:商汤国际私人有限公司
类型:发明
国别省市:新加坡;SG

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1