一种三维物体识别方法及设备技术

技术编号:21362461 阅读:29 留言:0更新日期:2019-06-15 09:33
本申请实施例提供一种三维物体识别方法及设备,涉及物体识别技术领域。该三维物体识别方法包括获取待识别物体的多张图像,并通过人工智能模型对多张图像进行特征提取处理,得到多个二维视图特征;根据人工智能模型对预设的多个注册视图特征进行组合处理,得到组合视图特征以及与组合视图特征对应的分类结果;根据人工智能模型对多个二维视图特征和组合视图特征进行分类决策处理,得到正负例分数结果;当正负例分数结果为正例分数时,以分类结果为依据确定待识别物体的类别。实施这种实施方式,能够通过多个人工智能模型对多张图像进行三维的物体识别,从而提高物体识别的准确性和普适性。

A 3-D Object Recognition Method and Equipment

The embodiment of this application provides a three-dimensional object recognition method and device, which relates to the technical field of object recognition. The three-dimensional object recognition method includes acquiring multiple images of objects to be recognized, extracting and processing features of multiple images through artificial intelligence model, and obtaining multiple two-dimensional view features; combining features of preset multiple registered views according to artificial intelligence model, and obtaining the classification results of combined view features and corresponding features of combined view; and according to artificial intelligence model, combining features of preset multiple registered views. The model classifies multiple two-dimensional view features and combined view features and obtains positive and negative case scores. When the positive and negative case scores are positive, the classification of objects to be recognized is determined based on the classification results. The implementation of this method can improve the accuracy and universality of object recognition by using multiple artificial intelligence models to recognize three-dimensional objects in multiple images.

【技术实现步骤摘要】
一种三维物体识别方法及设备
本申请涉及物体识别
,具体而言,涉及一种三维物体识别方法及设备。
技术介绍
目前,随着物体识别技术的不断发展,人们已经掌握了很多种物体识别的方法,其中就包括采用匹配算法进行物体识别的方法以及采用人工智能算法进行物体识别的方法。然而,在实践中发现,上述的采用匹配算法进行物体识别的方法因为其匹配条件难以完全满足,从而使得其识别精度较低、普适性较低;另外一种采用人工智能算法进行物体识别的方法,通常是通过单一物体图像的特征来确定物体的类别,这就使得在物体多侧的特征存在较大差异时会产生巨大的识别误差,从而降低了物体识别的准确性和普适性。
技术实现思路
本申请实施例的目的在于提供一种三维物体识别方法及设备,能够通过多个人工智能模型对多张图像进行三维的物体识别,从而提高物体识别的准确性和普适性。本申请实施例第一方面提供了一种三维物体识别方法,包括:获取待识别物体的多张图像,并根据预设的卷积网络模型对所述多张图像进行特征提取处理,得到多个二维视图特征;其中,所述待识别物体是三维物体,所述多张图像为所述待识别物体在多个角度下的图像;根据预设的聚合网络模型对预设的多个注册视图特征进行组合处理,得到组合视图特征以及与所述组合视图特征对应的分类结果;根据预设的相似度匹配模型对所述多个二维视图特征和所述组合视图特征进行分类决策处理,得到正负例分数结果;当所述正负例分数结果为正例分数时,以所述分类结果为依据确定所述待识别物体的类别。在上述实现过程中,优先获取待识别物体(三维物体)基于多个角度下的多张图像,并使用卷积网络模型对多张图像进行特征提取得到多个二维视图特征,从而使得二维特征视图通过人工智能模型提取得到,提高特征获取的精度;在获取到上述二维视图特征之后,在聚合网络模型中对预设的多个注册视图特征进行组合处理,得到一个包括多个注册视图特征的组合视图特征和与组合视图特征对应的分类结果,可见,该步骤可以通过人工智能模型对预存好的多个注册视图特征进行组合,得到有效的组合特征,以使后续的步骤可以根据该组合特征进行分类决策,从而实现对多个角度下的特征集合进行统一的分类决策,进而提高了识别的精准度,并避免单一特征导致的普适度不高的问题,同时还可以通过对注册视图特征进行更新的方法使得在添加新的物体时,只需要利用训练好的网络提取特征并注册,不需要对网络重新训练;最后,根据预设的相似度匹配模型对二维视图特征和组合视图特征综合进行分类决策处理,在判断出两者相同或相似的同时确定出分类结果对应的物体类别,从而实现通过验证提高识别精度的效果,同时通过正负例分数的使用还可以提高稳定性。可见,上述的实现过程可以通过多张物体图像结合人工智能模型来确认物体的种类,从而可以实现提高物体识别的准确度和普适性的技术效果。进一步地,所述卷积网络模型包括卷积层和池化层;所述根据预设的卷积网络模型对所述多张图像进行特征提取处理,得到多个二维视图特征的步骤包括:根据所述卷积层和所述池化层对所述多张图像进行特征提取,得到多个二维视图特征;其中,所述卷积层的激活函数为线性整流函数。在上述实现过程中,通过限定卷积网络模型的结构来对二维视图特征的提取步骤进行了限定,其中,通过该限定可以明确二维视图特征的人工智能提取手段,从而可以通过人工智能提高二维视图特征获取的准确性。进一步地,所述卷积网络模型在训练过程中还包括卷积分类层,其中,所述卷积分类层用于对所述多个二维视图特征进行打分得到与所述多个二维视图特征中每个二维视图特征对应的预测分数,并根据预设的损失函数对所述每个二维视图特征对应的预测分数进行优化,得到与所述多个二维视图特征中每个二维视图特征对应的类别分数;所述类别分数用于判断卷积网络模型的性能。在上述实现过程中,描述了卷积网络模型在训练过程中所使用的具体结构还可以包括卷积分类层,其中该卷积分类层可以实现对二维视图特征进行分辨打分,以使二维视图特征具有相应的类别分数,从而便于计算机或训练者根据类别分数做进一步处理,从而完成对卷积网络模型的优化,进而通过卷积网络模型建立过程的具体结构提高卷积网络模型在使用过程中的实际准确度。进一步地,所述预测分数包括第一子分数以及小于所述第一子分数的第二子分数,所述损失函数为:其中,Ltotal为所述损失函数;为所述第二子分数,s为所述第一子分数;为所述第二子分数与所述第一子分数之间的交叉熵损失函数;为矫正损失函数;λ为正则化参数;μ||w||2为正则项。在上述实现过程中,限定所述预测分数包括第一子分数以及小于所述第一子分数的第二子分数,其中,第一子分数代表预测最大分数(该分数用于表示待识别物体最接近某物体的最大可能性),第二子分数代表预测次大分数(该分数用于表示待识别物体第二接近另一种物体的可能性),同时根据上述的限定使用上述实现过程中的公式,可以实现对损失函数的大幅度优化,并且该优化后的损失函数可以适用于本方案场景(及更多的类似场景),从而实现提高准确度与普适性的效果。进一步地,所述矫正损失函数为:其中,k(i)表示第i个样本是否成功预测,成功为1,不成功为0;表示第i个样本的第二子分数;表示第i个样本的第一子分数;ξ为10-2,m为样本数量。在上述实现过程中,该实现过程是对矫正损失函数的限定,同时,该矫正损失函数会在输入的视图被正确分类的情况下进一步微调模型参数,使得真实类别的预测概率更接近于1,同时其他类别的概率更接近于0,从而实现对结果进行相应的极化,得到更清晰的结果,进而实现了对结果的精确获取以及避免以往的模糊性,提高普适性。进一步地,所述方法还包括:根据预设的特征辨识度评估公式、所述第一子分数以及所述第二子分数对特征辨识度进行评估得到评估结果;所述评估结果用于表示所述多个二维视图特征的辨识度高低;其中,所述特征辨识度评估公式为其中,top2_dst为所述第一子分数与所述第二子分数之间的平均距离;top1_dst为所述第一子分数与预设分数值之间的平均距离;所述预设分数值为所述第一子分数的分数上限值。在上述实现过程中,可以在得到预测分数时,获取到该预测分数对应的二维视图特征的辨识度评估结果,从而可以得知识别过程中该二维视图特征的辨识度高低,进而便于监督或自反馈学习,使得总体的三维物体识别方法的识别精度可以提高。进一步地,所述聚合网络模型为循环神经网络模型,并且所述聚合网络模型包括三个包括双曲正切单元的循环层,其中,所述循环层用于循环叠加所述多个二维视图特征得到所述组合视图特征。在上述实现过程中,该限定是对聚合网络模型进行的限定,可见,通过对聚合网络模型进行限定可以提高多个注册视图特征的聚合效果,从而提高三维物体识别方法的准确程度;另一方面,使用该种循环神经网络模型结构的融合网络可以更好地融合原始特征,使得其得到的结果更好、更准确。本申请实施例第二方面提供了一种三维物体识别设备,所述三维物体识别设备包括:特征提取模块,用于获取待识别物体的多张图像,并根据预设的卷积网络模型对所述多张图像进行特征提取处理,得到多个二维视图特征;其中,所述待识别物体是三维物体,所述多张图像为所述待识别物体在多个角度下的图像;特征聚合模块,用于根据预设的聚合网络模型对预设的多个注册视图特征进行组合处理,得到组合视图特征以本文档来自技高网...

【技术保护点】
1.一种三维物体识别方法,其特征在于,包括:获取待识别物体的多张图像,并根据预设的卷积网络模型对所述多张图像进行特征提取处理,得到多个二维视图特征;其中,所述待识别物体是三维物体,所述多张图像为所述待识别物体在多个角度下的图像;根据预设的聚合网络模型对预设的多个注册视图特征进行组合处理,得到组合视图特征以及与所述组合视图特征对应的分类结果;根据预设的相似度匹配模型对所述多个二维视图特征和所述组合视图特征进行分类决策处理,得到正负例分数结果;当所述正负例分数结果为正例分数时,以所述分类结果为依据确定所述待识别物体的类别。

【技术特征摘要】
1.一种三维物体识别方法,其特征在于,包括:获取待识别物体的多张图像,并根据预设的卷积网络模型对所述多张图像进行特征提取处理,得到多个二维视图特征;其中,所述待识别物体是三维物体,所述多张图像为所述待识别物体在多个角度下的图像;根据预设的聚合网络模型对预设的多个注册视图特征进行组合处理,得到组合视图特征以及与所述组合视图特征对应的分类结果;根据预设的相似度匹配模型对所述多个二维视图特征和所述组合视图特征进行分类决策处理,得到正负例分数结果;当所述正负例分数结果为正例分数时,以所述分类结果为依据确定所述待识别物体的类别。2.根据权利要求1所述的三维物体识别方法,其特征在于,所述卷积网络模型包括卷积层和池化层;所述根据预设的卷积网络模型对所述多张图像进行特征提取处理,得到多个二维视图特征的步骤包括:根据所述卷积层和所述池化层对所述多张图像进行特征提取,得到多个二维视图特征;其中,所述卷积层的激活函数为线性整流函数。3.根据权利要求2所述的三维物体识别方法,其特征在于,所述卷积网络模型在训练过程中还包括卷积分类层,其中,所述卷积分类层用于对所述多个二维视图特征进行打分得到与所述多个二维视图特征中每个二维视图特征对应的预测分数,并根据预设的损失函数对所述每个二维视图特征对应的预测分数进行优化,得到与所述多个二维视图特征中每个二维视图特征对应的类别分数;所述类别分数用于判断卷积网络模型的性能。4.根据权利要求3所述的三维物体识别方法,其特征在于,所述预测分数包括第一子分数以及小于所述第一子分数的第二子分数,所述损失函数为:其中,Ltotal为所述损失函数;为所述第二子分数,s为所述第一子分数;为所述第二子分数与所述第一子分数之间的交叉熵损失函数;为矫正损失函数;λ为正则化参数;μ||w||2为正则项。5.根据权利要求4所述的三维物体识别方法,其特征在于,所述矫正损失函数为:其中,k(i)表示第i个样本是否成功预测,成功为1,不成功为0;表示第i个样本的第二子分数;表示第i个样本的第一子分数;ξ为10-2,m为样本数量。6.根据权利要求4所述的三维物体识别方法,其特征在于...

【专利技术属性】
技术研发人员:董帅李文生邹昆
申请(专利权)人:电子科技大学中山学院
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1