室内场景识别方法、相关设备及计算机可读存储介质技术

技术编号：37890830 阅读：10 留言：0更新日期：2023-06-18 11:54

本申请实施例公开了一种室内场景识别方法、相关设备及计算机可读存储介质，该方法可以包括如下步骤：获取室内场景图像；其中，所述室内场景图像包含待识别的物体；对所述室内场景图像进行处理，得到至少一个显著图和灰度图；基于所述至少一个显著图和灰度图，提取第一融合特征；将提取到的所述第一融合特征输入训练好的机器学习模型，识别出所述物体的所属类别。实施本申请，可以提高室内场景的识别效果。果。果。

全部详细技术资料下载

【技术实现步骤摘要】
室内场景识别方法、相关设备及计算机可读存储介质

[0001]本申请涉及图像处理
，尤其涉及一种室内场景识别方法、相关设备及计算机可读存储介质。

技术介绍

[0002]随着信息技术和智能机器人的发展与普及，场景识别作为重要的研究内容，已成为计算机视觉和模式识别领域的重要研究问题。场景图像分类是依据一组给定的语义标签来对图像数据集进行自动分类。场景识别模型主要分为三大块：基于低级特征、基于中级特征、基于视觉词汇。所谓低级特征，即对场景图像提取全局或者分块的纹理、颜色等特征对场景图像进行分类，比如Valiaya和Szumme等人的研究，但是这种提取底层特征的方法只适用于比较简单的场景或者场景差别较大的图像场景(沙滩和蓝天、室内和室外等)，因而人们又继续进行探索。David G提出了一种基于尺度空间的、具有图像缩放、旋转和仿射不变形的图像局部特征描述算子SIFT，Dalal等人提出了HOG图像局部特征，得到了高性能的底层特征。随着人们对图像识别研究领域的深入、人们逐渐发现仅仅提取底层特征不能有效解决语义鸿沟问题，因此构建中层特征作为一个新的研究思路，引起了广大研究者们的关注，其中最具代表性的是视觉词袋模型(Bag of visual Words,BoW)，但它是将图像表示成了一个无序局部特征集的特征包方法，忽略了所有的关于图像块的位置信息，为了解决这个问题，Lazebnik等人提出一种基于空间金字塔匹配(Spatial Pyramid Matching，SPM)的方法来改进传统的Bow模型，取得了较好的识别效果。/>[0003]然而，申请人在研究中发现，当把上述方法应用在室内场景识别时，识别效果差。因此，如何提高室内场景的识别效果是亟需解决的技术问题。

技术实现思路

[0004]本申请实施例提供一种室内场景识别方法、相关设备及计算机可读存储介质，可以提高室内场景的识别效果。
[0005]第一方面，本申请实施例提供了一种室内场景识别方法，该方法可以包括如下步骤：
[0006]获取室内场景图像；其中，所述室内场景图像包含待识别的物体；
[0007]对所述室内场景图像进行处理，得到至少一个显著图和灰度图；
[0008]基于所述至少一个显著图和灰度图，提取第一融合特征；
[0009]将提取到的所述第一融合特征输入训练好的机器学习模型，识别出所述物体的所属类别。
[0010]在一种可能的实现方式中，所述至少一个显著图包括第一显著图，所述第一显著图为通过第一显著性检测算法处理得到的图像，所述第一显著性检测算法关联有第一显著性阈值；所述基于所述至少一个显著图和灰度图，提取第一融合特征，包括：
[0011]在所述第一显著图中，提取第一显著性特征；
[0012]在所述灰度图中，提取灰度特征；
[0013]将所述第一显著性特征与所述灰度特征进行拼接，得到所述第一融合特征。
[0014]在一种可能的实现方式中，所述至少一个显著图还包括第二显著图，所述第二显著图为通过第二显著性检测算法处理得到的图像，所述第二显著性检测算法关联有第二显著性阈值；所述第二显著性阈值小于所述第一显著性阈值；所述方法还包括：
[0015]在所述第二显著图中，提取第二显著性特征；
[0016]将所述第一显著性特征与所述灰度特征进行拼接，得到所述第一融合特征，包括：
[0017]将所述第一显著性特征与所述灰度特征进行拼接，得到第二融合特征；
[0018]将所述第二显著性特征与所述第二融合特征进行拼接，得到所述第一融合特征。
[0019]在一种可能的实现方式中，所述对所述室内场景图像进行处理，得到至少一个显著图，包括：
[0020]对所述室内场景图像进行多尺度分割，得到多尺度分割图像；
[0021]对所述多尺度分割图像进行区域显著性计算，得到不同尺度下的显著性；
[0022]基于所述不同尺度下的显著性，生成多尺度显著性子图；
[0023]将所述多尺度显著性子图进行融合，得到所述显著图。
[0024]在一种可能的实现方式中，所述训练好的机器学习模块包括稀疏字典；所述将提取到的所述第一融合特征输入训练好的机器学习模型，识别出所述物体的所属类别，包括：
[0025]利用所述稀疏字典对输入的所述第一融合特征进行稀疏表示，得到稀疏解；
[0026]根据所述稀疏解以及所输入的所述第一融合特征计算得到残差；
[0027]基于所述残差的大小判断所述物体的所属类别。
[0028]第二方面，本申请实施例提供了一种室内场景识别装置，该装置包括用于执行上述第一方面的方法的单元。具体地，该装置可以包括：
[0029]获取模块，用于获取室内场景图像；其中，所述室内场景图像包含待识别的物体；
[0030]图像处理模块，用于对所述室内场景图像进行处理，得到至少一个显著图和灰度图；
[0031]特征提取模块，用于基于所述至少一个显著图和灰度图，提取第一融合特征；
[0032]识别模块，用于将提取到的所述第一融合特征输入训练好的机器学习模型，识别出所述物体的所属类别。
[0033]在一种可能的实现方式中，所述至少一个显著图包括第一显著图，所述第一显著图为通过第一显著性检测算法处理得到的图像，所述第一显著性检测算法关联有第一显著性阈值；所述特征提取模块，具体用于：
[0034]在所述第一显著图中，提取第一显著性特征；
[0035]在所述灰度图中，提取灰度特征；
[0036]将所述第一显著性特征与所述灰度特征进行拼接，得到所述第一融合特征。
[0037]在一种可能的实现方式中，所述至少一个显著图还包括第二显著图，所述第二显著图为通过第二显著性检测算法处理得到的图像，所述第二显著性检测算法关联有第二显著性阈值；所述第二显著性阈值小于所述第一显著性阈值；
[0038]所述特征提取模块，还用于：
[0039]在所述第二显著图中，提取第二显著性特征；
[0040]将所述第一显著性特征与所述灰度特征进行拼接，得到第二融合特征；
[0041]将所述第二显著性特征与所述第二融合特征进行拼接，得到所述第一融合特征。
[0042]在一种可能的实现方式中，所述图像处理模块，具体用于：
[0043]对所述室内场景图像进行多尺度分割，得到多尺度分割图像；
[0044]对所述多尺度分割图像进行区域显著性计算，得到不同尺度下的显著性；
[0045]基于所述不同尺度下的显著性，生成多尺度显著性子图；
[0046]将所述多尺度显著性子图进行融合，得到所述显著图。
[0047]在一种可能的实现方式中，所述训练好的机器学习模块包括稀疏字典；所述识别模块，具体用于：
[0048]利用所述稀疏字典对输入的所述第一融合特征进行稀疏表示，得到稀疏解；
[0049]根据所述稀疏解以及所输入的所述第一融合特征计算得本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种室内场景识别方法，其特征在于，包括：获取室内场景图像；其中，所述室内场景图像包含待识别的物体；对所述室内场景图像进行处理，得到至少一个显著图和灰度图；基于所述至少一个显著图和灰度图，提取第一融合特征；将提取到的所述第一融合特征输入训练好的机器学习模型，识别出所述物体的所属类别。2.如权利要求1所述的方法，其特征在于，所述至少一个显著图包括第一显著图，所述第一显著图为通过第一显著性检测算法处理得到的图像，所述第一显著性检测算法关联有第一显著性阈值；所述基于所述至少一个显著图和灰度图，提取第一融合特征，包括：在所述第一显著图中，提取第一显著性特征；在所述灰度图中，提取灰度特征；将所述第一显著性特征与所述灰度特征进行拼接，得到所述第一融合特征。3.如权利要求2所述的方法，其特征在于，所述至少一个显著图还包括第二显著图，所述第二显著图为通过第二显著性检测算法处理得到的图像，所述第二显著性检测算法关联有第二显著性阈值；所述第二显著性阈值小于所述第一显著性阈值；所述方法还包括：在所述第二显著图中，提取第二显著性特征；将所述第一显著性特征与所述灰度特征进行拼接，得到所述第一融合特征，包括：将所述第一显著性特征与所述灰度特征进行拼接，得到第二融合特征；将所述第二显著性特征与所述第二融合特征进行拼接，得到所述第一融合特征。4.如权利要求1所述的方法，其特征在于，所述对所述室内场景图像进行处理，得到至少一个显著图，包括：对所述室内场景图像进行多尺度分割，得到多尺度分割图像；对所述多尺度分割图像进行区域显著性计算，得到不同尺度下的显著性；基于所述不同尺度下的显著性，生成多尺度显著性子图；将所述多尺度显著性子图进行融合，得到所述显著图。5.如权利要求1所述的方法，其特征在于，所述训练好的机器学习模块包括稀疏字典；所述将提取到的所述第一融合特征输入训练好的机器学习模型，识别出所述物体的所属类别，包括：利用所述稀疏字典对输入的所述第一融合特征进行稀疏表示，得到稀疏解；根据所述稀疏解以及所输入的所...

【专利技术属性】
技术研发人员：严晗，
申请(专利权)人：中国移动通信集团有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人