当前位置: 首页 > 专利查询>重庆大学专利>正文

一种面向服务机器人的室内场景图像分类方法技术

技术编号:11808939 阅读:131 留言:0更新日期:2015-08-01 01:01
本发明专利技术公开了一种面向服务机器人的室内场景图像分类方法,属于场景分类技术领域。本发明专利技术所述的室内场景图像分类方法包括以下步骤:步骤一:从先验场景图像库中选取训练样本;步骤二:对训练样本进行预处理;步骤三:训练基于最大可分性(MSD)的稀疏自编码(SAE)模型;步骤四:对训练样本进行提取特征得到特征向量;步骤五:利用均值池化对特征向量降维;步骤六:结合遗传免疫粒子群算法(GA-PSO)训练支持向量机(SVM)得到其参数;步骤七:利用训练好的SAE模型和SVM对新采集到的场景图像完成分类。采用本发明专利技术所述的室内场景分类方法能够实现复杂室内环境中的场景分类,从而服务机器人可以根据采集到的场景图像提供更多更准确的服务。

【技术实现步骤摘要】

本专利技术实施涉及图像处理技术,尤其涉及一种面向服务机器人的室内场景图像分 类方法。
技术介绍
随着计算机和机器人学的发展,现代机器人已经不仅仅在工业制造方面,而且期 待能在农业、林业、军事、医疗、文娱、家用、科学研宄等许多方面得到广泛的应用。对于家庭 服务、患者看护、办公事务等高级工作而言,越来越多种类的移动服务机器人被开发和投入 使用。随着研宄的深入,人们对移动服务机器人在运动过程中能根据周围环境的变化而自 助采取相应措施的能力也越来越强。移动服务机器人要达到自主导航、智能行进的目的,必 须实时准确地获知周围信息,感知所处环境,即如何对场景图像正确分类。对服务机器人而 言,要实现其对室内场景图像的分类,要解决四个基本问题: 1.用哪种图像特征来有效的描述图像,这涉及到特征提取问题; 2.用哪种图像分割的方式,对图像的字块或像素进行有效的识别,这个涉及到不 同信息的融合问题; 3.用哪种机器学习方法来有效地构建识别模型,涉及到分类器设计和选取问题; 4.场景的同义性问题,即不同场景图像之间存在相似性,相同场景的不同图片之 间存在一定的差异性。 现阶段的场景分类问题,有两个关键的组成部分:1)场景的描述与表示;2)利用 场景表示来学习语义类别模型。比较流行的方法有视觉词袋模型(BoW)和基于空间金字塔 匹配(SPM)法。BoW模型把一幅图像看作是由一组视觉词汇(VisualWord)组成的文档,其 首先提取图像的兴趣点,然后来构建视觉词典(Codebook),接着利用视觉词典对图像的低 级特征(如兴趣点)进行向量量化,进而统计整幅图像的视觉词汇的直方图分布信息,最后 通常采用SVM分类器完成场景分类任务。 尽管BoW方法在场景分类中取得了较好的效果,但它忽略了局部的图像块的位置 信息,是一种无序的特征表示。而SPM方法对一幅图像在不同尺度上采用不同精细程度的 划分,然后将各个尺度上所得到的统计直方图和串联起来表示图像场景特征。这种改进考 虑了图像关键点的位置信息,从而使得场景图像分类的精度取得了较大的提升。但此方法 也存在一个缺陷,其在视觉词典生成中采用了K-Means聚类的方法,由于K-Means是一种硬 聚类(HardClustering)策略,并且在向量量化中每个描述子只属于一个聚类中心,故带来 了较大的量化误差,进而导致比较严重的信息损失。 本专利技术针对上面的问题1,问题3和问题4,提出一种面向服务机器人的场景图像 分类方法,利用基于MSD约束下的SAE来进行特征提取,并用到均值池化的降维方法,结合 遗传粒子群算法来优化SVM进行分类。能够有效解决BoW方法和SPM方法出现的问题,同 时考虑到场景图像之间的同义性问题,大大提高室内场景图像分类的准确率,从而使服务 机器人在场景理解方面具有更大的优势。
技术实现思路
为达到解决上述问题的目的,本专利技术提供一种面向服务机器人的室内场景图像分 类方法,尤其是基于最大可分性(MSD)约束下的稀疏自编码(SAE)场景图像分类的方法。 本专利技术适用于多种室内场景图像的分类问题。具体步骤为:对场景图像进行白化 等预处理,得到像素值在之间的图像块。将预处理过的图像数据输入到基于MSD约 束的SAE网络中,训练得到该模型的参数。然后将源图像输入到训练好的SAE中,结合卷积 的思想对源图像进行特征提取,最终学习得到原始图像的抽象特征向量。为了便于分类,对 此向量进行均值池化处理,得到原始输入的较低维数的特征向量。将经过降维处理的特征 向量输入到"一对一"的SVM分类器中,并采用GA-PSO算法优化其参数。当采集到新的图 像样本时,重复上面预处理、特征提取、卷积和均值池化步骤,并用已经训练好的SVM对其 进行分类。这种方法能够取得较高的分类准确率。 本专利技术的面向服务机器人室内场景图像分类方法的大致流程如图2所示: 步骤1 :图像预处理。本专利技术训练所采用的样本图像来自包含90种室内场景的先 验图像库,随机选择每个场景类别的100幅图像,并进行预处理操作;即对图像进行去除噪 声处理,提取图像边缘。选择合适的算子,使后续处理建立在较为准确的基础之上。 步骤2 :训练基于MSD约束的SAE模型。将预处理过后的场景图像数据输入到该 SAE模型中,训练的得到模型的参数; 步骤3 :然后将原图像输入到训练好的SAE中,结合卷积的思想,经过逐层特征提 取,得到原始输入的高维完备特征; 步骤4 :对特征向量进行均值池化处理。由于步骤3中提取到的特征维数较高,不 利于后面的分类,因此采用特征卷积和均值池化的方法对其进行降维处理,得到原始输入 图像的较低维数的特征向量; 步骤5 :确定SVM模型的参数。利用基于遗传免疫的粒子群算法优化并确定SVM分 类器的参数:核函数参数r、惩罚参数c; 具体流程为: 步骤5. 1本专利技术选择RBF作为SVM的核函数,SVM需要优化核函数参数r、惩罚参 数c〇 步骤5. 2初始化学习因子、惯性权重以及最大迭代次数。 步骤5. 3计算个体的适应度值。计算每个个体的适应度的值,同时分别用一个变 量把每个个体的当前二进制编码保留下来。从第二次迭代开始,如果产生的新个体的适应 度比前一次保留的个体的适应度值小,则把新个体存储在变量中并替换前一代的个体。这 样就保证了每个个体的历史最优解被保留下来。并且把每一代的最优解也用单独的变量保 留下来,为步骤5. 5做准备。 步骤5当前第1页1 2 本文档来自技高网
...

【技术保护点】
一种面向服务机器人的室内场景图像分类方法,分为离线训练和在线分类两步来进行,具体步骤如下:1.1离线训练:1)在先验场景图像库中随机选择每类场景的100幅图像;2)将取到的图像转换成一定大小和数量的图像块,并对其进行白化等预处理;3)将预处理后的数据输入到基于最大可分性(MSD)约束的稀疏自编码(SAE)模型中,训练该模型,得到相应参数;4)将训练图像和测试图像输入到训练好的SAE中,并结合卷积的思想,对输入逐层特征提取,得到原图像的特征向量;5)上述步骤4)提取到的特征具有较高维数,不利于后面的分类,因此采用均值池化的方法对其进行降维处理,得到较低维数的训练图像的特征向量;6)将特征向量输入到“一对一”的SVM分类器中,并结合GA‑PSO算法,确定SVM的各参数值;1.2在线分类:a.当采集模块采集到新的场景图像时,可利用训练好的SAE模型对新的样本重复上述步骤2)到步骤4),得到新样本的一组一定维数的特征向量;b.将新的特征向量输入到步骤5)中训练好的SVM模型中,可直接对新的图像样本进行分类。

【技术特征摘要】

【专利技术属性】
技术研发人员:尹宏鹏柴毅李艺焦旭国
申请(专利权)人:重庆大学
类型:发明
国别省市:重庆;85

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1