一种基于视觉词袋模型的室内场景认知方法技术

技术编号：14938745 阅读：90 留言：0更新日期：2017-04-01 00:37

本发明专利技术属于移动机器人环境感知领域，特别涉及一种基于视觉词袋模型的室内场景认知方法。本发明专利技术包括，离线部分：依据应用需求确定场景类别，机器人利用搭载的RGB‑D传感器扫描各个场景，获得足够多的场景图像组成图像训练集；利用ORB算法生成图像训练集中每一幅图像的ORB 256维描述符，每幅图像通常包含成百上千个ORB矢量等；在线部分：机器人接收到当前场景类别查询指令，系统初始化，准备进行场景查询等。本发明专利技术采用ORB算法完成特征提取与匹配的图像预处理过程，算法快速性得到保证；采用KNN分类器算法提高了场景识别率，可满足移动机器人室内常见场景查询应用需求。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于移动机器人环境感知领域，特别涉及一种基于视觉词袋模型的室内场景认知方法。
技术介绍
通常情况下，栅格地图可满足机器人对导航、避障任务的底层需求，然而对于完成诸如人机交互和任务规划一类的高层任务，还需要获取关于场景认知的语义信息，创建面向认知的语义地图。移动机器人在室内场景中移动，不知晓自身所在位置属于客厅、厨房抑或是卧室，则不能完成类似于为人类到厨房的冰箱里取瓶矿泉水这样的高智能任务了。
技术实现思路
本专利技术的目的在于提出一种基于视觉词袋模型的室内场景认知方法。本专利技术的目的是这样实现的：本专利技术包括离线和在线两个部分，具体步骤如下：离线部分：(1)依据应用需求确定场景类别，机器人利用搭载的RGB-D传感器扫描各个场景，获得足够多的场景图像组成图像训练集；(2)利用ORB算法生成图像训练集中每一幅图像的ORB256维描述符，每幅图像通常包含成百上千个ORB矢量；(3)利用K-means聚类算法对图像训练集中ORB特征点进行训练，生成K个类心组成视觉词汇，构造出视觉词典；(4)针对所有图像的ORB特征，计算每一个视觉单词出现的频率和逆频率，通过TF-IDF对频数表添加权重，生成加权的训练集各图像的视觉词袋模型；保存视觉词典和训练集视觉词袋模型就获得了新形式的离线语义地图；在线部分：(5)机器人接收到当前场景类别查询指令，系统初始化，准备进行场景查询；(6)机器人利用其搭载的摄像机获取当前场景的RGB图像，并采用ORB算法检测并提取特征点集；(7)查询语义地图数据库，比对视觉词典，生成当前场景图像的加权视觉词袋模型；(8)采用KNN分类器将...
一种基于视觉词袋模型的室内场景认知方法

【技术保护点】
一种基于视觉词袋模型的室内场景认知方法，其特征在于，包括离线和在线两个部分，具体步骤如下：离线部分：(1)依据应用需求确定场景类别，机器人利用搭载的RGB‑D传感器扫描各个场景，获得足够多的场景图像组成图像训练集；(2)利用ORB算法生成图像训练集中每一幅图像的ORB 256维描述符，每幅图像通常包含成百上千个ORB矢量；(3)利用K‑means聚类算法对图像训练集中ORB特征点进行训练，生成K个类心组成视觉词汇，构造出视觉词典；(4)针对所有图像的ORB特征，计算每一个视觉单词出现的频率和逆频率，通过TF‑IDF对频数表添加权重，生成加权的训练集各图像的视觉词袋模型；保存视觉词典和训练集视觉词袋模型就获得了新形式的离线语义地图；在线部分：(5)机器人接收到当前场景类别查询指令，系统初始化，准备进行场景查询；(6)机器人利用其搭载的摄像机获取当前场景的RGB图像，并采用ORB算法检测并提取特征点集；(7)查询语义地图数据库，比对视觉词典，生成当前场景图像的加权视觉词袋模型；(8)采用KNN分类器将当前场景图像的视觉词袋模型与语义地图数据库训练集视觉词袋模型对比，最终确定当前场景类别，并返回查询结果。...

【技术特征摘要】
1.一种基于视觉词袋模型的室内场景认知方法，其特征在于，包括离线和在线两个部分，具体步骤如下：离线部分：(1)依据应用需求确定场景类别，机器人利用搭载的RGB-D传感器扫描各个场景，获得足够多的场景图像组成图像训练集；(2)利用ORB算法生成图像训练集中每一幅图像的ORB256维描述符，每幅图像通常包含成百上千个ORB矢量；(3)利用K-means聚类算法对图像训练集中ORB特征点进行训练，生成K个类心组成视觉词汇，构造出视觉词典；(4)针对所有图像的ORB特征，计算每一个视觉单词出现的频率和逆频率，通过TF-IDF对频数表添加权重，生成加权的训练集各图像的视觉词袋模型；保存视觉词典和训练集视觉词袋模型就获得了新形式的离线语义地图；在线部分：(5)机器人接收到当前场景类别查询指令，系统初始化，准备进行场景查询；(6)机器人利用其搭载的摄像机获取当前场景的RGB图像，并采用ORB算法检测并提取特征点集；(7)查询语义地图数据库，比对视觉词典，生成当前场景图像的加权视觉词袋模型；(8)采用KNN分类器将当前场景图像的视觉词袋模型与语义地图数据库训练...

【专利技术属性】
技术研发人员：赵玉新，李亚宾，刘厂，雷宇宁，
申请(专利权)人：哈尔滨工程大学，
类型：发明
国别省市：黑龙江;23

全部详细技术资料下载我是这个专利的主人