一种基于多通道字典的物体识别方法技术

技术编号:18084645 阅读:43 留言:0更新日期:2018-05-31 12:58
本发明专利技术涉及一种基于多通道字典的物体识别方法,其首先获取多通道字典,并基于该多通道字典构建多通道字典算法,然后采用该躲到字典算法构建物体特征模型,最后基于多通道字典算法和物体特征模型进行物体识别。本发明专利技术多通道字典学习具有更好的适应性,可以学的更多的特征信息,提高物体识别的准确率;本发明专利技术的物体识别方法在块链接特征基础上进行,采用块链接特征进一步提高了物体识别的准确率,而且本发明专利技术在块链接特征基础上再次学习多通道字典,获得物体更为抽象的特征,或者说提取更多的泛化特征,同时增加物体类别间的差异性,从而提高物体识别的准确率。

【技术实现步骤摘要】
一种基于多通道字典的物体识别方法
本专利技术涉及物体识别领域,具体涉及一种基于多通道字典的物体识别方法。
技术介绍
基于RGB-D信息的物体识别在计算机视觉和机器视觉领域是一个很重要的课题,并且有了相关应用比如人脸识别,手势识别,文字识别和车辆识别。HMP(HierarchicalMatchingPersuit)算法是一种高效的基于RGB-D(红色,绿色,蓝色,深度)等信息的物体识别算法,但是HMP算法有在特征信息的获取和算法的结构上有一定的局限性:第一,HMP算法将RGB三种颜色特征训练成一个字典,这样会导致一部分特征信息的损失,这些特征信息指角点,形状,梯度和纹理等,使得物体识别的准确率低。
技术实现思路
针对上述问题,本专利技术的目的在于提供一种基于多通道字典的物体识别方法,以提高对物体识别的准确率。为实现上述目的,本专利技术采用的技术方案是:一种基于多通道字典的物体识别方法,其包括以下步骤:步骤1、获取多通道字典对RGB-D数据库中的图片进行采样,采样时对红色、绿色、蓝色三个通道进行独立采样;然后设定初始字典,根据采样信息得到初始稀疏编码,采用SVD算法进行迭代,不断缩小样本值与稀疏编码之间的误差,直到收敛为止,得到多通道字典,即红色字典、绿色字典和蓝色字典;步骤2、构建多通道字典算法步骤2.1、将待识别物体的图像进行多通道字典学习,得到物体图像的其中一个颜色字典,基于该颜色字典,采用omp算法获取相应颜色通道的像素稀疏编码矩阵;步骤2.2、基于稀疏编码矩阵在K*K像素上进行最大池化处理得到单元特征,将M*M个单元特征按列串联起来得到块连接特征,多个块链接特征形成块链接特征矩阵;步骤2.3、将块链接特征矩阵再次学习多通道字典,得到与步骤3中的颜色通道相对应的新颜色字典,基于该新颜色字典,采用omp算法获取该颜色通道的块链接特征矩阵的稀疏编码矩阵;步骤2.4、对块链接特征矩阵的稀疏编码矩阵进行简化的金字塔池化处理得到相应颜色通道的图像级别特征;其中,金字塔将块链接特征矩阵划分为三层,第一层将块链接特征矩阵划分为1*1个子区域,第二层将块链接特征矩阵划分为2*2个子区域,第三层将块链接特征矩阵划分为3*3个子区域,共14个子区域;然后对每个子区域的块链接特征进行最大池化处理,得到子区域特征,将每个子区域特征按列串联得到相应通道的图像级别特征;步骤2.5、重复步骤2.1至步骤2.4,获取其他两个颜色通道的图像级别特征,然后将三个颜色通道即红色通道、绿色通道和蓝色通道的图像级别特征按列串联起来形成物体的图像特征;步骤3、构建物体特征模型将从RGB-Dobject数据库的每一类物体中随机选择一个物体的所有图片作为测试集,其他的都作为训练集;采用步骤2中的多通道字典算法对测试集和训练集中的图片进行处理,得到测试集的图像特征和训练集的图像特征,将训练集的图像特征通过linear-SVM分类器进行训练得到物体特征模型;然后采用测试集的图像特征与物体特征模型比较计算准确率并得到最后的分类结果;步骤4、物体识别将待识别物体通过步骤2中的多通道字典学习算法获取带识别物体的图像特征,将该待识别物体的图像特征与步骤3中的物体特征模型进行比较,得到识别结果。所述块链接特征的尺寸为4,即M等于4。采用上述方案后,本专利技术将待识别物体图像进行RGB多通道字典学习,得到三个颜色通道的像素稀疏编码矩阵,对稀疏编码矩阵进行最大池化处理得到块链接特征矩阵,将块链接特征矩阵进行多通道字典学习获取三个颜色通道的稀疏编码矩阵,将然后对块链接特征矩阵的稀疏编码矩阵进行简化的金字塔池化处理得到物体图像特征;将该物体图像特征与训练好的特征模型进行匹配,得出物体识别结果。本专利技术多通道字典学习具有更好的适应性,可以学的更多的特征信息,提高物体识别的准确率;本专利技术的物体识别方法在块链接特征基础上进行,采用块链接特征进一步提高了物体识别的准确率,而且本专利技术在块链接特征基础上再次学习多通道字典,获得物体更为抽象的特征,或者说提取更多的泛化特征,同时增加物体类别间的差异性,从而提高物体识别的准确率。附图说明图1为本专利技术多通道字典算法流程图;图2为本专利技术多通道字典示意图;图3为本专利技术块链接特征计算示意图;图4为本专利技术块链接特征矩阵进行多通道字典学习示意图;图5为本专利技术块链接特征的金字塔池化处理示意图;图6为为本专利技术基于不同块链接特征尺寸的物体识别准确率对比图。具体实施方式参照图1至图6所示,本专利技术揭示了一种基于多通道字典的物体识别方法,其包括以下步骤:步骤1、对RGB-D数据库中的图片进行采样,采样时对红色、绿色、蓝色三个通道进行独立采样。首先设定初始字典,再根据采样信息得到初始稀疏编码,然后采用SVD算法进行迭代,不断缩小样本值与稀疏编码之间的误差,直到收敛为止,得到多通道字典,即红色字典、绿色字典和蓝色字典。其中,Y代表样本矩阵,X代表对应的稀疏编码矩阵,D是学得的多通道字典,||.||F代表F范数,||.||2代表每个字的二范数等于1,||.||0代表每个稀疏编码的稀疏度。优化目标函数,可以得到最终的误差最小的多通道字典。步骤2、构建多通道字典算法步骤2.1、将待识别物体的图像进行多通道字典学习,得到物体图像的其中一个颜色字典,基于该颜色字典,采用omp算法获取相应颜色通道的像素稀疏编码矩阵;步骤2.2、基于稀疏编码矩阵在K*K像素上进行最大池化处理得到单元特征,将M*M个单元特征按列串联起来得到块连接特征,多个块链接特征形成块链接特征矩阵;步骤2.3、将块链接特征矩阵再次学习多通道字典,得到与步骤3中的颜色通道相对应的新颜色字典,基于该新颜色字典,采用omp算法获取该颜色通道的块链接特征矩阵的稀疏编码矩阵;步骤2.4、对块链接特征矩阵的稀疏编码矩阵进行简化的金字塔池化处理得到相应颜色通道的图像级别特征;其中,金字塔将块链接特征矩阵划分为三层,第一层将块链接特征矩阵划分为1*1个子区域,第二层将块链接特征矩阵划分为2*2个子区域,第三层将块链接特征矩阵划分为3*3个子区域,共14个子区域;然后对每个子区域的块链接特征进行最大池化处理,得到子区域特征,将每个子区域特征按列串联得到相应通道的图像级别特征;步骤2.5、重复步骤2.1至步骤2.4,获取其他两个颜色通道的图像级别特征,然后将三个颜色通道即红色通道、绿色通道和蓝色通道的图像级别特征按列串联起来形成物体的图像特征;步骤3、构建物体特征模型将从RGB-Dobject数据库的每一类物体中随机选择一个物体的所有图片作为测试集,其他的都作为训练集;采用步骤2中的多通道字典算法对测试集和训练集中的图片进行处理,得到测试集的图像特征和训练集的图像特征,将训练集的图像特征通过linear-SVM分类器进行训练得到物体特征模型;然后采用测试集的图像特征与物体特征模型比较计算准确率并得到最后的分类结果;步骤4、物体识别将待识别物体通过步骤2中的多通道字典学习算法获取带识别物体的图像特征,将该待识别物体的图像特征与步骤3中的物体特征模型进行比较,得到识别结果。下面对多通道字典算法进行详述,以详尽本
技术实现思路
。在构建多通道字典算法时,首先,将物体的图像进行多通道字典学习,得到物体图像的红色字典,基于红色字典采用omp算法获取红本文档来自技高网
...
一种基于多通道字典的物体识别方法

【技术保护点】
一种基于多通道字典的物体识别方法,其特征在于:包括以下步骤:步骤1、获取多通道字典对RGB‑D数据库中的图片进行采样,采样时对红色、绿色、蓝色三个通道进行独立采样;然后设定初始字典,根据采样信息得到初始稀疏编码,采用SVD算法进行迭代,不断缩小样本值与稀疏编码之间的误差,直到收敛为止,得到多通道字典,即红色字典、绿色字典和蓝色字典;步骤2、构建多通道字典算法步骤2.1、将待识别物体的图像进行多通道字典学习,得到物体图像的其中一个颜色字典,基于该颜色字典,采用omp算法获取相应颜色通道的像素稀疏编码矩阵;步骤2.2、基于稀疏编码矩阵在K*K像素上进行最大池化处理得到单元特征,将M*M个单元特征按列串联起来得到块连接特征,多个块链接特征形成块链接特征矩阵;步骤2.3、将块链接特征矩阵再次学习多通道字典,得到与步骤3中的颜色通道相对应的新颜色字典,基于该新颜色字典,采用omp算法获取该颜色通道的块链接特征矩阵的稀疏编码矩阵;步骤2.4、对块链接特征矩阵的稀疏编码矩阵进行简化的金字塔池化处理得到相应颜色通道的图像级别特征;其中,金字塔将块链接特征矩阵划分为三层,第一层将块链接特征矩阵划分为1*1个子区域,第二层将块链接特征矩阵划分为2*2个子区域,第三层将块链接特征矩阵划分为3*3个子区域,共14个子区域;然后对每个子区域的块链接特征进行最大池化处理,得到子区域特征,将每个子区域特征按列串联得到相应通道的图像级别特征;步骤2.5、重复步骤2.1至步骤2.4,获取其他两个颜色通道的图像级别特征,然后将三个颜色通道即红色通道、绿色通道和蓝色通道的图像级别特征按列串联起来形成物体的图像特征;步骤3、构建物体特征模型将从RGB‑D object数据库的每一类物体中随机选择一个物体的所有图片作为测试集,其他的都作为训练集;采用步骤2中的多通道字典算法对测试集和训练集中的图片进行处理,得到测试集的图像特征和训练集的图像特征,将训练集的图像特征通过linear‑SVM分类器进行训练得到物体特征模型;然后采用测试集的图像特征与物体特征模型比较计算准确率并得到最后的分类结果;步骤4、物体识别将待识别物体通过步骤2中的多通道字典学习算法获取带识别物体的图像特征,将该待识别物体的图像特征与步骤3中的物体特征模型进行比较,得到识别结果。...

【技术特征摘要】
1.一种基于多通道字典的物体识别方法,其特征在于:包括以下步骤:步骤1、获取多通道字典对RGB-D数据库中的图片进行采样,采样时对红色、绿色、蓝色三个通道进行独立采样;然后设定初始字典,根据采样信息得到初始稀疏编码,采用SVD算法进行迭代,不断缩小样本值与稀疏编码之间的误差,直到收敛为止,得到多通道字典,即红色字典、绿色字典和蓝色字典;步骤2、构建多通道字典算法步骤2.1、将待识别物体的图像进行多通道字典学习,得到物体图像的其中一个颜色字典,基于该颜色字典,采用omp算法获取相应颜色通道的像素稀疏编码矩阵;步骤2.2、基于稀疏编码矩阵在K*K像素上进行最大池化处理得到单元特征,将M*M个单元特征按列串联起来得到块连接特征,多个块链接特征形成块链接特征矩阵;步骤2.3、将块链接特征矩阵再次学习多通道字典,得到与步骤3中的颜色通道相对应的新颜色字典,基于该新颜色字典,采用omp算法获取该颜色通道的块链接特征矩阵的稀疏编码矩阵;步骤2.4、对块链接特征矩阵的稀疏编码矩阵进行简化的金字塔池化处理得到相应颜色通道的图像级别特征;其中,金字塔将块链接特征矩阵划分为三层,第一层将块链接特征矩阵划分为1*1个子区域,第二层...

【专利技术属性】
技术研发人员:李俊李琦铭兰晓东
申请(专利权)人:泉州装备制造研究所
类型:发明
国别省市:福建,35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1