一种基于因子图模型的图片中对象识别方法技术

技术编号：10742457 阅读：92 留言：0更新日期：2014-12-10 15:41

本发明专利技术提供一种基于因子图模型的图片中对象识别方法，包括对训练集中每张图片分别进行图像分块，提取各图像块的SIFT特征向量，得到图片的SIFT特征向量集，确定各图像块对应的标签，图像块的标签为正时表示对象存在于该图像块中；训练集中所有图片的SIFT特征向量集组成集合，基于该集合利用聚类算法，计算SIFT特征向量词典；针对训练集中的每张图片，分别构建因子图模型；进行因子图模型参数学习，采用测试集验证学习所得因子图模型参数，验证成功则根据因子图模型参数对任意待识别的图片进行对象识别。本发明专利技术可提高复杂图像背景下对象识别的准确度。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于因子图模型的图片中对象识别方法
本专利技术涉及多媒体处理与模式识别
，尤其涉及一种基于因子图模型的图片中对象识别方法。
技术介绍
图片中对象识别主要判断对象所处位置和范围，是视觉识别的一类重要问题。视觉识别的困难主要来自两点[1]：一是过大的搜索空间，即在不同位置和范围上搜索对象，计算复杂度很高；二是由于角度、姿态或光照条件变化，对物体外形进行有效建模比较困难。近年来出现的词袋方法(Bag-of-Words)[2]显示了基于图像块思路的有效性，将图像局部特征编码为视觉单词的做法得到了广泛认可。该思路在图像块层次上，通过视觉词典来表征物体外形，是一种稀疏表示方法，在一定程度上降低了学习算法在参数空间上的搜索复杂度。同时，该思路还能够有机地结合一些图像特征，如SIFT、HOG和LBP等局部特征，从而提高了物体外形建模效果。词袋方法的性能依赖于词典和特征编码策略。目前已经出现了将稀疏编码、向量量化编码、核词典编码、显著性编码等运用在视觉识别中的编码技术，并且有将编码和分类技术结合起来以训练面向任务的词典相关研究。但是，与文字识别、人脸识别等研究相比，在复杂图像背景下，研究面向物体识别具体任务进行词典学习的工作才刚刚起步[3]。为提高复杂图像背景下物体识别的效果，可以采用多种方法。典型的思路就是使用图像局部关联信息，由于图像块之间具有关联性，将这种关联性建模到物体识别中将会有所帮助，开创性的工作为S.Kumar等将条件随机场(CRF)模型[4]扩展到2维格形结构之后运用到图像分析中[5][6]。在基于CRF模型的词典学习中，以每一个图像块作为节点，图...
一种基于因子图模型的图片中对象识别方法

【技术保护点】
一种基于因子图模型的图片中对象识别方法，其特征在于，包括以下步骤：步骤1，输入训练集，对训练集中每张图片分别进行图像分块，提取各图像块的SIFT特征向量，得到图片的SIFT特征向量集，确定各图像块对应的标签，图像块的标签为正时表示对象存在于该图像块中；步骤2，训练集中所有图片的SIFT特征向量集组成集合，基于该集合利用聚类算法，计算SIFT特征向量词典；步骤3，针对训练集中的每张图片，分别构建因子图模型；步骤4，进行因子图模型参数学习，包括以下子步骤，步骤4.1，运行线性支持向量机，得到因子图模型参数的初始值；步骤4.2，基于训练集中的所有图片，结合梯度下降算法和信念传播算法学习因子图模型参数；步骤4.3，判断步骤4.2所得因子图模型参数取值是否收敛，若是则得到参数学习结果，进入步骤5，若否则判断当前是否达到预设的训练集迭代次数，未达到则返回迭代步骤4.2，达到则将本次执行步骤4.2所得因子图模型参数作为参数学习结果，进入步骤5；步骤5，采用测试集验证步骤4学习所得因子图模型参数，验证成功则根据因子图模型参数对任意待识别的图片进行对象识别，验证包括以下子步骤，步骤5.1，构建测试集中每...

【技术特征摘要】
1.一种基于因子图模型的图片中对象识别方法，其特征在于，包括以下步骤：步骤1，输入训练集，对训练集中每张图片分别进行图像分块，提取各图像块的SIFT特征向量，得到图片的SIFT特征向量集，确定各图像块对应的标签，图像块的标签为正时表示对象存在于该图像块中；步骤2，训练集中所有图片的SIFT特征向量集组成集合，基于该集合利用聚类算法，计算SIFT特征向量词典；步骤3，针对训练集中的每张图片，分别构建因子图模型；步骤4，进行因子图模型参数学习，包括以下子步骤，步骤4.1，运行线性支持向量机，得到因子图模型参数的初始值；步骤4.2，基于训练集中的所有图片，结合梯度下降算法和信念传播算法学习因子图模型参数；步骤4.3，判断步骤4.2所得因子图模型参数取值是否收敛，若是则得到参数学习结果，进入步骤5，若否则判断当前是否达到预设的训练集迭代次数，未达到则返回迭代步骤4.2，达到则将本次执行步骤4.2所得因子图模型参数作为参数学习结果，进入步骤5；步骤5，采用测试集验证步骤4学习所得因子图模型参数，验证成功则根据因子图模型参数对任意待识别的图片进行对象识别，验证包括以下子步骤，步骤5.1，构建测试集中每张图片的因子图...

【专利技术属性】
技术研发人员：吴照林，张海粟，戴剑伟，曾昭文，朱明东，文峰，张胜，姚远，龚建华，张岩，冯勤群，徐飞，王强，
申请(专利权)人：中国人民解放军国防信息学院，
类型：发明
国别省市：湖北;42

全部详细技术资料下载我是这个专利的主人