一种基于因子图模型的图片中对象识别方法技术

技术编号:10742457 阅读:92 留言:0更新日期:2014-12-10 15:41
本发明专利技术提供一种基于因子图模型的图片中对象识别方法,包括对训练集中每张图片分别进行图像分块,提取各图像块的SIFT特征向量,得到图片的SIFT特征向量集,确定各图像块对应的标签,图像块的标签为正时表示对象存在于该图像块中;训练集中所有图片的SIFT特征向量集组成集合,基于该集合利用聚类算法,计算SIFT特征向量词典;针对训练集中的每张图片,分别构建因子图模型;进行因子图模型参数学习,采用测试集验证学习所得因子图模型参数,验证成功则根据因子图模型参数对任意待识别的图片进行对象识别。本发明专利技术可提高复杂图像背景下对象识别的准确度。

【技术实现步骤摘要】
一种基于因子图模型的图片中对象识别方法
本专利技术涉及多媒体处理与模式识别
,尤其涉及一种基于因子图模型的图片中对象识别方法。
技术介绍
图片中对象识别主要判断对象所处位置和范围,是视觉识别的一类重要问题。视觉识别的困难主要来自两点[1]:一是过大的搜索空间,即在不同位置和范围上搜索对象,计算复杂度很高;二是由于角度、姿态或光照条件变化,对物体外形进行有效建模比较困难。近年来出现的词袋方法(Bag-of-Words)[2]显示了基于图像块思路的有效性,将图像局部特征编码为视觉单词的做法得到了广泛认可。该思路在图像块层次上,通过视觉词典来表征物体外形,是一种稀疏表示方法,在一定程度上降低了学习算法在参数空间上的搜索复杂度。同时,该思路还能够有机地结合一些图像特征,如SIFT、HOG和LBP等局部特征,从而提高了物体外形建模效果。词袋方法的性能依赖于词典和特征编码策略。目前已经出现了将稀疏编码、向量量化编码、核词典编码、显著性编码等运用在视觉识别中的编码技术,并且有将编码和分类技术结合起来以训练面向任务的词典相关研究。但是,与文字识别、人脸识别等研究相比,在复杂图像背景下,研究面向物体识别具体任务进行词典学习的工作才刚刚起步[3]。为提高复杂图像背景下物体识别的效果,可以采用多种方法。典型的思路就是使用图像局部关联信息,由于图像块之间具有关联性,将这种关联性建模到物体识别中将会有所帮助,开创性的工作为S.Kumar等将条件随机场(CRF)模型[4]扩展到2维格形结构之后运用到图像分析中[5][6]。在基于CRF模型的词典学习中,以每一个图像块作为节点,图像块形成的格状网络作为连边关系[3][4]。这种建模方法,图像块(CRF模型中对应节点)之间的关联性主要以格状网络表达,这其实是一种只考虑物理距离关联性的方法。这种假设不完全合理,因为在一张图片中,常常会在不同区域同时出现同一类物体,而这些物体可能邻接,也可能会被背景分离。由于格状网络只能表征邻接特征,对于被背景分开的物体之间的关联性,则难以表征。因此,必须更加充分地考虑图像块之间的连边关系,比如不同图像块之间的相似性,并且将此相似性也作为建模中的重要因素考虑进去,即当一个图像块中存在(或不存在)对象时,与之相似的图像块中存在(或不存在)对象的概率应该相应增加。为了实现这种建模,本专利技术使用因子图模型[7][8][9],全面地表征图像块之间的相互影响以及图像块自身特征与对象之间的关系。文中涉及的参考文献如下:[1]黄凯奇,任伟强,谭铁牛.图像物体分类与检测算法综述[J].计算机学报,2014,37(6):1225-1240.[2]胡事民,张方略,汪淼.片网:图像表示的一种新技术[J].中国计算机学会通讯,2014,(10)1:54-59.[3]YangJMandYangMH.Top-DownVisualSaliencyviaJointCRFandDictionaryLearning[C].InProceedingsoftheIEEEConferenceonComputerVisionandPatternRecognition,Providence,June,2012,pp.2296-2303.[4]Lafferty.ConditionalRandomFields:ProbabilisticModelsforSegmentingandLabelingSequenceData[C].InProceedingsofthe18thInternationalConferenceonMachineLearning(ICML),2001,pp.282-289.[5]KumarSandHebertM.Discriminativerandomfields[J].InternationalJournalofComputerVision,68(2):179-201.[6]QuattoniA,CollinsM,DarrellT.ConditionalRandomFieldsforObjectRecognition[C].InAdvancesinNeuralInformationProcessingSystems,2005,pp.1097-1104.[7]KschischangFR,FreyBJandLoeligerHA.Factorgraphsandthesum-productalgorithm[J].IEEETransactionsonInformationTheory,47(2):498-59,2001.[8]WangC,TangJandSunJM,etal.Dynamicsocialinfluenceanalysisthroughtime-dependentfactorgraphs[C].InProceedingsoftheInternationalConferenceonAdvancesinSocialNetworksAnalysisandMining(ASONAM),Kaohsiung:2011.[9]TanC,TangJandSunJ,etal.Socialactiontrackingvianoisetoleranttime-varyingfactorgraphs[C].InProceedingsofthe16thACMSIGKDDInternationalConferenceonKnowledgeDiscoveryandDatamining(KDD),Washington:2010.
技术实现思路
针对上述存在的技术问题,本专利技术目的是提供一种基于因子图模型的图片中对象识别的方法。使用因子图模型,能够考察图像块之间关联性对参数学习结果的影响,可以更好地利用局部信息,提高复杂图像背景下对象识别的准确度。为达到上述目的,本专利技术采用如下的技术方案:一种基于因子图模型的图片中对象识别方法,包括以下步骤:步骤1,输入训练集,对训练集中每张图片分别进行图像分块,提取各图像块的SIFT特征向量,得到图片的SIFT特征向量集,确定各图像块对应的标签,图像块的标签为正时表示对象存在于该图像块中;步骤2,训练集中所有图片的SIFT特征向量集组成集合,基于该集合利用聚类算法,计算SIFT特征向量词典;步骤3,针对训练集中的每张图片,分别构建因子图模型;步骤4,进行因子图模型参数学习,包括以下子步骤,步骤4.1,运行线性支持向量机,得到因子图模型参数的初始值;步骤4.2,基于训练集中的所有图片,结合梯度下降算法和信念传播算法学习因子图模型参数;步骤4.3,判断步骤4.2所得因子图模型参数取值是否收敛,若是则得到参数学习结果,进入步骤5,若否,判断当前是否达到预设的迭代次数,未达到则返回迭代步骤4.2,达到则将本次执行步骤4.2所得因子图模型参数作为参数学习结果,进入步骤5;步骤5,采用测试集验证步骤4学习所得因子图模型参数,验证成功则根据因子图模型参数对任意待识别的图片进行对象识别,验证包括以下子步骤,步骤5.1,构建测试集中每张图片的因子图模型;步骤5.2,基于步骤5.1所得因子图模型和步骤4学习所得因子图模型参数,使用信念传播算法,计算测试集中每张图片各图像块对应的标签预测结果本文档来自技高网
...
一种基于因子图模型的图片中对象识别方法

【技术保护点】
一种基于因子图模型的图片中对象识别方法,其特征在于,包括以下步骤:步骤1,输入训练集,对训练集中每张图片分别进行图像分块,提取各图像块的SIFT特征向量,得到图片的SIFT特征向量集,确定各图像块对应的标签,图像块的标签为正时表示对象存在于该图像块中;步骤2,训练集中所有图片的SIFT特征向量集组成集合,基于该集合利用聚类算法,计算SIFT特征向量词典;步骤3,针对训练集中的每张图片,分别构建因子图模型;步骤4,进行因子图模型参数学习,包括以下子步骤,步骤4.1,运行线性支持向量机,得到因子图模型参数的初始值;步骤4.2,基于训练集中的所有图片,结合梯度下降算法和信念传播算法学习因子图模型参数;步骤4.3,判断步骤4.2所得因子图模型参数取值是否收敛,若是则得到参数学习结果,进入步骤5,若否则判断当前是否达到预设的训练集迭代次数,未达到则返回迭代步骤4.2,达到则将本次执行步骤4.2所得因子图模型参数作为参数学习结果,进入步骤5;步骤5,采用测试集验证步骤4学习所得因子图模型参数,验证成功则根据因子图模型参数对任意待识别的图片进行对象识别,验证包括以下子步骤,步骤5.1,构建测试集中每张图片的因子图模型;步骤5.2,基于步骤5.1所得因子图模型和步骤4学习所得因子图模型参数,使用信念传播算法,计算测试集中每张图片各图像块对应的标签预测结果;步骤5.3,确定测试集中图片各图像块的标签,判断步骤5.2得到的标签预测结果与标签之间的查准率和查全率,若在预设的接受范围,验证通过。...

【技术特征摘要】
1.一种基于因子图模型的图片中对象识别方法,其特征在于,包括以下步骤:步骤1,输入训练集,对训练集中每张图片分别进行图像分块,提取各图像块的SIFT特征向量,得到图片的SIFT特征向量集,确定各图像块对应的标签,图像块的标签为正时表示对象存在于该图像块中;步骤2,训练集中所有图片的SIFT特征向量集组成集合,基于该集合利用聚类算法,计算SIFT特征向量词典;步骤3,针对训练集中的每张图片,分别构建因子图模型;步骤4,进行因子图模型参数学习,包括以下子步骤,步骤4.1,运行线性支持向量机,得到因子图模型参数的初始值;步骤4.2,基于训练集中的所有图片,结合梯度下降算法和信念传播算法学习因子图模型参数;步骤4.3,判断步骤4.2所得因子图模型参数取值是否收敛,若是则得到参数学习结果,进入步骤5,若否则判断当前是否达到预设的训练集迭代次数,未达到则返回迭代步骤4.2,达到则将本次执行步骤4.2所得因子图模型参数作为参数学习结果,进入步骤5;步骤5,采用测试集验证步骤4学习所得因子图模型参数,验证成功则根据因子图模型参数对任意待识别的图片进行对象识别,验证包括以下子步骤,步骤5.1,构建测试集中每张图片的因子图...

【专利技术属性】
技术研发人员:吴照林张海粟戴剑伟曾昭文朱明东文峰张胜姚远龚建华张岩冯勤群徐飞王强
申请(专利权)人:中国人民解放军国防信息学院
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1