实现面向图像理解的视觉单词生成和评价的系统及方法技术方案

技术编号：12168450 阅读：89 留言：0更新日期：2015-10-08 02:42

本发明专利技术涉及一种实现面向图像理解的视觉单词生成和评价的系统及方法，其中包括特征提取器，用以提取视频图像的局部特征和全局特征；特征融合器，用以将提取出的局部特征信息和全局特征信息进行融合得到融合特征信息描述矩阵；特征降维器，用以运用主成分分析方法对所述的融合特征信息描述矩阵进行降维处理；视觉词典生成器，用以对降维后的融合特征信息矩阵进行处理生成视觉词典；性能评估器，用以对所述的视觉词典的优劣性进行评价。采用该种结构的实现面向图像理解的视觉单词生成和评价的系统及方法，实现结合局部特在和全局特征，缓解维护灾难问题，计算复杂度更小，能在任意形状的样本空间上聚类且收敛于全局最优解，具有更广泛应用范围。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术设及计算机视觉
，尤其设及计算机视觉单词生成
，具体是指一种。
技术介绍
图像理解的最终目标是给出图像的解释，该些解释可W说明图像所包含内容的意义。图像理解是一个基于知识的过程，需要知识的支持，在对图像进行理解时要充分利用和图像有关的知识，才能实现对图像的正确理解，该是视觉分析的高级语义阶段。如何从低层次的视觉特征描述得到高级语义理解，近来年，词包模型的提出，使得该一问题得到了有效地支持，而视觉词典构建的好坏直接影响了图像内容的分析理解效果。目前传统的视觉字典的构造方法是在提取图像特征例如颜色、纹理等的基础上，将提取的图像特征使用聚类方法，例如K均值化-means)聚类，来构造视觉词典。常用的特征向量包括局部特征；基于梯度直方图的SIFT(尺度不变特征变换）、化OH(梯度位置及方向直方图）等，它们不但具有很强的可区分性，可W区分不同的图像内容，同时也能容忍一定程度的图像噪声与特征检测带来的误差。沈项军等在其申请的专利技术专利"基于D-S证据理论的视觉词典构建方法"中公开了一种基于D-S证据理论的视觉词典构建方法，通过使用D-S 证据理论考察不同特征的视觉相似性并进行特征融合，从而对初始视觉字典进行更进一步的细分，构造出更加有效的视觉词典，提高图像的分类准确率。黄祥林等在其申请的专利技术专利"一种图像检索中视觉单词的提取方法"巧01310159183. 7]中公开了一种图像检索中视觉单词的提取方法，通过对图像库中的局部特征集合进行二值化，得到特征独特性和信息量保持的二值局部特征，在向量空间上...

【技术保护点】
一种实现面向图像理解的视觉单词生成和评价的系统，其特征在于，所述的系统包括：特征提取器，用以提取视频图像的局部特征和全局特征；特征融合器，用以将提取出的局部特征信息和全局特征信息进行融合得到融合特征信息描述矩阵；特征降维器，用以运用主成分分析方法对所述的融合特征信息描述矩阵进行降维处理；视觉词典生成器，用以对降维后的融合特征信息矩阵进行处理生成视觉词典；性能评估器，用以对所述的视觉词典的优劣性进行评价。

【技术特征摘要】

【专利技术属性】
技术研发人员：何莹，王建，钟雪霞，梅林，吴轶轩，尚岩峰，王文斐，
申请(专利权)人：公安部第三研究所，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人