基于WordNet语义相似度的多特征图像标签排序方法技术

技术编号：10075517 阅读：374 留言：0更新日期：2014-05-24 05:14

本发明专利技术涉及一种基于WordNet语义相似度的多特征图像标签排序方法，包括：建立训练样本库，提取样本库中图像的显著性区域图，训练SVM分类器，测试图像标签预处理，判断测试图像的类型，测试图像标签排序。本发明专利技术融合相关性、视觉性、多特征等方法，不仅考虑了场景类图像整幅图像的不同特征，而且考虑了对象类图像显著图的不同特征。在对图像标签进行排序之前，对图像标签的不正确性和标签的不全面性等问题进行改进，提高图像标签与图像内容之间的相关度，以及图像标签的准确性和全面性；本发明专利技术不仅考虑了图像视觉特征之间的相似度，而且考虑了标签文本之间的语义相似度，使图像标签的排序更准确。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于互联网社群图像标签处理领域，涉及一种利用现有数据库（NS-WIDE）图像与对应的标签列表基于WordNet语义相似度的多特征图像标签排序方法。
技术介绍
随着互联网技术的不断发展，尤其是web2.0的快速发展，我们步入了信息化时代。同时社交网络的数量也在不断增多，而其中最具代表性的社交媒体网站有Facebook，Google的视频分享网站YouTube以及Yahoo的社交图像分享网站Flicker。这一类的社交网站都允许网络用户自行上传图像或者视频，用户可以通过关键字对图像的内容、时间、地点等信息进行标注，这些标注的信息被称为“标签（Tag）”，而为媒体添加关键字标签的过程被称为“Tagging”。由于大部分网络用户没有受过专门的媒体信息标注训练，同时也受到其个人的文化背景、个人因素等影响，故图像存在标注信息与图像本身相关度不大等问题，并且标签的相关性、重要性等方面不能够由现有的标签次序所反映。为解决这个问题，近些年来大量的学者对此问题进行了研究，目前已有的对图像标签排序办法大致可以分为两类：一、基于全局特征的标签处理办法，即利用图像的全局特征对标签进行处理。二、利用显著图特征进行图像标签排序处理，此种方法首先必须从各图像提取相应的显著图，然后利用图像显著图特征找到k个最近邻显著图像，最后使用这k个图像的标签对目标图像的标签的相关性进行投票。上述两类方法在很大程度上都将标签改善与标签排序分为两个不同的研究内...
基于WordNet语义相似度的多特征图像标签排序方法

【技术保护点】
基于WordNet语义相似度的多特征图像标签排序方法，其特征在于包括以下步骤：步骤1，建立训练样本库；利用现有的数据库NS?WIDE中的图像建立一个专门应用于SVM线性分类器训练的样本图像库，包括场景类图像和对象类图像；步骤2，提取样本库中图像的显著性区域图；步骤2.1，获取初级视觉特征；利用现有的Itti模型原理方法，通过计算中央周边差分采样，分别得到亮度、颜色和方向特征图N(I)、N(C)和N(O)，并将三种特征图组合成显著性区域图S；S＝α*N(I)+β*N(C)+γ*N(O)其中，N(·)为归一化函数，α、β和γ分别代表亮度、颜色和方向特征图的权值系数；步骤2.2，基于人脑过滤冗余信息机制过滤冗余噪声信息；步骤2.3，通过禁止返回的检测机制、就近转移的原则和注意尺寸的确定实现焦点的注意和转移；步骤3，训练SVM分类器；步骤3.1，获取显著性区域图的灰度直方图特征；分别提取对象类和场景类图像的显著性区域直方图特征Object_Bw_SaliencyMap{O1,O2,O3,…,Om}和Sense_Bw_SaliencyMap{S1,S2,S3,…,Sn}；对象类、场景类图像灰度直...

【技术特征摘要】
1.基于WordNet语义相似度的多特征图像标签排序方法，其特征在于包括以下步骤：
步骤1，建立训练样本库；
利用现有的数据库NS-WIDE中的图像建立一个专门应用于SVM线性分类器训练的样本
图像库，包括场景类图像和对象类图像；
步骤2，提取样本库中图像的显著性区域图；
步骤2.1，获取初级视觉特征；
利用现有的Itti模型原理方法，通过计算中央周边差分采样，分别得到亮度、颜色和方向
特征图N(I)、N(C)和N(O)，并将三种特征图组合成显著性区域图S；
S＝...

【专利技术属性】
技术研发人员：刘宏哲，袁家政，吴焰樟，王棚飞，
申请(专利权)人：北京联合大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人