【技术实现步骤摘要】
本专利技术属于互联网社群图像标签处理领域,涉及一种利用现有数据库(NS-WIDE)图像与对应的标签列表基于WordNet语义相似度的多特征图像标签排序方法。
技术介绍
随着互联网技术的不断发展,尤其是web2.0的快速发展,我们步入了信息化时代。同时社交网络的数量也在不断增多,而其中最具代表性的社交媒体网站有Facebook,Google的视频分享网站YouTube以及Yahoo的社交图像分享网站Flicker。这一类的社交网站都允许网络用户自行上传图像或者视频,用户可以通过关键字对图像的内容、时间、地点等信息进行标注,这些标注的信息被称为“标签(Tag)”,而为媒体添加关键字标签的过程被称为“Tagging”。由于大部分网络用户没有受过专门的媒体信息标注训练,同时也受到其个人的文化背景、个人因素等影响,故图像存在标注信息与图像本身相关度不大等问题,并且标签的相关性、重要性等方面不能够由现有的标签次序所反映。为解决这个问题,近些年来大量的学者对此问题进行了研究,目前已有的对图像标签排序办法大致可以分为两类:一、基于全局特征的标签处理办法,即利用图像的全局特征对标签进行处理。二、利用显著图特征进行图像标签排序处理,此种方法首先必须从各图像提取相应的显著图,然后利用图像显著图特征找到k个最近邻显著图像,最后使用这k个图像的标签对目标图像的标签的相关性进行投票。上述两类方法在很大程度上都将标签改善与标签排序分为两个不同的研究内 ...
【技术保护点】
基于WordNet语义相似度的多特征图像标签排序方法,其特征在于包括以下步骤:步骤1,建立训练样本库;利用现有的数据库NS?WIDE中的图像建立一个专门应用于SVM线性分类器训练的样本图像库,包括场景类图像和对象类图像;步骤2,提取样本库中图像的显著性区域图;步骤2.1,获取初级视觉特征;利用现有的Itti模型原理方法,通过计算中央周边差分采样,分别得到亮度、颜色和方向特征图N(I)、N(C)和N(O),并将三种特征图组合成显著性区域图S;S=α*N(I)+β*N(C)+γ*N(O)其中,N(·)为归一化函数,α、β和γ分别代表亮度、颜色和方向特征图的权值系数;步骤2.2,基于人脑过滤冗余信息机制过滤冗余噪声信息;步骤2.3,通过禁止返回的检测机制、就近转移的原则和注意尺寸的确定实现焦点的注意和转移;步骤3,训练SVM分类器;步骤3.1,获取显著性区域图的灰度直方图特征;分别提取对象类和场景类图像的显著性区域直方图特征Object_Bw_SaliencyMap{O1,O2,O3,…,Om}和Sense_Bw_SaliencyMap{S1,S2,S3,…,Sn};对象类、场景类图像灰度直 ...
【技术特征摘要】
1.基于WordNet语义相似度的多特征图像标签排序方法,其特征在于包括以下步骤:
步骤1,建立训练样本库;
利用现有的数据库NS-WIDE中的图像建立一个专门应用于SVM线性分类器训练的样本
图像库,包括场景类图像和对象类图像;
步骤2,提取样本库中图像的显著性区域图;
步骤2.1,获取初级视觉特征;
利用现有的Itti模型原理方法,通过计算中央周边差分采样,分别得到亮度、颜色和方向
特征图N(I)、N(C)和N(O),并将三种特征图组合成显著性区域图S;
S=...
【专利技术属性】
技术研发人员:刘宏哲,袁家政,吴焰樟,王棚飞,
申请(专利权)人:北京联合大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。