当前位置: 首页 > 专利查询>复旦大学专利>正文

面向社会图像的跨模态图像-标签相关度学习方法技术

技术编号:12030835 阅读:79 留言:0更新日期:2015-09-10 17:33
本发明专利技术属于跨媒体相关性学习技术领域,具体为面向社会图像的跨模态图像-标签相关度学习方法。本发明专利技术包括三个主要算法:多模态特征融合、双向相关度度量、跨模态相关度融合;本发明专利技术以超图为基本模型对整个社会图像数据集来进行描述,并分别将图像和标签映射为超图节点来进行处理,得到针对图像的相关度和针对标签的相关度,进而通过跨模态融合方法来将两种不同的相关度进行融合得到一种更好的相关度。较之于传统方法,本方法准确性高,适应性强。这对于在大规模弱标注的社会图像基础上,考虑多模态语义信息而进行高效社会图像检索具有重要的意义,能够提高检索相关性,增强用户体验,在跨媒体信息检索领域具有广泛的应用价值。

【技术实现步骤摘要】

本专利技术属于跨媒体相关性学习
,具体涉及面向社会图像的跨模态图 像-标签相关度学习方法。 技术背景 随着web 2. 0技术的发展,特别是一些社交网站的流行,例如Flickr。普通用户 更容易也更加愿意在互联网上分享图片资源。如何更好地处理这些海量的社会图像数据, 对其复杂的结构进行有效地组织和管理,进而促进针对这些图像的跨媒体检索已经成为一 个重要的研宄热点。通常来说,每一幅社会图像都会被标注为一系列的标 签,而这些标签是由普通的用户所提供的,而这些标签通常会带有用户主观的观点和倾向 。然而,由于语义鸿沟的问题,在图像的视觉内容与相应的标签之间可能存在着巨大的 不确定性,并且由于歧义,不完整以及过分主观性等等问题,标签的质量也不能令人满意, 存在很多的噪音以及拼写错误,而且很多的标签是不相关的。根据现有的调查显示,大概只 有50%左右的标签是与图像内容是相关的。因此,跨模态图像与标签的相关度学习已经成 为支持跨媒体检索等应用的一项十分重要的研宄问题。 为了实现跨模态图像与标签之间的相关度学习,应该同时解决三个相互关联的问 题: 1、通过对社会标注图像的多模态分析来发现有价值的多模态特征从而对视觉图 像和文本标注来进行更好的描述与刻画。 2、针对图像相关度与标签相关度分别进行多模态分析从而得到相应的相关度度 量方法和客观标准。 3、通过多模态相关度融合来得到更好的跨模态相关度,衡量图像的视觉内容以及 标注中的语义标签的关系。 为了解决第一个问题,充分挖掘和分析社会标注图像的视觉内容以及相关标注所 蕴含的语义信息变得十分重要,通过这样的分析进而得到能够更好地对标注图像进行描述 的多模态特征。针对第二个问题,通过开发健壮的算法,针对图像相关度与标签相关度分别 进行考虑,从而使得得到的相关度准确率高而且有较低的计算成本。最后一个问题,关键在 于开发新的算法来分析多模态的标签相关度与图像相关度之间的关联,进而对两种相关度 进行融合以得到更好的相关度。 当前已有一些研宄者针对图像和标签的相关度学习提出了不同的方法,从建模的 角度来看,这些方法大致可以分为两类,第一类是图模型的方法,第二类是优化方法。 (1)图模型方法 所谓的图模型方法即是把整个标注图像数据集看成是一个图,图中的节点可以表 示图像本身,也可以表示标签。而图节点之间的连接表示图像之 间的相似度或者标签之间的相似度,进而可以利用一些针对图模型的算法来计算图像与标 签之间的相关度。 在此方法基础上,Li通过对目标图像做k近邻后,将近邻图像所包含的所有标签 聚合起来为目标图像中所包含的标签来进行投票,通过投票的数量来计算目标图像与相应 标签之间的相关度,对于一个标签来说,其所得到的票数越多,其与图像的相关性越大。其 中图像与图像之间的相似度是通过计算底层视觉特征向量的相似度来得到的。后来Li 又拓展了他的工作,考虑了不同种类的底层视觉特征的影响。在Liu的工作中,则把标 签看作是图像中的节点,而边的权重则表示标签之间的相似度,通过谷歌距离以及示例距 离来计算。 ⑵优化方法 现有的优化方法通常会把整个标注图像数据集映射为一个二维矩阵的形式,矩阵 的行与列分别表示图像和标签,而矩阵中的值则表示对应的图像和标签的相关度,进而可 以通过构造不同的代价函数来优化此矩阵进而得到最终的相关度。 在此方法基础上,Zhu在其工作中把用户提供的矩阵D分解为一个低秩的矩阵A, 和稀疏错误矩阵E ,而优化的原则主要考虑几个方面,第一,视觉相似的图片对应的标 签向量也比较相似,第二,内容连续性,即两个标签的共现频率需要在矩阵中有所体现,如 果两个标签在图像集中经常共现,相应地在矩阵中的两个标签的共现频率也就比较高,另 外两个约束是矩阵A是低秩而且矩阵E是稀疏的。而在zhuang的工作中,则从两个角度来 约束矩阵的学习,第一个是从图像的角度,两个图像越相似,对应矩阵中的两个行向量 也就越相似。第二个是从标签的角度,两个标签也越相似,对应的矩阵中两个列向量也就越 相似,其中图像与图像之间的相似度通过计算视觉向量的相似度来得到,而标签与标签之 间的相似度则通过谷歌距离来计算。另外,在Gao的工作中把整个数据集看作一个超图,而 利用不同的图像在超图上的关系作为一个正则项加入到了优化函数当中。 通过以上分析可以看出,当前的方法在计算图像与标签的相关度时都取得了一些 进展,然而,以上所有方法仍未充分考虑以下三个方面所带来的影响: (1)多模态特征表示与多模态信息挖掘,大多数现有的图像-标签相关度学习方 法通常只关注于传统的视觉特征表示方法或者只是很简单地融合了有限的标注信息。这些 方法忽视了多模态特征中的丰富信息对计算图像与标签之间的相关度的价值,因此,找到 合适的算法来充分挖掘构建多模态特征表示方法变得十分的必要。 (2)多模态相关度评估,现有的方法在计算相关度的时候通常只考虑了单模态的 信息,要么忽略了图像本身的视觉信息,要么忽略了图像所包含的语义信息。而没有充分利 用多模态的信息来计算图像与标签之间的相关度,而丰富的多模态信息加以利用来计算图 像与标签之间的相关度。 (3)跨模态相关度融合,现有的方法在计算相关度的时候通常只考虑单向的相关 度,即要么只考虑了图像相对于标签的相关度,要么只考虑了标签相对于图像的相关度。而 忽视了这两种相关度之间的关系,因此,找到合适的融合算法来对这两种相关度进行融合 得到双向跨模态的相关度变得十分的重要。 因此,非常有必要借鉴当前已有的相关成熟技术,同时从各方面考虑以上问题,更 加全面地分析与计算图像和标签之间的相关度。本专利技术就是由此激发,从局部到整体,设计 了一种新颖的技术框架(包括三个主要算法),使用相关的图像/文本特征抽取方法,多模 态特征融合机制,结合具有问题针对性的图模型算法,建立有效的图像-标签学习计算方 法,并且利用排序聚合的方法来进行跨模态的融合,最终为跨媒体图像检索性能进行改进。
技术实现思路
本专利技术的目的在于提出一种针对社会图像的跨模态图像-标签相关度学习方法, 以提高跨媒体社会图像检索性能。 本专利技术提出的针对社会图像的跨模态图像-标签相关度学习方法,可在大规模的 社会标注图像中,更加精确和有效地学习图像及其标注之间的相关度。本专利技术以超图为基 本模型对整个标注数据集进行描述,并分别将图像和标签映射为超图节点进行处理,此得 到针对图像的相关度和针对标签的相关度,进而通过跨模态融合的方法将两种不同的相关 度进行融合,得到一种更好的相关度。本专利技术方法主要包括以下三方面: (1)多模态特征融合(Multimodal Feature Fusion)--首先针对原始的社会图 像及其标注,分别进行特征的提取。并且为了更好地进行多模态特征的融合,使用类似的方 法来进行特征提取;然后针对图像和文本的原始特征,通过挖掘不同模态之间特征的相关 性,将异构的特征映射到同构子空间中,进行融合,从而得到融合了多模态信息的特征; (2)双向相关度度量(Bi-directional Relevance Measurement)--将标注图像 数据集合用超图来进行表示,利用在超图上的随机游走算法来度量图像与标签之间的相关 度,并且分别从本文档来自技高网
...
<a href="http://www.xjishu.com/zhuanli/55/CN104899253.html" title="面向社会图像的跨模态图像-标签相关度学习方法原文来自X技术">面向社会图像的跨模态图像-标签相关度学习方法</a>

【技术保护点】
一种针对社会图像的跨模态相关度学习方法,其特征在于具体步骤如下:(1)数据预处理:从多媒体数据集中采集不同模态的数据图像,得到图像和图像标注数据,整理图像标注数据集中不常出现或者无用的标注词;(2)提取多模态主题特征:提取图像的底层视觉特征与图像标注的语义特征,并且利用主题模型分别对视觉特征与语义特征进行处理,得到背后隐藏的视觉主题特征与语义主题特征;(3)多模态特征融合:采用典型相关性分析算法,分析得到图像视觉主题特征和语义主题特征的典型相关性,并将这两种主题特征向量映射到同纬度下的同构子空间中,构建跨模态融合特征,实现媒体数据不同模态信息的统一表示;(4)双向相关度度量:利用在超图上的随机游走算法,分别计算图像相对于标签的相关度即图像相关度和标签相对于图像的相关度标签相关度,从两个角度来度量图像与相关标签之间的关系;(5)跨模态相关度融合:将得到的两种相关度用相应的置信度矩阵进行表示,并且通过跨模态融合优化算法,得到一种新的跨模态的图像‑标签相关度;(6)图像排序与标签排序:将新的跨模态图像‑标签相关度应用到图像排序与标签排序中,其中,图像排序考虑的是给定标签,根据不同图像相对于该标签的相关度,对所有图像进行排序;标签排序考虑的是给定图像,根据不同标签相对于该图像的相关度,对所有标签进行排序。...

【技术特征摘要】

【专利技术属性】
技术研发人员:张玥杰程勇刘志鑫金城张滨
申请(专利权)人:复旦大学
类型:发明
国别省市:上海;31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1