【技术实现步骤摘要】
本专利技术涉及图像检索领域,特别涉及基于邻域与距离度量学习的图像语义自动标 注方法。
技术介绍
随着网络技术的飞速发展和数码相机与移动设备的快速普及,越来越多的人能够 方便地使用和传输数字图像,使得图像网站上数字图像的数量得到指数性增长。如何在海 量图像网站上有效地检索图像以便快速、有效地发现感兴趣的图像资源已经成为一个具有 挑战性的任务。 然而,作为图像检索的重要环节,图像标注的性能决定着图像检索的效果。基于语 义的图像检索能够有效地弥补基于文本和基于内容两种图像检索方法的缺陷,使检索结果 与用户所需信息尽可能一致。 利用语义检索图像时,人们通常通过图像的高水平语义来检索。已有的很多图像 标注方法多采用低水平视觉特征来描述图像,然而图像的低水平视觉特征与图像的高水平 语义之间存在鸿沟,因此,现存的很多图像语义标注方法的性能并不令人满意。 当前,现存的图像语义自动标注方法有一定的局限性。经过对现有技术的文献检 索发现,Zhixin Li 等 2011 年在 Patter Recognition Letters 上发表的论文 Modeling continuous visual features for semantic image annotation and retrieval,'(面 向语义图像标注和检索的连续视觉特征建模,简称文献1)中提出了一种图像标注和检 索方法,图像标注词个数是事先预定的。通过文献检索还发现,Songhao Zhu等2013年在 Journal of Visual Communicati ...
【技术保护点】
一种基于邻域与距离度量学习的图像语义自动标注方法,其特征在于:设训练集Tr为有标注词的图像集合{I1,I2,...,IN1},N1为训练集Tr中图像个数,测试集Te为无标注词的图像集合{I1,I2,...,IN2},N2为测试集Te中图像个数;任一幅图像I由M个视觉特征x1,x2,...,xM表示成M维向量I=(x1,x2,...,xM),L={k1,k2,...,km}是标注词集合,每幅图像I∈Tr都与对应,Y=(y1,y2,...,ym),Y称为图像I的标注词向量;yj=1表示图像I有标注词kj,yj=0表示图像I没有标注词kj,j的取值为1,2,…,m;训练集表示为Tr={(Iu,Yu)|u=1,2,...N1},表示第j个标注词kj属于图像Iu,表示第j个标注词kj不属于图像Iu,Yu为图像Iu的标注词向量;执行以下步骤,步骤一,从训练集中随机取任意两幅图像Iu,Iv∈Tr,求得距离度量Δ(Iu,Iv),实现如下,令S=ATA,其中A是变换矩阵;对于训练集中的任意两幅图像Iu,Iv∈Tr,它们之间的距离Δ(Iu,Iv)是Δ(Iu,Iv)=(Iu,Iv)TS(Iu,Iv)=(AI ...
【技术特征摘要】
1. 一种基于邻域与距离度量学习的图像语义自动标注方法,其特征在于:设训练集Tr为有标注词的图像集合U1, 12, ...,IN1},Nl为训练集Tr中图像个数,测试集Te为无标注 词的图像集合U1, 12,. . .,IN2},N2为测试集Te中图像个数;任一幅图像I由M个视觉特征 X1,X2,. . .,Xm表示成M维向量I= (X1,X2,. . .,xM),L={kpk2,. . .,km}是标注词集合,每幅 图像IeTr都与Fgi对应,Y= (y1,y2, . . .,ym),Y称为图像I的标注词向量;yj = 1表 示图像I有标注词=O表示图像I没有标注词kj,j的取值为1,2,…,m;训练集表示 为Tr= {(Iu,Yu)Iu= 1,2,…N1},Γκ = ,W=丨表示第j个标注词kj属于 图像Iu,^ 表示第j个标注词h不属于图像Iu,Yu为图像Iu的标注词向量; 执行以下步骤, 步骤一,从训练集中随机取任意两幅图像Iu,IveTr,求得距离度量Λ(Iu,Iv),实现如 下, 令S=ATA,其中A是变换矩阵;对于训练集中的任意两幅图像Iu,IveTr,它们之间的 距离Λ(Iu,Iv)是 Δ(IU,IV) = (IU,IV)TS(IU,IV) = (AIU,AIv)T (AIU,AIv) 其中,S=AtA是由变换矩阵A生成的度量矩阵,(Iu,Ιν)τ是图像Iu与Iv向量之间欧几 里得距离的转置,AIu是A与Iu的内积,八^是八与Iv的内积,(AIU,AIv)是计算两个内积AIU、 AIv的欧几里得距离后所获得的向量,(Iu,Iv)tS(Iu,Iv)是(Iu,Iv)T、S和(Iu,Iv)的内积; 图像Iu选择训练集Tr中的另一图像Iv作为自己近邻的概率Puv按下式计算,其中,w(I) =P2 (I)/P1⑴是待定向量,其中P1⑴和P2⑴分别是训练集Tr和测试集Te的概率密度函数,Ik表示训练集Tr中图像Iu以外的任意图像,则Iu、Ik相应的待定向量 W(Iv) =P2(Iv)A31(Iv)I(Ik) =P2(Ik)A31(Ik);记训练集Tr中所有与Iu具有相同标注词的 图像集合为Qu,则Qu中的图像都是图像Iu的近邻的概率?11是概率Pu的加权均值f(A)如下, J-(A)^YdW(Iu)XogP ii U=-I 其中,Iu相应的待定向量W(Iu) =P2(Iu)ZiP1(Iu); 按下式计算f(A)的梯度I* QA利用梯度下降法求得变换矩阵A,由此得到...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。