当前位置: 首页 > 专利查询>西北大学专利>正文

图像检索特征提取模型建立、数据库建立及检索方法技术

技术编号:20221812 阅读:42 留言:0更新日期:2019-01-28 20:18
本发明专利技术公开了一种图像检索特征提取模型建立、检索数据库建立及检索方法,该方法将深度网络最后一层输出的图像特征看作是一个嵌入空间,利用自定义的目标函数通过弱标注标签的语义关系学习图像之间的相似性关系,最后利用网络模型提取的高层语义特征表示图像并进行检索。这样的训练方式避免了直接使用语义比较模糊的弱标注标签作为数据的标签来训练模型,而是从深度网络最后一层映射的特征嵌入空间中利用图片标签之间的语义相似关系来学习数据中蕴藏的图像间的语义信息。

【技术实现步骤摘要】
图像检索特征提取模型建立、数据库建立及检索方法
本专利技术涉及图像检索领域,具体涉及一种图像检索特征提取模型建立、数据库建立及检索方法。
技术介绍
图像检索作为该领域的重要问题,受到了研究人员和学者的广泛关注。当前图像检索问题中所使用到的深度模型多采用监督学习方法来训练模型,由于深度模型复杂度高、参数规模庞大,因而需要大量且质量较好的人工标注数据来训练模型。但是,上述有监督学习存在如下两个缺陷:1)由于人工标注需要耗费大量的人工和时间成本,因此对多数具体问题缺乏大规模标注数据。2)人工标注产生的强标签集存在无法描述细粒度的语义信息的先天劣势。目前随着移动互联和社交自媒体平台的普及,多数互联网用户会在网上分享他们的图像并添加自定义标签,从而形成了大量带标签的图像数据。这些用户产生的标注信息通常包含细粒度的图像视觉内容信息,可用于提取更具区分度的细粒度视觉语义。不同于监督学习中人工标注产生的强标签,这些由用户产生的社会化标签是一种弱标签,带有这种弱标签的数据称为弱标注数据。这种数据的标注过程不受约束,致使标签集存在噪声、模糊性语义及语义缺失等情况,从而无法直接使用监督学习方法来训练模型。本文档来自技高网...

【技术保护点】
1.一种图像检索特征提取模型建立方法,其特征在于,用于对带有弱标签的图像建立特征提取模型,所述的方法包括:步骤1、采集多幅带有弱标签的图像,获得图像集,收集图像集中的每幅图像对应的多个弱标签,获得每幅图像的弱标签集;步骤2、删除每幅图像的弱标签集中视觉代表性低于阈值的弱标签,获得每幅图像预处理后的弱标签集;步骤3、将每幅图像预处理后的弱标签集中每个弱标签映射成多维的词向量后,采用式I获得两两图像之间的相似度:

【技术特征摘要】
1.一种图像检索特征提取模型建立方法,其特征在于,用于对带有弱标签的图像建立特征提取模型,所述的方法包括:步骤1、采集多幅带有弱标签的图像,获得图像集,收集图像集中的每幅图像对应的多个弱标签,获得每幅图像的弱标签集;步骤2、删除每幅图像的弱标签集中视觉代表性低于阈值的弱标签,获得每幅图像预处理后的弱标签集;步骤3、将每幅图像预处理后的弱标签集中每个弱标签映射成多维的词向量后,采用式I获得两两图像之间的相似度:其中,s(i,j)为图像集中第i幅图像与图像集中第j幅图像之间的相似度,0≤s(i,j)≤1,sim()为余弦相似度,0≤sim()≤1,vik为第i幅图像的弱标签集中的第k个弱标签的多维的词向量,vjl为第j幅图像的弱标签集中的第l个弱标签的多维的词向量,m为第i幅图像的预处理后的弱标签集中弱标签的总数,m≥1,n为第j幅图像的预处理后的弱标签集中弱标签的总数,n≥1;步骤4、根据所述两两图像之间相似度的大小确定两幅图像之间是否相似,获得每幅图像的相似图像以及不相似图像;步骤5、将由步骤4处理后的图像集划分成多个三元图像组,其中一个三元图像组包括图像A、图像A的相似图像C以及图像A的不相似图像B;步骤6、将所述的多个三元图像组作为输入,采用反向传播算法训练深度神经网络模型,获得训练后的深度神经网络模型;步骤7、在所述训练后的深度神经网络模型中最后一层全连接层后加入哈希化映射层,获得特征提取模型。2.如权利要求1所述的图像检索特征提取模型建立方法,其特征在于,所述的步骤4、根据所述图像集中两两图像之间相似度的大小确定两幅图像之间是否相似时,若两两图像之间相似度在相似阈值以上,则两幅图像相似,若两两图像之间相似度在不相似阈值以下,则两幅图像不相似,若两幅图像相似度大于不相似阈...

【专利技术属性】
技术研发人员:管子玉王娟雷燕王小鹏刘杰
申请(专利权)人:西北大学
类型:发明
国别省市:陕西,61

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1