一种图像检索方法及装置制造方法及图纸

技术编号:15704886 阅读:126 留言:0更新日期:2017-06-26 10:14
本发明专利技术公开一种图像检索方法及装置,其中,图像检索方法,包括如下步骤:构建多任务深度网络结构模型;建立目标图像特征库;输入待检索图像的特征子集;计算待检索图像的特征子集与图像特征库中每张图像特征的相似度距离;按照距离从小到大的排序排列后获取与待检索图像距离最小的图像。本发明专利技术通过建立深度网络结构模型,多任务学习目标图像的特征完成图像检索,可以充分利用任务的相关性联合提高多个属性分类的精度,能够学习到图像各个属性的联系以及图像的细节特征,所以进而在图像检索的过程中,能够较好克服气候、环境、照度等影响。

【技术实现步骤摘要】
一种图像检索方法及装置
本专利技术涉及图像处理领域,具体涉及一种图像检索方法及装置。
技术介绍
随着计算机和互联网的快速发展,多媒体的图像信息正在网络上迅速地产生和传播,从而丰富人们的视觉,面对各种各样的图像信息,挖掘人们所需求的图像已经成为一个备受关注的问题,所以建立相关图像检索方法也成为研究和工程实践的热点。目前现有技术的图像检索方式一般利用神经网络的深度学习直接应用于某个单一属性完成单任务学习特征的图像检索,因为单任务学习特征往往只考虑任务本身的信息量,没有考虑到与其他任务之间的联系,因此学习能力受到了一定局限性,无法发挥深度神经网络的优势功能,故无法利用多个属性作为监督信号输入,因无法学习到图像各个属性的联系以及图像的细节特征,故在检索图像的过程中,无法克服气候,环境、照度等影响,因而无法提取目标图像的准确特征,造成图像的检索精度降低,检索出来相似度大的图像并非想要的目标,图像检索指标较差。
技术实现思路
因此,本专利技术实施例要解决的技术问题在于现有技术中的图像检索方式通过某个单一属性完成单任务学习特征的图像检索,无法学习图像的各个属性的联系以及图像的细节特征,在检索的过程中,无法克服气候,环境,照度的影响,造成图像的检索进度降低,图像检索效果较差。为此,本专利技术实施例提供了如下技术方案:本专利技术提供一种图像检索方法,包括如下步骤:构建多任务深度网络结构模型;建立目标图像特征库;输入待检索图像的特征子集;计算所述待检索图像的特征子集与所述图像特征库中每张图像特征的相似度距离;按照所述距离从小到大的排序排列后获取与所述待检索图像距离最小的图像。可选地,所述图像检索方法,所述构建多任务深度网络结构模型,包括:确定目标图像的属性类别以及与所述属性类别对应的训练图像子集;输入多个属性任务数据;共享相关所述任务数据资源;根据所述多个属性任务,确定对应的损失函数;根据256维深度特征描述,获取目标图像的第一特征子集。可选地,所述图像检索方法,所述根据所述多个属性任务,确定对应的损失函数的步骤;包括:公式Lt=-(1-t)*㏒(1-Pt)-t*㏒(pt);其中t表示某一学习任务中学习到的标签是否与真实标签相等,相等则t=1,不相等t=0;Pt表示学习输出为所述真实标签的概率。可选地,所述图像检索方法,所述建立目标图像特征库,包括:提取sift描述图像的第二特征子集;提取lbp描述图像的第三特征子集;根据所述第二特征子集、第三特征子集,获取传统描述图像的第四特征子集;获取单张目标图像的第五特征子集。可选地,所述图像检索方法,所述第四特征子集包括第二特征子集和第三特征子集,第五特征子集包括第一特征子集、第二特征子集和第三特征子集。可选地,所述图像检索方法,所述目标特征库为包含多个待检索的具有所述第五特征子集的目标图像。可选地,所述图像检索方法,所述输入待检索图像的特征子集利用所述构建多任务深度网络结构模型的步骤提取图像。可选地,所述图像检索方法,计算所述待检索图像的特征子集与所述图像特征库中每张图像的相似度距离,包括:公式Dis=0.75*d(d)+0.125*d(s)+0.125*d(l);其中,d(d)表示所述待检索图像的特征子集与所述第一特征子集的距离;d(s)表示所述待检索图像的特征子集与所述第二特征子集的距离;d(l)表示所述待检索图像的特征子集与所述第三特征子集的距离;Dis表示最终的相似度距离。本专利技术提供一种图像检索装置,包括如下单元:构建单元,用于构建多任务深度网络结构模型;建立单元,用于建立目标图像特征库;输入单元,用于输入待检索图像的特征子集;计算单元,用于计算所述待检索图像的特征子集与所述图像特征库中每张图像特征的相似度距离;获取单元,按照所述距离从小到大的排序排列后获取与所述待检索图像距离最小的图像。可选地,所述图像检索装置,其特征在于,所述构建单元,包括:第一确定模块,用于确定目标图像的属性类别以及与所述属性类别对应的训练图像子集;输入模块,用于输入多个属性任务数据;共享模块,用于共享相关所述任务数据资源;第二确定模块,用于根据所述多个属性任务,确定对应的损失函数;第一获取模块,用于根据256维深度特征描述,获取目标图像的第一特征子集。可选地,所述图像检索装置,所述第二确定模块;包括:公式Lt=-(1-t)*㏒(1-Pt)-t*㏒(pt);其中t表示某一学习任务中学习到的标签是否与真实标签相等,相等则t=1,不相等t=0;Pt表示学习输出为所述真实标签的概率。可选地,所述图像检索装置,所述建立单元,包括:第一提取模块,用于提取sift描述图像的第二特征子集;第二提取模块,用于提取lbp描述图像的第三特征子集;第二获取模块,根据所述第二特征子集、第三特征子集,获取传统描述图像的第四特征子集;第三获取模块,用于获取单张目标图像的第五特征子集。可选地,所述图像检索装置,所述第四特征子集包括第二特征子集和第三特征子集,第五特征子集包括第一特征子集、第二特征子集和第三特征子集。可选地,所述图像检索装置,所述建立单元中的目标特征库为包含多个待检索的具有所述第五特征子集的目标图像。可选地,所述图像检索装置,所述输入单元中利用构建单元提取图像。可选地,所述图像检索装置,计算所述待检索图像的特征子集与所述图像特征库中每张图像的相似度距离,包括:公式Dis=0.75*d(d)+0.125*d(s)+0.125*d(l);其中,d(d)表示所述待检索图像的特征子集与所述第一特征子集的距离;d(s)表示所述待检索图像的特征子集与所述第二特征子集的距离;d(l)表示所述待检索图像的特征子集与所述第三特征子集的距离;Dis表示最终的相似度距离。本专利技术实施例技术方案,具有如下优点:本专利技术公开一种图像检索方法及装置,其中,图像检索方法,包括如下步骤:构建多任务深度网络结构模型;建立目标图像特征库;输入待检索图像的特征子集;计算待检索图像的特征子集与图像特征库中每张图像特征的相似度距离;按照距离从小到大的排序排列后获取与待检索图像距离最小的图像。本专利技术通过建立深度网络结构模型,多任务学习目标图像的特征完成图像检索,可以充分利用任务的相关性联合提高多个属性分类的精度,能够学习到图像各个属性的联系以及图像的细节特征,所以进而在图像检索的过程中,能够较好克服气候、环境、照度等影响。附图说明为了更清楚地说明本专利技术具体实施方式或现有技术中的技术方案,下面将对具体实施方式或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施方式,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例1中图像检索方法的流程图;图2为本专利技术实施例1中图像检索方法中构建模型的流程图;图3为本专利技术实施例1中图像检索方法中多任务深度网络模型结构框图;图4为本专利技术实施例1中图像检索方法中建立目标图像特征库的流程图;图5为本专利技术实施例2中图像检索装置的结构框图;图6为本专利技术实施例2中图像检索装置中构建单元的结构框图;图7为本专利技术实施例2中图像检索装置中建立单元的结构框图。具体实施方式下面将结合附图对本专利技术实施例的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术本文档来自技高网...
一种图像检索方法及装置

【技术保护点】
一种图像检索方法,其特征在于,包括如下步骤:构建多任务深度网络结构模型;建立目标图像特征库;输入待检索图像的特征子集;计算所述待检索图像的特征子集与所述图像特征库中每张图像特征的相似度距离;按照所述距离从小到大的排序排列后获取与所述待检索图像距离最小的图像。

【技术特征摘要】
1.一种图像检索方法,其特征在于,包括如下步骤:构建多任务深度网络结构模型;建立目标图像特征库;输入待检索图像的特征子集;计算所述待检索图像的特征子集与所述图像特征库中每张图像特征的相似度距离;按照所述距离从小到大的排序排列后获取与所述待检索图像距离最小的图像。2.根据权利要求1所述的方法,其特征在于,所述构建多任务深度网络结构模型,包括:确定目标图像的属性类别以及与所述属性类别对应的训练图像子集;输入多个属性任务数据;共享相关所述任务数据资源;根据所述多个属性任务,确定对应的损失函数;根据256维深度特征描述,获取目标图像的第一特征子集。3.根据权利要求2所述的方法,其特征在于,所述根据所述多个属性任务,确定对应的损失函数的步骤;包括:公式Lt=-(1-t)*㏒(1-Pt)-t*㏒(pt);其中t表示某一学习任务中学习到的标签是否与真实标签相等,相等则t=1,不相等t=0;Pt表示学习输出为所述真实标签的概率。4.根据权利要求1所述的方法,其特征在于,所述建立目标图像特征库,包括:提取sift描述图像的第二特征子集;提取lbp描述图像的第三特征子集;根据所述第二特征子集、第三特征子集,获取传统描述图像的第四特征子集;获取单张目标图像的第五特征子集。5.根据权利要求2或4所述的方法,其特征在于,所述第四特征子集包括第二特征子集和第三特征子集,第五特征子集包括第一特征子集、第二特征子集和第三特征子集。6.根据权利要求1或4所述的方法,其特征在于,所述目标特征库为包含多个待检索的具有所述第五特征子集的目标图像。7.根据权利要求1所述的方法,其特征在于,所述输入待检索图像的特征子集利用所述构建多任务深度网络结构模型的步骤提取图像。8.根据权利要求1所述的方法,其特征在于,计算所述待检索图像的特征子集与所述图像特征库中每张图像的相似度距离,包括:公式Dis=0.75*d(d)+0.125*d(s)+0.125*d(l);其中,d(d)表示所述待检索图像的特征子集与所述第一特征子集的距离;d(s)表示所述待检索图像的特征子集与所述第二特征子集的距离;d(l)表示所述待检索图像的特征子集与所述第三特征子集的距离;Dis表示最终的相似度距离。9.一种图像检索装置,其特征在于,包括如下单元:构建单元,用于构建多任务...

【专利技术属性】
技术研发人员:刘洋贾岩刘麒张晓明张如高
申请(专利权)人:博康智能信息技术有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1