用于提取图像的方法和装置制造方法及图纸

技术编号:19594025 阅读:29 留言:0更新日期:2018-11-28 05:06
本申请实施例公开了用于提取图像的方法和装置。该方法的一具体实施方式包括:获取基准对象图像和待匹配图像集合;将基准对象图像输入预先训练的图像识别模型包括的第一子网络,得到基准对象图像的特征向量作为基准特征向量;对于待匹配图像集合中的待匹配图像,执行如下提取步骤:将该待匹配图像输入图像识别模型包括的第二子网络,得到至少一个位置信息和位置信息对应的待匹配特征向量;确定所得到的待匹配特征向量与基准特征向量的距离;响应于确定所确定的距离中存在小于等于预设的距离阈值的距离,提取该待匹配图像作为与基准对象图像匹配的图像。该实施方式提高了图像识别的灵活性,丰富了图像识别的手段。

【技术实现步骤摘要】
用于提取图像的方法和装置
本申请实施例涉及计算机
,具体涉及用于提取图像的方法和装置。
技术介绍
目前,图像识别技术的应用领域越来越广泛,利用图像识别模型对图像进行识别,是图像识别技术的一种常用手段。图像识别模型通常是利用大量的训练样本进行训练得到的模型,为了使图像识别模型能够识别出某图像中的目标图像(例如水印图像、人物图像、物体图像等),通常需要利用包含目标图像的样本图像进行训练以得到图像识别模型。
技术实现思路
本申请实施例提出了用于提取图像的方法和装置。第一方面,本申请实施例提供了一种用于提取图像的方法,该方法包括:获取基准对象图像和待匹配图像集合;将基准对象图像输入预先训练的图像识别模型包括的第一子网络,得到基准对象图像的特征向量作为基准特征向量;对于待匹配图像集合中的待匹配图像,执行如下提取步骤:将该待匹配图像输入图像识别模型包括的第二子网络,得到至少一个位置信息和位置信息对应的待匹配特征向量,其中,待匹配特征向量是该待匹配图像包括的区域图像的特征向量,位置信息用于表征区域图像在该待匹配图像中的位置;确定所得到的待匹配特征向量与基准特征向量的距离;响应于确定所确定的距离中本文档来自技高网...

【技术保护点】
1.一种用于提取图像的方法,包括:获取基准对象图像和待匹配图像集合;将所述基准对象图像输入预先训练的图像识别模型包括的第一子网络,得到所述基准对象图像的特征向量作为基准特征向量;对于所述待匹配图像集合中的待匹配图像,执行如下提取步骤:将该待匹配图像输入所述图像识别模型包括的第二子网络,得到至少一个位置信息和位置信息对应的待匹配特征向量,其中,待匹配特征向量是该待匹配图像包括的区域图像的特征向量,位置信息用于表征区域图像在该待匹配图像中的位置;确定所得到的待匹配特征向量与所述基准特征向量的距离;响应于确定所确定的距离中存在小于等于预设的距离阈值的距离,提取该待匹配图像作为与所述基准对象图像匹配的...

【技术特征摘要】
1.一种用于提取图像的方法,包括:获取基准对象图像和待匹配图像集合;将所述基准对象图像输入预先训练的图像识别模型包括的第一子网络,得到所述基准对象图像的特征向量作为基准特征向量;对于所述待匹配图像集合中的待匹配图像,执行如下提取步骤:将该待匹配图像输入所述图像识别模型包括的第二子网络,得到至少一个位置信息和位置信息对应的待匹配特征向量,其中,待匹配特征向量是该待匹配图像包括的区域图像的特征向量,位置信息用于表征区域图像在该待匹配图像中的位置;确定所得到的待匹配特征向量与所述基准特征向量的距离;响应于确定所确定的距离中存在小于等于预设的距离阈值的距离,提取该待匹配图像作为与所述基准对象图像匹配的图像。2.根据权利要求1所述的方法,其中,所述提取步骤还包括:确定小于等于所述距离阈值的距离对应的区域图像的位置信息,以及将所确定的位置信息输出。3.根据权利要求2所述的方法,其中,所述提取步骤还包括:基于输出的位置信息和该待匹配图像,生成包括位置标记的匹配后图像,其中,位置标记用于标记输出的位置信息对应的待匹配区域图像在匹配后图像中的位置。4.根据权利要求1所述的方法,其中,所述第二子网络包括用于将特征向量变换到目标维度的维度变换层;以及所述将该待匹配图像输入所述图像识别模型包括的第二子网络,得到至少一个待匹配特征向量,包括:将该待匹配图像输入所述图像识别模型包括的第二子网络,得到至少一个与基准特征向量的维度相同的待匹配特征向量。5.根据权利要求1-4之一所述的方法,其中,所述图像识别模型通过以下步骤训练得到:获取训练样本集,其中,训练样本包括样本对象图像、样本匹配图像、样本匹配图像的标注位置信息,标注位置信息表征样本匹配图像中包括的区域图像的位置;从所述训练样本集中选取训练样本,执行如下训练步骤:将选取的训练样本包括的样本对象图像输入初始模型包括的第一子网络,得到第一特征向量,将样本匹配图像输入初始模型包括的第二子网络,得到至少一个位置信息和与位置信息对应的第二特征向量;从所得到的至少一个位置信息中,确定表征样本匹配图像中的目标区域图像的位置信息作为目标位置信息,确定目标位置信息对应的第二特征向量作为目标第二特征向量;基于表征目标位置信息的误差的第一损失值和表征目标第二特征向量与第一特征向量的距离的差距的第二损失值,确定初始模型是否训练完成;响应于确定训练完成,将初始模型确定为图像识别模型。6.根据权利要求5所述的方法,其中,所述基于表征目标位置信息的误差的第一损失值和表征目标第二特征向量与第一特征向量的距离的差距的第二损失值,确定初始模型是否训练完成,包括:根据预设的权重值,将第一损失值与第二损失值的加权求和结果作为总损失值,以及将总损失值与目标值进行比较,根据比较结果确定初始模型是否训练完成。7.根据权利要求5所述的方法,其中,训练得到所述图像识别模型的步骤还包括:响应于确定初始模型未训练完成,调整初始模型的参数,以及从所述训练样本集中的、未被选取的训练样本中,选取训练样本,使用参数调整后的初始模型作为初始模型,继续执行所述训练步骤。8.一种用于提取图像的装置,包括:获取单元,被配置成获取基准对象图像和待匹配图像集合;生成单元,被配置成将所述基准对象图像输入预先训练的图像识别模型包括的第一子网络,得到所...

【专利技术属性】
技术研发人员:周恺卉王长虎
申请(专利权)人:北京字节跳动网络技术有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1