基于人工智能的目标图像快速检索方法及系统技术方案

技术编号:31011899 阅读:52 留言:0更新日期:2021-11-30 00:40
本发明专利技术公开了基于人工智能的目标图像快速检索方法及系统,获取模板图像和模板图像对应的若干个已知标签;从目标图像数据库中,抽取待检测图像;将待检测图像和模板图像,均输入到训练后的卷积神经网络中,输出待检测图像的哈希码和模板图像的哈希码;基于待检测图像的哈希码和模板图像的哈希码之间的汉明距离,得到待检测图像与模板图像的相似度,选择相似度高于设定阈值的一个或多个待检测图像作为检索结果输出。通过人工智能技术的使用实现对机器人视觉平台采集的复杂场景下的图像样本基于卷积神经网络,利用哈希方法提取图像特征,引入区分易混淆实体、可优化相似性关系以及区分样本关注度,更好地应对复杂场景下的物品检索。品检索。品检索。

【技术实现步骤摘要】
基于人工智能的目标图像快速检索方法及系统


[0001]本专利技术涉及图像检索
,特别是涉及基于人工智能的目标图像快速检索方法及系统。

技术介绍

[0002]本部分的陈述仅仅是提到了与本专利技术相关的
技术介绍
,并不必然构成现有技术。
[0003]物品检索旨在利用计算机或者机器人对摄像机拍摄的图像进行处理、分析和理解,以识别各种不同模式的目标和对象,它是计算机视觉领域的一个重要研究课题。
[0004]如今,已经可以使用机器人来收集真实环境的图像,对于简单的图像而言,很容易为其学到一个合适的特征表示将其与不同语义的样本区分开来。而在复杂场景中,图像则需要更多的关注才能得到一个恰当的特征表示。复杂场景例如,在多标签学习(图像包含多个标签)中,图像间的相似度并不具备传递性,即存在图像A与图像B相似(图像A与图像B拥有一个或者一个以上相同的标签),图像A与图像C相似,但是图像B与图像C不相似(图像B与图像C不存在相同的标签)。因而流行的物品检索方法平等地对待所有的样本,导致其在复杂场景下物品检索方法出现了相对较差的泛化性能。
[0005](1)复杂场景下物品检索包含大量容易混淆的实体,这些实体一般具有相似的特征表征,流行的物品检索方法并不能将其区分开(未考虑易混淆的特点);(2)复杂场景下物品检索需要更加准确的图像相似性,以便挖掘图像的真实相似性关系来引导生成图像特征,现有的物品检索方法未考虑挖掘图像的相似性关系;(3)复杂场景下物品检索需要提供更多的关注给复杂样本,合理划分注意力,但现有的物品检索方法平等对待所有样本。

技术实现思路

[0006]为了解决现有技术的不足,本专利技术提供了基于人工智能的目标图像快速检索方法及系统;第一方面,本专利技术提供了基于人工智能的目标图像快速检索方法;基于人工智能的目标图像快速检索方法,包括:获取模板图像和模板图像对应的若干个已知标签;从目标图像数据库中,抽取待检测图像;将待检测图像和模板图像,均输入到训练后的卷积神经网络中,输出待检测图像的哈希码和模板图像的哈希码;基于待检测图像的哈希码和模板图像的哈希码之间的汉明距离,得到待检测图像与模板图像的相似度,汉明距离越小表示相似度越高,选择相似度高于设定阈值的一个或多个待检测图像作为检索结果输出。
[0007]第二方面,本专利技术提供了基于人工智能的目标图像快速检索系统;基于人工智能的目标图像快速检索系统,包括:
获取模块,其被配置为:获取模板图像和模板图像对应的若干个已知标签;抽取模块,其被配置为:从目标图像数据库中,抽取待检测图像;转换模块,其被配置为:将待检测图像和模板图像,均输入到训练后的卷积神经网络中,输出待检测图像的哈希码和模板图像的哈希码;输出模块,其被配置为:基于待检测图像的哈希码和模板图像的哈希码之间的汉明距离,得到待检测图像与模板图像的相似度,汉明距离越小表示相似度越高,选择相似度高于设定阈值的一个或多个待检测图像作为检索结果输出。
[0008]与现有技术相比,本专利技术的有益效果是:通过人工智能技术的使用实现对机器人视觉平台采集的复杂场景下的图像样本基于卷积神经网络,利用哈希方法提取图像特征,引入区分易混淆实体、可优化相似性关系以及区分样本关注度,更好地应对复杂场景下的物品检索。
[0009]本专利技术附加方面的优点将在下面的描述中部分给出,或通过本专利技术的实践了解到。
附图说明
[0010]构成本专利技术的一部分的说明书附图用来提供对本专利技术的进一步理解,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。
[0011]图1为第一个实施例的方法流程图。
具体实施方式
[0012]应该指出,以下详细说明都是示例性的,旨在对本专利技术提供进一步的说明。除非另有指明,本文使用的所有技术和科学术语具有与本专利技术所属
的普通技术人员通常理解的相同含义。
[0013]本实施例所有数据的获取都在符合法律法规和用户同意的基础上,对数据的合法应用。
[0014]实施例一本实施例提供了基于人工智能的目标图像快速检索方法;如图1所示,基于人工智能的目标图像快速检索方法,包括:S101:获取模板图像和模板图像对应的若干个已知标签;S102:从目标图像数据库中,抽取待检测图像;S103:将待检测图像和模板图像,分别输入到训练后的卷积神经网络中,输出待检测图像的哈希码和模板图像的哈希码;S104:基于待检测图像的哈希码和模板图像的哈希码之间的汉明距离,得到待检测图像与模板图像的相似度,汉明距离越小表示相似度越高,选择相似度高于设定阈值(设定阈值,例如)的一个或多个待检测图像作为检索结果输出。
[0015]示例性地,所述模板图像为已知图像,所述模板图像对应的若干个已知标签,例如,包括:山、水、树、花、动物、行人、马路、车辆等。
[0016]示例性地,所述S102:从目标图像数据库中,抽取待检测图像;这里的抽取规则为无放回抽取。
[0017]进一步地,所述卷积神经网络为改进的卷积神经网络CNN

F;(CNN

F,Convolutional Neural Networks and the Improved Fisher Vector网络)。
[0018]其中,改进的卷积神经网络CNN

F,网络结构包括:依次连接的第一卷积层、第二卷积层、第三卷积层、第四卷积层、第五卷积层、第一全连接层、第二全连接层、第三全连接层和Tanh函数层;将第三全连接层的输出维度设定为K维。
[0019]进一步地,所述训练后的卷积神经网络;训练步骤包括:构建训练集和测试集;所述训练集和测试集,均包括:已知标签的图像;将训练集已知标签的图像,输入到卷积神经网络中进行训练,卷积神经网络输出已知标签图像的哈希码;根据已知标签图像的哈希码与已知标签,构建损失函数,当损失函数达到最小值时,停止训练;将测试集,输入到卷积神经网络中进行测试,当准确率超过设定阈值时,停止测试,认定当前卷积神经网络为训练后的卷积神经网络。
[0020]进一步地,所述训练后的卷积神经网络,是基于不同情况下,采用不同的损失函数训练得到的。
[0021]进一步地,基于不同情况下,采用不同的损失函数训练得到的;具体包括:当需要使得所有的负样本的预测得分尽可能低,所有正样本的预测得分尽可能高,且相似度得分的取值范围为,则使用基于哈希码相似度的统一损失函数;当需要损失函数关注相似度预测得分偏低的正样本,则使用对正负样本相似度预测得分的间隔进行加权的损失函数;当需要使得所有的负样本的预测得分尽可能低,所有正样本的预测得分尽可能高,且使用的相似度得分的取值范围为,则使用基于哈希码相似度的损失函数;当需要损失函数关注相似度预测得分偏低的正样本,则使用对正负样本相似度预测得分的间隔进行加权的损失函数;当需要损失函数希望负样本的相似度预测得分与正样本的相似度预测得分之间存在明显的差距,则使用损失函数;当需要损失函数在优化的过程中更新相似性本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于人工智能的目标图像快速检索方法,其特征是,包括:获取模板图像和模板图像对应的若干个已知标签;从目标图像数据库中,抽取待检测图像;将待检测图像和模板图像,均输入到训练后的卷积神经网络中,输出待检测图像的哈希码和模板图像的哈希码;基于待检测图像的哈希码和模板图像的哈希码之间的汉明距离,得到待检测图像与模板图像的相似度,汉明距离越小表示相似度越高,选择相似度高于设定阈值的一个或多个待检测图像作为检索结果输出;基于不同情况下,采用不同的损失函数训练得到的;具体包括:当需要使得所有的负样本的预测得分尽可能低,所有正样本的预测得分尽可能高,且相似度得分的取值范围为,则使用基于哈希码相似度的统一损失函数;当需要损失函数关注相似度预测得分偏低的正样本,则使用对正负样本相似度预测得分的间隔进行加权的损失函数;当需要使得所有的负样本的预测得分尽可能低,所有正样本的预测得分尽可能高,且使用的相似度得分的取值范围为,则使用基于哈希码相似度的损失函数;当需要损失函数关注相似度预测得分偏低的正样本,则使用对正负样本相似度预测得分的间隔进行加权的损失函数;当需要损失函数希望负样本的相似度预测得分与正样本的相似度预测得分之间存在明显的差距,则使用损失函数;当需要损失函数在优化的过程中更新相似性矩阵,则使用基于优化相似性矩阵的间隔进行加权的统一损失函数;当需要损失函数在优化的过程中更新相似性矩阵,则使用基于优化相似性矩阵的间隔进行加权的圆损失函数;当需要损失函数在优化的过程中更新相似性矩阵,则使用损失函数。2.如权利要求1所述的基于人工智能的目标图像快速检索方法,其特征是,所述卷积神经网络为改进的卷积神经网络CNN

F;其中,改进的卷积神经网络CNN

F,网络结构包括:依次连接的第一卷积层、第二卷积层、第三卷积层、第四卷积层、第五卷积层、第一全连接层、第二全连接层、第三全连接层和Tanh函数层;将第三全连接层的输出维度设定为K维。3.如权利要求1所述的基于人工智能的目标图像快速检索方法,其特征是,所述训练后的卷积神经网络;训练步骤包括:构建训练集和测试集;所述训练集和测试集,均包括:已知标签的图像;将训练集已知标签的图像,输入到卷积神经网络中进行训练,卷积神经网络输出已知标签图像的哈希码;根据已知标签图像的哈希码与已知标签,构建损失函数,当损失函数达到最小值时,停止训练;将测...

【专利技术属性】
技术研发人员:聂秀山史洋刘新锋刘兴波袭肖明尹义龙
申请(专利权)人:山东建筑大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1