目标对象检索方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:40600412 阅读:28 留言:0更新日期:2024-03-12 22:04
本申请涉及人工智能技术领域,揭示了一种目标对象检索方法、装置、计算机设备及存储介质,该方法包括:通过获取训练数据集,其中,训练数据集包括预设数量的样本对,样本对包括样本图像、样本图像对应的文本信息和样本对的类别标签;计算样本对之间的类别标签相似度;将样本对中的样本图像和文本信息进行拼接,得到样本对的特征向量;根据类别标签相似度和特征向量训练基础检索模型,得到目标对象检索模型,以通过目标对象检索模型进行目标对象检索,有利于提高检索结果的精确度。

【技术实现步骤摘要】

本专利技术涉及人工智能、图像处理,尤其涉及一种目标对象检索方法、装置、计算机设备及存储介质


技术介绍

1、随着搜索引擎技术的日益发展,基于纯文本的搜索已经不能满足人们日常生活或工作的需要,由于图文信息更加直观,更加丰富,将图像与文本结合在一起的图文搜索显得日益重要。例如,在医学影像方面,图文检索可以发挥重要作用。图文检索具体是指输入文本搜索相关图像,或者输入图像搜索相关文本的检索类型。

2、目前,通过某种模态内容来检索得到其他模态的相关内容主要是利用不同模态内容之间的局部信息的特征相关性,训练并应用对应的多模态检索神经网络模型来实现的。然而,图像和文本为两种异构模态信息,两者间存在巨大的语义鸿沟,只考虑文本的文本特征和图像的图像特征之间的局部信息的特征相关性,很容易得到错误的匹配结果,导致检索结果的精确度较低。


技术实现思路

1、基于此,提出了一种目标对象检索方法、装置、计算机设备及存储介质,在多模态的图文检索场景中,提高检索结果的精确度。

2、第一方面,提供了一种目标对象检索方法,本文档来自技高网...

【技术保护点】

1.一种目标对象检索方法,其特征在于,包括:

2.根据权利要求1所述的目标对象检索方法,其特征在于,所述将所述样本对中的样本图像和文本信息进行拼接,得到所述样本对的特征向量,包括:

3.根据权利要求2所述的目标对象检索方法,其特征在于,所述将所述图像编码特征和所述文本编码特征进行拼接,得到所述特征向量,包括:

4.根据权利要求1所述的目标对象检索方法,其特征在于,所述根据所述类别标签相似度和所述特征向量训练基础检索模型,包括:

5.根据所述权利要求4所述的目标对象检索方法,其特征在于,所述根据所述特征分布均匀度和所述特征相似度,确定所述基础...

【技术特征摘要】

1.一种目标对象检索方法,其特征在于,包括:

2.根据权利要求1所述的目标对象检索方法,其特征在于,所述将所述样本对中的样本图像和文本信息进行拼接,得到所述样本对的特征向量,包括:

3.根据权利要求2所述的目标对象检索方法,其特征在于,所述将所述图像编码特征和所述文本编码特征进行拼接,得到所述特征向量,包括:

4.根据权利要求1所述的目标对象检索方法,其特征在于,所述根据所述类别标签相似度和所述特征向量训练基础检索模型,包括:

5.根据所述权利要求4所述的目标对象检索方法,其特征在于,所述根据所述特征分布均匀度和所述特征相似度,确定所述基础检索模型的损失值,包括:

6.根据权...

【专利技术属性】
技术研发人员:舒畅陈又新
申请(专利权)人:平安科技上海有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1