检索文件的方法和装置制造方法及图纸

技术编号:28735150 阅读:22 留言:0更新日期:2021-06-06 11:39
本申请公开了一种检索文件的方法和装置,属于图像数据处理领域,用以解决基于图像的文件检索结果不准确的问题。该方法包括:基于初始图形信息进行检索得到第一检索结果,其中,所述初始图形信息包括第一文件中的图像,所述第一检索结果包括多个第二文件的信息;从第一检索结果中确定至少一个候选对象;基于所述候选对象的上下文信息,确定目标检索结果。确定目标检索结果。确定目标检索结果。

【技术实现步骤摘要】
检索文件的方法和装置


[0001]本申请属于图像数据处理领域,具体涉及一种检索文件的方法和装置。

技术介绍

[0002]在检索过程中,允许用户通过上传图像检索与该图像相关联的文件。但是,仅图像本身往往不足以传达专利技术创造的基本想法的。如果图像搜索系统仅依赖于查询图像特征本身,则将搜索到在视觉上相似但在设计构思上无关的结果,使得基于图像的检索结果不准确。

技术实现思路

[0003]本申请实施例的目的是提供一种检索文件的方法和装置,能够解决基于图像的检索结果不准确的问题。
[0004]为了解决上述技术问题,本申请实施例是通过以下各方面实现的:
[0005]第一方面,本申请实施例提供了一种检索文件的方法,该方法包括:基于初始图形信息进行检索得到第一检索结果,其中,所述初始图形信息包括第一文件中的图像,所述第一检索结果包括多个第二文件的信息;从第一检索结果中确定至少一个候选对象;基于所述候选对象的上下文信息,确定目标检索结果。
[0006]第二方面,本申请实施例提供了一种检索文件的装置,包括:检索模块,用于基于本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种检索文件的方法,其特征在于,所述方法包括:基于初始图形信息进行检索得到第一检索结果,其中,所述初始图形信息包括第一文件中的图像,所述第一检索结果包括多个第二文件的信息;从第一检索结果中确定至少一个候选对象;基于所述候选对象的上下文信息,确定目标检索结果。2.根据权利要求1所述的方法,其特征在于,在基于所述候选对象的上下文信息,确定目标检索结果之前,所述方法还包括:将训练对象作为训练数据集;对所述训练对象的上下文信息进行训练,获得图像嵌入模型,所述训练对象的上下文信息包括以下信息中的至少一者:图像信息、文本短语、元信息和分类信息;所述基于所述候选对象的上下文信息,确定目标检索结果,包括:将所述候选对象的上下文信息输入所述图像嵌入模型以确定所述目标检索结果。3.根据权利要求2所述的方法,其特征在于,所述对所述训练对象的上下文信息进行训练,获得图像嵌入模型,包括:将训练数据集中的训练数据划分为不同类别;基于预定阈值的图像相似性,对所述各所述类别中的训练数据进行聚类,以生成训练组,所述训练组中包含多个训练数据的聚类。4.根据权利要求3所述的方法,其特征在于,在对所述各所述类别中的训练数据进行聚类,以生成训练组之后,所述方法还包括:从所述训练数据集中提取三元组,作为损失函数;通过所述损失函数对所述图像嵌入模型进行调整。5.根据权利要求2所述的方法,其特征在于,基于所述候选对象的上下文信息,确定目标检索结果,包括:根据所述图像嵌入模型,确定多个文件中多个图像的嵌入结果;将所述候选对象的上下文信息作为所述图像嵌入模型的输入,将所述图像嵌入模型的输出作为候选嵌入结果;根据所述多个图像的嵌入结果与所述候选嵌入结果之间的相似度,确定所述目标检索结果。6.根据权利要求1所述的方法,其特征在于,在所述确定目标检索结果之后,所述方法还包括:基于多个相似性元素,生成所述第二文件中的图像节点与所述相似性元素之间的关联关系;通过所述关联关系,确定所述目标检索结果与所述初始图形信息之间的相似度;基于相似度,对所述目标检索结果进行排序。7.根据权利要求1所述的方法,其特征在于,所述候选对象的上下文信息包括:所述候选对象的应用域或所述候选对象的图像类型,所述基于所述候选对象的上下文信息,确定目标检索结果,包括:基于所述候选对象的应用域或所述候选对象的图像类型,确定目标检索结果。
8.一种检索文件的装置,其特征在于,所述装置包括:检索模块,用于基于初始图形信息...

【专利技术属性】
技术研发人员:杜嘉马库斯
申请(专利权)人:智慧芽信息科技苏州有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1