一种图像识别方法、装置、设备及存储介质制造方法及图纸

技术编号:35188826 阅读:16 留言:0更新日期:2022-10-12 18:03
本发明专利技术公开了一种图像识别方法、装置、设备及存储介质,该方法包括:获取一张或多张用于检索的目标图像,根据一张或多张目标图像,确定用户的意向模式,意向模式用于指示用户的兴趣点信息,确定与意向模式对应的目标相似图像集合,并展示目标相似图像集合,利用通用特征实现任意场景的细粒度检索,通过确定用户的意向模式得到用户所感兴趣的方向,按照用户意向模式向用户提供目标相似图像集合,所提供的目标相似图像集合可以准确符合用户的用户意向。向。向。

【技术实现步骤摘要】
一种图像识别方法、装置、设备及存储介质


[0001]本专利技术涉及图像处理
,尤其涉及一种图像识别方法、装置、设备及存储介质。

技术介绍

[0002]在当下的信息时代,用户从海量图像数据中查询意向图像具有很大的需求,以图搜图是一种比较高效的图像内容搜索策略,用户提供图像,系统返回更多的相似图像供用户使用。但是,一张图像中可能包含多种不同的信息,当根据用户提供的图像返回相似图像时,会出现部分与用户意向偏差较大的图像。例如,当用户输入包含A类型车的图像,并希望得到A类型车的其他图像,但是系统只识别出了车这个信息,结果返回了大量非A类型车的图像。

技术实现思路

[0003]本专利技术提供了一种图像识别方法、装置、设备及存储介质,以解决在进行以图搜图时,得到的图像存在与用户意向偏差较大的问题,通过图像识别确定用户意向,以使返回的图像满足用户意向。
[0004]根据本专利技术的一方面,提供了一种图像识别方法,所述方法包括:
[0005]获取一张或多张用于检索的目标图像;
[0006]根据一张或多张所述目标图像,确定用户的意向模式,所述意向模式用于指示用户的兴趣点信息;
[0007]确定与所述意向模式对应的目标相似图像集合,并展示所述目标相似图像集合。
[0008]根据本专利技术的一方面,提供了一种图像识别装置,所述装置包括:
[0009]目标图像获取模块,用于获取一张或多张用于检索的目标图像;
[0010]意向模式确定模块,用于根据一张或多张所述目标图像,确定用户的意向模式,所述意向模式用于指示用户的兴趣点信息;
[0011]目标相似图像集合确定模块,用于确定与所述意向模式对应的目标相似图像集合,并展示所述目标相似图像集合。
[0012]根据本专利技术的另一方面,提供了一种电子设备,所述电子设备包括:
[0013]至少一个处理器;以及
[0014]与所述至少一个处理器通信连接的存储器;其中,
[0015]所述存储器存储有可被所述至少一个处理器执行的计算机程序,所述计算机程序被所述至少一个处理器执行,以使所述至少一个处理器能够执行本专利技术任一实施例所述的一种图像识别方法。
[0016]根据本专利技术的另一方面,提供了一种计算机可读存储介质,所述计算机可读存储介质存储有计算机指令,所述计算机指令用于使处理器执行时实现本专利技术任一实施例所述的一种图像识别方法。
[0017]本专利技术实施例公开了一种图像识别方法,通过获取一张或多张用于检索的目标图像,根据一张或多张目标图像,确定用户的意向模式,意向模式用于指示用户的兴趣点信息,确定与意向模式对应的目标相似图像集合,并展示目标相似图像集合,利用通用特征实现任意场景的细粒度检索,通过确定用户的意向模式得到用户所感兴趣的方向,按照用户意向模式向用户提供目标相似图像集合,所提供的目标相似图像集合可以准确符合用户的用户意向。
[0018]应当理解,本部分所描述的内容并非旨在标识本专利技术的实施例的关键或重要特征,也不用于限制本专利技术的范围。本专利技术的其它特征将通过以下的说明书而变得容易理解。
附图说明
[0019]为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。
[0020]图1是根据本专利技术实施例一提供的一种图像识别方法的流程图;
[0021]图2是根据本专利技术实施例一提供的一种基于人机交互的用户意向识别流程的示意图;
[0022]图3是根据本专利技术实施例二提供的一种图像识别装置的结构示意图;
[0023]图4是实现本专利技术实施例的一种图像识别方法的电子设备的结构示意图。
具体实施方式
[0024]为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都应当属于本专利技术保护的范围。
[0025]需要说明的是,本专利技术的说明书和权利要求书及上述附图中的术语“第一”、“第二”等是用于区别类似的对象,而不必用于描述特定的顺序或先后次序。应该理解这样使用的数据在适当情况下可以互换,以便这里描述的本专利技术的实施例能够以除了在这里图示或描述的那些以外的顺序实施。此外,术语“包括”和“具有”以及他们的任何变形,意图在于覆盖不排他的包含,例如,包含了一系列步骤或单元的过程、方法、系统、产品或设备不必限于清楚地列出的那些步骤或单元,而是可包括没有清楚地列出的或对于这些过程、方法、产品或设备固有的其它步骤或单元。
[0026]实施例一
[0027]图1为本专利技术实施例一提供了一种图像识别方法的流程图。
[0028]用户意向用于指示用户的兴趣点信息,可以理解为用户感兴趣的、用户想要得到的。对于传统内容搜索方式,用户无法干预返回的结果,即使结果得出了用户不想要的内容,也无法反馈。本实施例提供的图像识别方法,可以通过用户对当前返回的内容进行反馈,根据反馈的情况,在线更新搜索结果,直到搜索结果为满足用户意向的结果。
[0029]目前,对于细粒度内容检索引擎依赖细粒度特征,这种特征一般只能用于特定场景,比如汽车细粒度特征不能用于植物细粒度检索。其中,细粒度与粗粒度相对应,可以理解为细分类别。比如车和飞机之间可以认为是粗粒度,即粗分类,而A品牌车和B品牌车就是细粒度。对于本方法而言,可以不依赖场景相关的细粒度特征,基于一种通用特征,实现应用于对应用户意向的任意场景的细粒度检索。
[0030]该方法可以由一种图像识别装置来执行,该图像识别装置可以采用硬件和/或软件的形式实现。
[0031]如图1所示,该方法包括如下步骤
[0032]S110,获取一张或多张用于检索的目标图像。
[0033]用于检索的目标图像可以是来自于用户输入图像,在以图搜图的过程中,目标图像意味着包含了与用户的检索目的相关联的信息,即目标图像中存在用户感兴趣的信息。
[0034]S120,根据一张或多张目标图像,确定用户的意向模式,意向模式用于指示用户的兴趣点信息。
[0035]用户的意向模式用于指示用户的兴趣点信息,即用户所感兴趣的相关事物。具体的,可以指示用户感兴趣的图像类型。通过目标图像,例如用户输入的目标图像,可以从中得出多个模式,但不一定全部是用户所感兴趣的意向模式。示例性地,用户所感兴趣的是A品牌车,则目标图像中的A品牌车则为用户的意向模式,目标图像中的非A品牌车则不是用户的意向模式。由于目标图像可以是一张或多张,可以通过对多张目标图像中所包含的模式进行组合生成所含信息更为丰富的模式。
[0036]在根据目标图像确定用户的意向本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种图像识别方法,其特征在于,所述方法包括:获取一张或多张用于检索的目标图像;根据一张或多张所述目标图像,确定用户的意向模式,所述意向模式用于指示用户的兴趣点信息;确定与所述意向模式对应的目标相似图像集合,并展示所述目标相似图像集合。2.根据权利要求1所述的方法,其特征在于,所述确定与所述意向模式对应的目标相似图像集合,并展示所述目标相似图像集合,包括:确定与所述意向模式对应的相似图像集合,并展示所述相似图像集合;若在设定时间段内检测不到所述用户对所述相似图像集合的操作,则将所述相似图像集合作为目标相似图像集合;若在设定时间段内检测到所述用户对所述相似图像集合的操作,则响应于所述操作,确定所述用户的操作图像;基于所述操作图像以及所述操作更新所述意向模式;确定与更新后的所述意向模式对应的相似图像集合,直到检测不到所述用户的操作,则将最后一次更新得到的所述意向模式对应的相似图像集合,作为所述目标相似图像集合,并展示所述目标相似图像集合。3.根据权利要求1或2所述的方法,其特征在于,所述根据一张或多张所述目标图像,确定用户的意向模式,包括:提取一张或多张所述目标图像的第一特征向量;当所述目标图像为一张时,将所述第一特征向量作为用户的意向模式;当所述目标图像为多张时,将所有的所述第一特征向量进行融合,并将融合得到的第一融合特征向量作为所述意向模式。4.根据权利要求2所述的方法,其特征在于,所述确定与所述意向模式对应的相似图像集合,包括:获取预设图库中的所有图像的第二特征向量;分别确定所述意向模式与所述第二特征向量的第一相似度;将所述预设图库中所有所述第一相似度符合预设条件的图像,确定为与所述意向模式对应的相似图像集合。5.根据权利要求4所述的方法,其特征在于,所述操作包括:从所述相似图像集合中选定意向图像,以及,从所述相似图像集合中选定非意向图像;所述用户的操作图像包括:多张所述意向图像,以及,多张所述非意向图像;所述基于所述操作图像以及所述操作更新所述意向模式,包括:提取各所述意向图像的第三特征向量,以及,提取各所述非意向图像的第四特征向量;基于所述第一相似度,确定各所述意向图像的第一权重,以及,确定各所述非意向图像的第二权重;基于所述第一权重,将所有的所述第三特征向量进行融合得到第二融合特征向量;基于所述第二权重,将所有的所述第四特征向量进行融合得到第三融合特征向量;将所述第二融合特征向量与所述第三融合特征向量进行减法计算,并将得到的差作为所述意向模式,以完成所述意向模式的更新。
6.根据权利要求5所述的方法,其特征在于,所述基于所述第一相似度,确定各所述意向图像的第一权重,以及,确定各所述非意向图像的第二权重,包括:基于所述第一相似度,分别确定所述意向模式与各所述意向图像对应的所述第二特征向量的第二相似度,并对所述第二相似度进行排序;基于所述第一相似度,分别确定所述意向模式与各所述非意向图像对应的所述第二特征向量的第三相似度,并对所述第三相似度进行排序;根据排序...

【专利技术属性】
技术研发人员:王贯安韩旭
申请(专利权)人:广州文远知行科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1