基于图像特征空间和空域空间的视觉词组构建方法和装置制造方法及图纸

技术编号:28132145 阅读:22 留言:0更新日期:2021-04-19 11:55
本发明专利技术公开了一种基于图像特征空间和空域空间的视觉词组构建方法和装置。该方法包括如下步骤:提取目标图像中满足预设条件的视觉单词,组成视觉单词集合;在视觉单词集合中选取目标图像中目标区域内的各关键特征单词;针对每一个关键特征单词,在视觉单词集合中提取与该关键特征单词有几何关系的邻域特征单词,与该关键特征单词构成对应视觉词组;基于构成的各视觉词组,建立描述目标图像特征的视觉词组集合。本发明专利技术将图像的局部特征空间和空域空间进行结合,共同构建视觉词组,可以大大降低目前视觉词组在图像匹配过程中的歧义性,获得有更高区分性的视觉词组。有更高区分性的视觉词组。有更高区分性的视觉词组。

【技术实现步骤摘要】
基于图像特征空间和空域空间的视觉词组构建方法和装置
[0001]技术邻域
[0002]本专利技术涉及一种基于图像特征空间和图像空域空间的视觉词组构建方法,同时涉及相应的视觉词组构建装置,属于图像识别


技术介绍

[0003]图像视觉特征的提取与表达是图像检索、分割和识别类算法中最基本、最核心的部分。高区分性的特征(Discriminative Feature)无论对图像的检索还是图像的分割、识别都有重要的意义。
[0004]根据特征的表达方式,图像特征通常可以分为:底层特征、中层特征和高层特征。低层特征往往由边缘、颜色、纹理等底层特征为基本单元构成,高层特征是按人的认知方式来理解图像的高层语义信息,而中层特征是为了减小底层与高层之间的语义鸿沟而提出的一种在底层特征分析的基础上产生的特征。从人的认知角度来看,对图像的理解,首先是抽象程度较高的高层语义特征,同时又包括简单的底层特征。因此,人的视觉对图像的理解是不同层次、不同粒度语义信息的获取过程。
[0005]传统的图像特征模型往往由特征点、边缘、颜色、纹理等底层特征为基本单元,向上构建复杂语义和概念抽象。但是由于底层特征及其构建的局部特征,往往存在同义性和多义性,即相似的局部特征可能量化到不同的局部特征上,而不相似的局部特征也可能量化到相同的局部特征上,而基于深度学习提取的语义特征还存在着区分性不高的现状。另一方面,图像来源及种类多样复杂,并受到尺度、光照、视角和复杂背景等不同因素的制约,从而产生底层特征和高层语义之间的语义鸿沟。因此,如何定义高区分性的图像特征,如何克服图像特征的同义性和多义性,仍然是目前亟待解决的问题。

技术实现思路

[0006]本专利技术所要解决的首要技术问题在于提供一种基于图像特征空间和图像空域空间的视觉词组构建方法。
[0007]本专利技术所要解决的另一技术问题在于提供一种基于图像特征空间和图像空域空间的视觉词组构建装置。
[0008]为了实现上述目的,本专利技术采用下述的技术方案:
[0009]根据本专利技术实施例的第一方面,提供一种基于图像特征空间和图像空域空间的视觉词组构建方法,包括如下步骤:
[0010]提取目标图像中满足预设条件的视觉单词,组成视觉单词集合;
[0011]在视觉单词集合中选取目标图像中目标区域内的各关键特征单词;
[0012]针对每一个关键特征单词,在视觉单词集合中提取与该关键特征单词有几何关系的邻域特征单词,与该关键特征单词构成对应视觉词组;
[0013]基于构成的各视觉词组,建立描述目标图像特征的视觉词组集合。
[0014]其中较优地,所述提取目标图像中满足预设条件的视觉单词,组成视觉单词集合,
具体包括如下步骤:
[0015]将目标图像的局部特征量化为各视觉单词;
[0016]针对视觉单词的类别,统计各类视觉单词的出现频率,选择频率高于预设频率的视觉单词组成视觉单词集合。
[0017]其中较优地,所述在视觉单词集合中提取与该关键特征单词有几何关系的邻域特征单词,具体包括如下步骤:
[0018]以当前关键特征单词在目标图像中的位置为圆心,以预定距离为半径画圆;
[0019]在视觉单词集合中找寻当前关键特征单词对应的邻域特征单词;所述邻域特征单词的在目标图像中的位置必须在所画的圆内。
[0020]其中较优地,所述与该关键特征单词构成对应视觉词组,具体包括如下步骤:
[0021]以当前关键特征单词的位置,以及任意两个对应邻域特征单词的位置为顶点,组成三角形;
[0022]判定该三角形的最短边长大于预设边长,且判定该三角形的最小角大于预设角后,则选择该三角形对应的当前关键特征单词和任意两个对应邻域特征单词为目标图像的一个视觉词组。
[0023]其中较优地,所述基于构成的各视觉词组,建立描述目标图像特征的视觉词组集合,具体包括如下步骤:
[0024]将构成的各视觉词组进行分类;
[0025]对同一类别的视觉词组进行编码;
[0026]根据各类别视觉词组的编码,建立描述目标图像特征的视觉词组集合。
[0027]其中较优地,所述将构成的各视觉词组进行分类,具体包括如下步骤:
[0028]判断任意两个视觉词组中关键特征单词和邻域特征单词在目标图像中的位置是否能一一对应对齐;
[0029]若能对齐,则所述两个视觉词组属于同一类型;
[0030]若不能对齐,则所述两个视觉词组分属不同类型。
[0031]其中较优地,所述对同一类别的视觉词组进行编码,具体包括如下步骤:
[0032]根据当前类别视觉词组的关键特征单词和邻域特征单词在目标图像中的位置,获取关键特征单词和邻域特征单词的位置信息;
[0033]根据所述位置信息,对对应关键特征单词或邻域特征单词进行编码;
[0034]根据当前类别视觉词组的关键特征单词和邻域特征单词的编码,组成当前类别视觉词组的编码。
[0035]其中较优地,所述根据各类别视觉词组的编码,建立描述目标图像特征的视觉词组集合,具体包括如下步骤:
[0036]统计各类视觉词组的出现频率;
[0037]将频率高于预定频率的视觉词组的编码组成编码集合;
[0038]令所述编码集合为描述目标图像特征的视觉词组集合。
[0039]其中较优地,所述判断任意两个视觉词组中关键特征单词和邻域特征单词在目标图像中的位置是否能一一对应对齐,具体包括如下步骤:
[0040]获取各关键特征单词和邻域特征单词在目标图像中的位置所属视觉单词的编码;
[0041]根据所述位置所属视觉单词的编码,计算分属不同视觉词组的两个对应关键特征单词或邻域特征单词在目标图像中的最小位置距离;
[0042]若计算出的最小位置距离等于零,则判定两个对应关键特征单词或邻域特征单词在目标图像中的位置对齐。
[0043]根据本专利技术实施例的第二方面,提供一种基于图像特征空间和图像空域空间的视觉词组构建装置,包括处理器和存储器,所述处理器读取所述存储器中的计算机程序,用于执行以下操作:
[0044]提取目标图像中满足预设条件的视觉单词,组成视觉单词集合;
[0045]在视觉单词集合中选取目标图像中目标区域内的各关键特征单词;
[0046]针对每一个关键特征单词,在视觉单词集合中提取与该关键特征单词有几何关系的邻域特征单词,与该关键特征单词构成对应视觉词组;
[0047]基于构成的各视觉词组,建立描述目标图像特征的视觉词组集合。
[0048]本专利技术所提供的视觉词组构建方法和装置,可以充分利用图像的局部特征空间的上下文约束和图像空域空间的有效信息,大大提高了图像视觉特征提取的精准度。将该视觉词组构建方法和装置应用到图像识别中,可以大大提高图像检索、分类和识别的准确度。
附图说明
[0049]图1为本专利技术实施例提供的视觉词组构建方法的流程示意本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于图像特征空间和空域空间的视觉词组构建方法,其特征在于包括如下步骤:提取目标图像中满足预设条件的视觉单词,组成视觉单词集合;在视觉单词集合中选取目标图像中目标区域内的各关键特征单词;针对每一个关键特征单词,在视觉单词集合中提取与该关键特征单词有几何关系的邻域特征单词,与该关键特征单词构成对应视觉词组;基于构成的各视觉词组,建立描述目标图像特征的视觉词组集合。2.如权利要求1所述的基于图像特征空间和空域空间的视觉词组构建方法,其特征在于,所述提取目标图像中满足预设条件的视觉单词,组成视觉单词集合,具体包括如下步骤:将目标图像的局部特征量化为各视觉单词;针对视觉单词的类别,统计各类视觉单词的出现频率,选择频率高于预设频率的视觉单词组成视觉单词集合。3.如权利要求1所述的基于图像特征空间和空域空间的视觉词组构建方法,其特征在于,所述在视觉单词集合中提取与该关键特征单词有几何关系的邻域特征单词,具体包括如下步骤:以当前关键特征单词在目标图像中的位置为圆心,以预定距离为半径画圆;在视觉单词集合中找寻当前关键特征单词对应的邻域特征单词;所述邻域特征单词的在目标图像中的位置必须在所画的圆内。4.如权利要求3所述的基于图像特征空间和空域空间的视觉词组构建方法,其特征在于,所述与该关键特征单词构成对应视觉词组,具体包括如下步骤:以当前关键特征单词的位置,以及任意两个对应邻域特征单词的位置为顶点,组成三角形;判定该三角形的最短边长大于预设边长,且判定该三角形的最小角大于预设角后,则选择该三角形对应的当前关键特征单词和任意两个对应邻域特征单词为目标图像的一个视觉词组。5.如权利要求1所述的基于图像特征空间和空域空间的视觉词组构建方法,其特征在于,所述基于构成的各视觉词组,建立描述目标图像特征的视觉词组集合,具体包括如下步骤:将构成的各视觉词组进行分类;对同一类别的视觉词组进行编码;根据各类别视觉词组的编码,建立描述目标图像特征的视觉词组集合。6.如权利要求5所述的基于图像特征空间和空域空间的视觉词组构建方法,其特征在于,所述将构成的各视觉词组进行分类,具体包括如下...

【专利技术属性】
技术研发人员:王亚楠
申请(专利权)人:瞬联软件科技南京有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1