一种图像区域定位方法及装置制造方法及图纸

技术编号:26480211 阅读:26 留言:0更新日期:2020-11-25 19:25
本申请提供一种图像区域定位方法及装置,包括:获取训练图像、目标区域以及特征矩阵;根据所述训练图像和所述特征矩阵,计算出每一个像素点与所述目标区域的预测相似度;分别以所述训练图像中的每一个像素点为中心,获取一个与所述目标区域大小相同的矩形区域,并计算所述目标区域与所述矩形区域之间的模板匹配度;通过所述训练图像中每一个像素点的所述预测相似度与所述模板匹配度,构建训练模型;将图像输入到所述训练模型中,得出与所述目标区域预测相似度最高的矩形区域,完成区域特征筛选。本申请可以通过机器学习方法实现对图像中目标区域的粗定位,不容易受到图像和目标区域的复杂程度影响,并且不需要大量训练样本,更加简单。

【技术实现步骤摘要】
一种图像区域定位方法及装置
本申请涉及目标区域识别
,尤其涉及一种图像区域定位方法及装置。
技术介绍
基于图像匹配的图像定位方案,其在执行过程中对图像中的每一个像素点都需要执行与目标区域特征的匹配运算,并且该定位方案的耗时长短与图像和目标区域尺度成正比,还会受到图像和目标区域的复杂程度影响,从而容易出现处理时间过长。现有技术中,通过深度学习的方法,进行图像区域定位,但是采用深度学习网络的方法进行训练处理,则需要大量的训练样本图像,同时需要进行大量的矩阵运算,在训练样本图像较少的情况下,采用深度学习方法的性能并不好,而且使用深度学习对于图像中的目标区域的特征处理过程时间较长,专业要求更高,实现目标区域的定位过程较为复杂。
技术实现思路
本申请提供了一种图像区域定位方法及装置,以解决现有技术中存在的定位方案的处理时间过长,容易受到训练样本图像和目标区域的复杂程度影响,并且需要大量的训练样本图像,实现过程较为复杂的问题。第一方面,本申请提供一种图像区域定位方法,包括以下步骤:获取训练样本图像和所述训练样本图像中的目标区域以及与所述训练样本图像大小一致的特征矩阵;根据所述训练样本图像和所述特征矩阵,计算出所述训练样本图像中的每一个像素点与所述目标区域的预测相似度;分别以所述训练样本图像中的每一个像素点为基础,获取一个与所述目标区域大小相同的矩形区域,并计算所述目标区域与所述矩形区域之间的模板匹配度;通过所述训练样本图像中的每一个像素点的所述预测相似度与所述模板匹配度,构建训练模型;将需要定位的目标图像输入到所述训练模型中,得出与所述目标图像中的目标区域预测相似度最高的矩形区域。在本申请的较佳实施例中,所述目标区域为手动标定或者通过定位核选取功能选择出来的用于与背景进行区分的图像中的定位核区域。在本申请的较佳实施例中,所述特征矩阵经由高斯分布初始化方法优化。在本申请的较佳实施例中,通过所述训练样本图像中的每一个像素点与所述特征矩阵的对应特征点相乘,得到所述训练样本图像该像素点的所述预测相似度。在本申请的较佳实施例中,所述模板匹配度的具体计算过程如下:假设训练样本图像大小为M*N,则训练样本图像中像素点(i,j)处的模板匹配度NCC(i,j)为其中,(u,v)表示所述训练样本图像中目标区域的像素点,且遍历所述训练样本图像中目标区域的所有像素点,f(i+u,j+v)和t(u,v)分别表示训练样本图像中对应的特征值,uf和ut表示在M*N大小内的区域特征值的均值。在本申请的较佳实施例中,所述训练模型的具体构建过程如下:遍历训练样本图像中的所有像素点,计算当前像素点的预测相似度及其与所述训练样本图像中目标区域的模板匹配度,并求取所述当前像素点的预测相似度与所述模板匹配度的差值;若所述差值的绝对值大于所述第一阈值,则对特征矩阵参数进行更新,更新公式如下:Wt=Wt-α*loss,loss=y-NCC,其中,α表示更新步长,且为常数,loss表示差值,y表示预测相似度,NCC表示模板匹配度,Wt表示特征矩阵参数;对所有定位到的重叠矩形区域进行非极大值抑制,更新抑制掉的特征点的特征矩阵参数;根据所有所述重叠矩形区域的边界像素点计算每两个所述矩形区域之间的交并比;当所述交并比大于第二阈值时,保留所述预测相似度高的矩形区域;将所述预测相似度低的矩形区域的模板匹配度调整为0,重新计算loss值,重复上述步骤,直到loss为0,得到最优训练模型。在本申请的较佳实施例中,所述训练模型的目标函数F的计算公式如下:F=∑i,jNCC(i,j)-y(i,j),其中,NCC(i,j)为模板匹配度,y(i,j)为对应像素点的预测相似度。第二方面,本申请提供一种图像区域定位装置,包括:训练单元,用于获取若干训练样本图像和所述训练样本图像中的目标区域以及与所述训练样本图像大小一致的特征矩阵,并进行预测相似度和模板匹配度计算,不断更新特征矩阵的参数,得到最优训练模型;处理单元,用于将需要定位的目标图像输入所述最优训练模型中,找出预测相似度高的矩形区域,并输出图像区域定位结果。第三方面,本申请提供一种计算机可读存储介质,所述计算机可读存储介质存储有至少一条指令、至少一段程序、代码或指令集,所述至少一条指令、所述至少一段程序、所述代码集或指令集由处理器加载并执行以实现上述图像区域定位方法。本申请提供的一种图像区域定位方法及装置,相较于现有技术而言,具有以下有益效果:本申请通过机器学习方法,将训练样本图像中已经确定好的目标区域写成目标函数的形式,并通过训练过程不断对目标函数中的参数进行更新,使得目标函数不断逼近目标值,从而实现对训练样本图像中目标区域的粗定位,采用机器学习方法,能够显著降低在实际使用过程中的时间,且不容易受到训练样本图像和目标区域的复杂程度影响,也不需要大量训练样本图像,数据处理更加简单,对设备的要求较低,实现目标区域定位的过程也更加简单快速。附图说明为了更清楚地说明本申请的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,对于本领域普通技术人员而言,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本申请的一种区域特征提取方法的流程图;图2为本申请实施例1所采用的训练图像示意图;图3为本申请实施例1中两个矩形区域之间的相交面积示意图;图4为本申请实施例1中两个矩形区域之间的相并面积示意图。具体实施方式为使本申请的目的、实施方式和优点更加清楚,下面将结合本申请示例性实施例中的附图,对本申请示例性实施方式进行清楚、完整地描述,显然,所描述的示例性实施例仅是本申请一部分实施例,而不是全部的实施例。因此,以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围,而是仅仅表示本申请的选定实施例。基于本申请中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请保护的范围。在本申请实施例的描述中,需要说明的是,术语“左”、“右”等指示的方位或位置关系为基于附图所示的方位或位置关系,或者是该专利技术产品使用时惯常摆放的方位或位置关系,仅是为了便于描述本申请和简化描述,而不是指示或暗示所指的装置或元件必须具有特定的方位、以特定的方位构造和操作,因此不能理解为对本申请的限制。基于本申请描述的示例性实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本申请所附权利要求保护的范围。此外,虽然本申请中公开内容按照示范性一个或几个实例来介绍,但应理解,可以就这些公开内容的各个方面也可以单独构成一个完整实施方式。需要说明的是,本申请中对于术语的简要说明,仅是为了方便理解接下来描述的实施方式,而不是意图本文档来自技高网...

【技术保护点】
1.一种图像区域定位方法,其特征在于,包括以下步骤:/n获取训练样本图像和所述训练样本图像中的目标区域以及与所述训练样本图像大小一致的特征矩阵;/n根据所述训练样本图像和所述特征矩阵,计算出所述训练样本图像中的每一个像素点与所述目标区域的预测相似度;/n分别以所述训练样本图像中的每一个像素点为基础,获取一个与所述目标区域大小相同的矩形区域,并计算所述目标区域与所述矩形区域之间的模板匹配度;/n通过所述训练样本图像中的每一个像素点的所述预测相似度与所述模板匹配度,构建训练模型;/n将需要定位的目标图像输入到所述训练模型中,得出与所述目标图像中的目标区域预测相似度最高的矩形区域。/n

【技术特征摘要】
1.一种图像区域定位方法,其特征在于,包括以下步骤:
获取训练样本图像和所述训练样本图像中的目标区域以及与所述训练样本图像大小一致的特征矩阵;
根据所述训练样本图像和所述特征矩阵,计算出所述训练样本图像中的每一个像素点与所述目标区域的预测相似度;
分别以所述训练样本图像中的每一个像素点为基础,获取一个与所述目标区域大小相同的矩形区域,并计算所述目标区域与所述矩形区域之间的模板匹配度;
通过所述训练样本图像中的每一个像素点的所述预测相似度与所述模板匹配度,构建训练模型;
将需要定位的目标图像输入到所述训练模型中,得出与所述目标图像中的目标区域预测相似度最高的矩形区域。


2.根据权利要求1所述的一种图像区域定位方法,其特征在于,所述训练模型的具体构建过程如下:
遍历训练样本图像中的所有像素点,计算当前像素点的预测相似度及其与所述训练样本图像中目标区域的模板匹配度,并求取所述当前像素点的预测相似度与所述模板匹配度的差值;
若所述差值的绝对值大于所述第一阈值,则对特征矩阵参数进行更新,更新公式如下:
Wt=Wt-α*loss,loss=y-NCC,
其中,α表示更新步长,且为常数,loss表示差值,y表示预测相似度,NCC表示模板匹配度,Wt表示特征矩阵参数;
对所有定位到的重叠矩形区域进行非极大值抑制,更新抑制掉的特征点的特征矩阵参数;
根据所有所述重叠矩形区域的边界像素点计算每两个所述矩形区域之间的交并比;
当所述交并比大于第二阈值时,保留所述预测相似度高的矩形区域;
将所述预测相似度低的矩形区域的模板匹配度调整为0,重新计算loss值,重复上述步骤,直到loss为0,得到最优训练模型。


3.根据权利要求2所述的一种图像区域定位方法,其特征在于,所述训练模型的目标函数F的计算公式如下:
F=∑i,jNCC(i,j)-y(i,j),
其中,NCC(i,j)为模板匹配度,y(i,j)为对应像...

【专利技术属性】
技术研发人员:胡凯
申请(专利权)人:北京凌云光技术集团有限责任公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1