一种图像区域定位方法及装置制造方法及图纸

技术编号：26480211 阅读：33 留言：0更新日期：2020-11-25 19:25

本申请提供一种图像区域定位方法及装置，包括：获取训练图像、目标区域以及特征矩阵；根据所述训练图像和所述特征矩阵，计算出每一个像素点与所述目标区域的预测相似度；分别以所述训练图像中的每一个像素点为中心，获取一个与所述目标区域大小相同的矩形区域，并计算所述目标区域与所述矩形区域之间的模板匹配度；通过所述训练图像中每一个像素点的所述预测相似度与所述模板匹配度，构建训练模型；将图像输入到所述训练模型中，得出与所述目标区域预测相似度最高的矩形区域，完成区域特征筛选。本申请可以通过机器学习方法实现对图像中目标区域的粗定位,不容易受到图像和目标区域的复杂程度影响，并且不需要大量训练样本，更加简单。

全部详细技术资料下载

【技术实现步骤摘要】
一种图像区域定位方法及装置
本申请涉及目标区域识别
，尤其涉及一种图像区域定位方法及装置。
技术介绍
基于图像匹配的图像定位方案，其在执行过程中对图像中的每一个像素点都需要执行与目标区域特征的匹配运算，并且该定位方案的耗时长短与图像和目标区域尺度成正比，还会受到图像和目标区域的复杂程度影响，从而容易出现处理时间过长。现有技术中，通过深度学习的方法，进行图像区域定位，但是采用深度学习网络的方法进行训练处理，则需要大量的训练样本图像，同时需要进行大量的矩阵运算，在训练样本图像较少的情况下，采用深度学习方法的性能并不好，而且使用深度学习对于图像中的目标区域的特征处理过程时间较长，专业要求更高，实现目标区域的定位过程较为复杂。
技术实现思路
本申请提供了一种图像区域定位方法及装置，以解决现有技术中存在的定位方案的处理时间过长，容易受到训练样本图像和目标区域的复杂程度影响，并且需要大量的训练样本图像，实现过程较为复杂的问题。第一方面，本申请提供一种图像区域定位方法，包括以下步骤：获取训练样本图像和所述训练样本图像中的目标区域以及与所述训练样本图像大小一致的特征矩阵；根据所述训练样本图像和所述特征矩阵，计算出所述训练样本图像中的每一个像素点与所述目标区域的预测相似度；分别以所述训练样本图像中的每一个像素点为基础，获取一个与所述目标区域大小相同的矩形区域，并计算所述目标区域与所述矩形区域之间的模板匹配度；通过所述训练样本图像中的每一个像素点的所述预测...

【技术保护点】
1.一种图像区域定位方法，其特征在于，包括以下步骤：/n获取训练样本图像和所述训练样本图像中的目标区域以及与所述训练样本图像大小一致的特征矩阵；/n根据所述训练样本图像和所述特征矩阵，计算出所述训练样本图像中的每一个像素点与所述目标区域的预测相似度；/n分别以所述训练样本图像中的每一个像素点为基础，获取一个与所述目标区域大小相同的矩形区域，并计算所述目标区域与所述矩形区域之间的模板匹配度；/n通过所述训练样本图像中的每一个像素点的所述预测相似度与所述模板匹配度，构建训练模型；/n将需要定位的目标图像输入到所述训练模型中，得出与所述目标图像中的目标区域预测相似度最高的矩形区域。/n

【技术特征摘要】
1.一种图像区域定位方法，其特征在于，包括以下步骤：
获取训练样本图像和所述训练样本图像中的目标区域以及与所述训练样本图像大小一致的特征矩阵；
根据所述训练样本图像和所述特征矩阵，计算出所述训练样本图像中的每一个像素点与所述目标区域的预测相似度；
分别以所述训练样本图像中的每一个像素点为基础，获取一个与所述目标区域大小相同的矩形区域，并计算所述目标区域与所述矩形区域之间的模板匹配度；
通过所述训练样本图像中的每一个像素点的所述预测相似度与所述模板匹配度，构建训练模型；
将需要定位的目标图像输入到所述训练模型中，得出与所述目标图像中的目标区域预测相似度最高的矩形区域。

2.根据权利要求1所述的一种图像区域定位方法，其特征在于，所述训练模型的具体构建过程如下：
遍历训练样本图像中的所有像素点，计算当前像素点的预测相似度及其与所述训练样本图像中目标区域的模板匹配度，并求取所述当前像素点的预测相似度与所述模板匹配度的差值；
若所述差值的绝对值大于所述第一阈值，则对特征矩阵参数进行更新，更新公式如下：
Wt＝Wt-α*loss，loss＝y-NCC，
其中，α表示更新步长，且为常数，loss表示差值，y表示预测相似度，NCC表示模板匹配度，Wt表示特征矩阵参数；
对所有定位到的重叠矩形区域进行非极大值抑制，更新抑制掉的特征点的特征矩阵参数；
根据所有所述重叠矩形区域的边界像素点计算每两个所述矩形区域之间的交并比；
当所述交并比大于第二阈值时，保留所述预测相似度高的矩形区域；
将所述预测相似度低的矩形区域的模板匹配度调整为0，重新计算loss值，重复上述步骤，直到loss为0，得到最优训练模型。

3.根据权利要求2所述的一种图像区域定位方法，其特征在于，所述训练模型的目标函数F的计算公式如下：
F＝∑i,jNCC(i,j)-y(i,j)，
其中，NCC(i，j)为模板匹配度，y(i,j)为对应像...

【专利技术属性】
技术研发人员：胡凯，
申请(专利权)人：北京凌云光技术集团有限责任公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人