一种基于显著性的动态目标检测与识别的方法及装置制造方法及图纸

技术编号:31802278 阅读:57 留言:0更新日期:2022-01-08 11:03
本发明专利技术提供一种基于显著性的动态目标检测与识别方法及装置,所述方法包括获取目标对象及视频;提取所述背景区内所有像素位置的特征向量,对提取到的全部特征向量进行聚类;整合每个聚类类别对应的距离图,得到初步显著图;基于超像素级保留边缘的高斯模糊对所述初步显著图进行优化增强;从优化增强后的显著图中对目标区域进行特征分割,得到在所述第一帧图像中的目标图像;将分割得到的目标图像轮廓输入基于机器学习的支持向量机,进行目标对象的识别。该方法具有识别精度高、运行速度快、计算成本小的技术效果。算成本小的技术效果。算成本小的技术效果。

【技术实现步骤摘要】
一种基于显著性的动态目标检测与识别的方法及装置


[0001]本专利技术属于计算机视觉领域,尤其涉及一种基于显著性的动态目标检测与识别的方法及装置。

技术介绍

[0002]检测与识别是计算机视觉领域最基本的问题之一,应用领域广。通常情况下,视觉传感器(可见光相机、红外相机、雷达等)获取图像后,目标检测与识别算法可在图像中找到需要的目标,获取其在图像中的对应位置和像素范围,同时给出目标类别。目标检测与识别是高级图像处理任务的基础,如图像分割,目标跟踪,事件判断等。
[0003]目前目标检测与识别算法大致可分为两种流派:基于传统方法的检测与识别算法以及基于深度学习的检测与识别算法。
[0004]基于传统方法的检测与识别算法的核心思想在于图像特征识别:首先对图像使用一一枚举的方式来判断选择对象可能的区域范围,再使用图像识别方法来提取这些可能区域范围的特征并进行分类,最后通过非极大值抑制(NMS)输出检测与识别结果。常见的方法有背景减除法、帧间差分法和光流法等。背景减除法提前建立一个没有目标对象的背景模板,将每一帧图片与背景模板相减,即可分割出背景和目标,从而检测出所需目标。该算法仅适用于运动场景固定且背景简单的场合,不具有适用性。帧间差分法则是选取相邻帧进行对比,选择直方图、亮度等合适的特征参数进行减法运算,从而获得目标对象的位置。该方式允许运动场景改变和多目标检测识别,但鲁棒性较差。光流法通过检测图像像素点的强度随时间的变化情况来推断目标物体的移动速度及移动方向,对目标检测与识别有较高的识别精度,但计算量过大、时间复杂度较高。
[0005]基于深度学习的检测与识别算法的核心思想是通过算法对图像进行处理,生成一系列的候选区域,将候选区域作为样本,提取每个候选区域的图片特征通过卷积神经网络(CNN)对样本进行分类。此类较为常见的检测与识别算法按照出现的时间顺序,分别有:R

CNN算法、Fast R

CNN算法、以及Faster R

CNN算法等。2014年,提出了R

CNN算法,作为第一个将深度学习应用在目标检测上的算法,首次提出在目标检测时先进行候选区域的提取,通过选择性搜索方法提取一系列候选框,然后每个候选区域被重新调整为一个特定大小的图像,提取完成之后再对每个候选区域提取各自显著的特征,多次进行,也就是“卷积

池化

卷积

池化”,最后再进行分类及后续处理。2015年,Fast R

CNN算法首次提出了端到端的处理模式,且运行速度较前一算法有了较大的提升。同样是2015年,Faster R

CNN算法出现,至今仍然是精确度最高的算法之一。相比于前人算法,其优势在于利用一个RPN网络取代之前的选择性搜索算法,以此减少候选区域的数量,提高了处理速度。基于深度学习的检测与识别算法精度较高,但前期需要大量的计算样本,且解算速度慢,无法实时检测与识别。
[0006]综合以上内容,基于传统方法的检测与识别算法精度差,不适用于动态目标。基于深度学习的检测与识别算法所需计算量大,耗时长,不具有普适性。

技术实现思路

[0007]为解决上述技术问题,本专利技术提出了一种基于显著性的动态目标检测与识别的方法,用于解决现有技术的目标检测方法检测与识别算法精度差,不适用于动态目标,算量大,耗时长,不具有普适性的技术问题。
[0008]根据本专利技术的第一方面,提供一种基于显著性的动态目标检测与识别的方法,所述方法包括以下步骤:
[0009]步骤S101:获取目标对象及视频,若所述目标对象未出现在所述第一帧图像中,将所述第一帧图像整体作为背景区;若所述目标对象出现在所述第一帧图像中,将除所述目标对象以外的边界区域作为背景区;
[0010]步骤S102:提取所述背景区内所有像素位置的特征向量,对提取到的全部特征向量进行聚类;
[0011]步骤S103:整合每个聚类类别对应的距离图,得到初步显著图;
[0012]步骤S104:基于超像素级保留边缘的高斯模糊对所述初步显著图进行优化增强;
[0013]步骤S105:从优化增强后的显著图中对目标区域进行特征分割,得到在所述第一帧图像中的目标图像;将分割得到的目标图像轮廓输入基于机器学习的支持向量机,进行目标对象的识别。
[0014]根据本专利技术的第二方面,提供一种基于显著性的动态目标检测与识别的装置,所述装置包括:
[0015]一种基于显著性的动态目标检测与识别装置,其特征在于,所述装置包括:
[0016]图像获取模块:配置为获取目标对象及视频,若所述目标对象未出现在所述第一帧图像中,将所述第一帧图像整体作为背景区;若所述目标对象出现在所述第一帧图像中,将除所述目标对象以外的边界区域作为背景区;
[0017]聚类模块:配置为提取所述背景区内所有像素位置的特征向量,对提取到的全部特征向量进行聚类;
[0018]初步显著图获取模块:配置为整合每个聚类类别对应的距离图,得到初步显著图;
[0019]优化增强模块:配置为基于超像素级保留边缘的高斯模糊对所述初步显著图进行优化增强;
[0020]目标识别模块:配置为从优化增强后的显著图中对目标区域进行特征分割,得到在所述第一帧图像中的目标图像;将分割得到的目标图像轮廓输入基于机器学习的支持向量机,进行目标对象的识别
[0021]根据本专利技术第三方面,提供一种基于显著性的动态目标检测与识别的系统,包括:
[0022]处理器,用于执行多条指令;
[0023]存储器,用于存储多条指令;
[0024]其中,所述多条指令,用于由所述存储器存储,并由所述处理器加载并执行如前所述的基于显著性的动态目标检测与识别的方法。
[0025]根据本专利技术第四方面,提供一种计算机可读存储介质,所述存储介质中存储有多条指令;所述多条指令,用于由处理器加载并执行如前所述的基于显著性的动态目标检测与识别的方法。
[0026]根据本专利技术的上述方案,结合视觉显著性原理,充分利用图像背景的特征信息和
统计信息,提出基于背景特征分布聚类算法对图像进行显著性检测,对显著性检测结果进行优化增强,利用超像素级保留边缘的高斯模糊优化算法进一步提高检测精度,最后由SVM分类器做准确识别,具有识别精度高、运行速度快、计算成本小的技术效果。
[0027]上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,并可依照说明书的内容予以实施,以下以本专利技术的较佳实施例并配合附图详细说明如后。
附图说明
[0028]构成本专利技术的一部分的附图用来提供对本专利技术的进一步理解,本专利技术提供如下附图进行说明。在附图中:
[0029]图1为本专利技术一个实施方式的基于显著性的动态目标检测与识别方法流程图;
[0030]图2为本专利技术一个实施方式的基于显著性的动态目本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于显著性的动态目标检测与识别方法,其特征在于,所述方法包括以下步骤:步骤S101:获取目标对象及视频,若所述目标对象未出现在所述第一帧图像中,将所述第一帧图像整体作为背景区;若所述目标对象出现在所述第一帧图像中,将除所述目标对象以外的边界区域作为背景区;步骤S102:提取所述背景区内所有像素位置的特征向量,对提取到的全部特征向量进行聚类;步骤S103:整合每个聚类类别对应的距离图,得到初步显著图;步骤S104:基于超像素级保留边缘的高斯模糊对所述初步显著图进行优化增强;步骤S105:从优化增强后的显著图中对目标区域进行特征分割,得到在所述第一帧图像中的目标图像;将分割得到的目标图像轮廓输入基于机器学习的支持向量机,进行目标对象的识别。2.如权利要求1所述的基于显著性的动态目标检测与识别方法,其特征在于,所述步骤S101,将除所述目标对象以外的边界区域作为背景区,其中,将图像中除去包含目标的最小外接矩形的环形局域定义为边界区域。3.如权利要求2所述的基于显著性的动态目标检测与识别方法,其特征在于,所述步骤S102:提取所述背景区内所有像素位置的特征向量,对提取到的全部特征向量进行聚类,包括:所述背景区内的每个像素位置的特征H(i,j),以该像素为中心的邻域区块的CIELAB色彩空间的值来表示,i,j分别为图像像素点位置坐标;提取所述背景区内所有像素位置的特征向量,将所有像素位置的特征向量作为背景特征样本,采用K

means聚类算法对所述背景特征样本进行聚类;聚类类别数为num,聚类P
n
中的背景特征样本数为Num
n
,聚类P
n
的中心特征值记为R
n
,其中,1≤n≤num。4.如权利要求3所述的基于显著性的动态目标检测与识别方法,其特征在于,所述步骤S103:整合每个聚类类别对应的距离图,得到初步显著图,包括:计算各个聚类类别对应的距离图,聚类类别P
n
对应的距离图为:D
n
(i,j)=||H(i,j)

R
n
||2ꢀꢀꢀꢀ
(公式1)其中,i,j表示图像像素点位置坐标,D
n
(i,j)表示原始图像中像素(i,j)对应的特征H(i,j)和聚类类别P
n
对应的群组的中心特征值R
n
之间的欧式距离,1≤n≤num;将得到的num个距离图归一化到[0,1]之间,整合这num个距离图得到初步显著图,整合方式如公式2所示:其中,N
c
(i,j)为初步显著图中各像素点的特征显著值,
×
表示像素对应的乘法,z
n
表示距离图的权重,z
n
定义如公式3所示。其中,z
n
∈[0,1],权重值即为每个聚类群组的样本数目num(n)与总样本数目之比。
5.如权利要求4所述的基于显著性的动态目标检测与识别方法,其特...

【专利技术属性】
技术研发人员:郝肖冉井世丽曹璨陈延真吴盼良
申请(专利权)人:河北汉光重工有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1