一种基于显著性的动态目标检测与识别的方法及装置制造方法及图纸

技术编号：31802278 阅读：57 留言：0更新日期：2022-01-08 11:03

本发明专利技术提供一种基于显著性的动态目标检测与识别方法及装置，所述方法包括获取目标对象及视频；提取所述背景区内所有像素位置的特征向量，对提取到的全部特征向量进行聚类；整合每个聚类类别对应的距离图，得到初步显著图；基于超像素级保留边缘的高斯模糊对所述初步显著图进行优化增强；从优化增强后的显著图中对目标区域进行特征分割，得到在所述第一帧图像中的目标图像；将分割得到的目标图像轮廓输入基于机器学习的支持向量机，进行目标对象的识别。该方法具有识别精度高、运行速度快、计算成本小的技术效果。算成本小的技术效果。算成本小的技术效果。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于显著性的动态目标检测与识别的方法及装置

[0001]本专利技术属于计算机视觉领域，尤其涉及一种基于显著性的动态目标检测与识别的方法及装置。

技术介绍

[0002]检测与识别是计算机视觉领域最基本的问题之一，应用领域广。通常情况下，视觉传感器(可见光相机、红外相机、雷达等)获取图像后，目标检测与识别算法可在图像中找到需要的目标，获取其在图像中的对应位置和像素范围，同时给出目标类别。目标检测与识别是高级图像处理任务的基础，如图像分割，目标跟踪，事件判断等。
[0003]目前目标检测与识别算法大致可分为两种流派：基于传统方法的检测与识别算法以及基于深度学习的检测与识别算法。
[0004]基于传统方法的检测与识别算法的核心思想在于图像特征识别：首先对图像使用一一枚举的方式来判断选择对象可能的区域范围，再使用图像识别方法来提取这些可能区域范围的特征并进行分类，最后通过非极大值抑制(NMS)输出检测与识别结果。常见的方法有背景减除法、帧间差分法和光流法等。背景减除法提前建立一个没有目标对象的背景模板，将每一帧图片与背景模板相减，即可分割出背景和目标，从而检测出所需目标。该算法仅适用于运动场景固定且背景简单的场合，不具有适用性。帧间差分法则是选取相邻帧进行对比，选择直方图、亮度等合适的特征参数进行减法运算，从而获得目标对象的位置。该方式允许运动场景改变和多目标检测识别，但鲁棒性较差。光流法通过检测图像像素点的强度随时间的变化情况来推断目标物体的移动速度及移动方向，对目标检测与识别有较高的识别精度，但计算量过...

【技术保护点】

【技术特征摘要】
1.一种基于显著性的动态目标检测与识别方法，其特征在于，所述方法包括以下步骤：步骤S101：获取目标对象及视频，若所述目标对象未出现在所述第一帧图像中，将所述第一帧图像整体作为背景区；若所述目标对象出现在所述第一帧图像中，将除所述目标对象以外的边界区域作为背景区；步骤S102：提取所述背景区内所有像素位置的特征向量，对提取到的全部特征向量进行聚类；步骤S103：整合每个聚类类别对应的距离图，得到初步显著图；步骤S104：基于超像素级保留边缘的高斯模糊对所述初步显著图进行优化增强；步骤S105：从优化增强后的显著图中对目标区域进行特征分割，得到在所述第一帧图像中的目标图像；将分割得到的目标图像轮廓输入基于机器学习的支持向量机，进行目标对象的识别。2.如权利要求1所述的基于显著性的动态目标检测与识别方法，其特征在于，所述步骤S101，将除所述目标对象以外的边界区域作为背景区，其中，将图像中除去包含目标的最小外接矩形的环形局域定义为边界区域。3.如权利要求2所述的基于显著性的动态目标检测与识别方法，其特征在于，所述步骤S102：提取所述背景区内所有像素位置的特征向量，对提取到的全部特征向量进行聚类，包括：所述背景区内的每个像素位置的特征H(i,j)，以该像素为中心的邻域区块的CIELAB色彩空间的值来表示，i,j分别为图像像素点位置坐标；提取所述背景区内所有像素位置的特征向量，将所有像素位置的特征向量作为背景特征样本，采用K
‑
means聚类算法对所述背景特征样本进行聚类；聚类类别数为num，聚类P
n
中的背景特征样本数为Num
n
，聚类P
n
的中心特征值记为R
n
，其中，1≤n≤num。4.如权利要求3所述的基于显著性的动态目标检测与识别方法，其特征在于，所述步骤S103：整合每个聚类类别对应的距离图，得到初步显著图，包括：计算各个聚类类别对应的距离图，聚类类别P
n
对应的距离图为：D
n
(i,j)＝||H(i,j)
‑
R
n
||2ꢀꢀꢀꢀ
(公式1)其中，i，j表示图像像素点位置坐标，D
n
(i,j)表示原始图像中像素(i,j)对应的特征H(i，j)和聚类类别P
n
对应的群组的中心特征值R
n
之间的欧式距离，1≤n≤num；将得到的num个距离图归一化到[0，1]之间，整合这num个距离图得到初步显著图，整合方式如公式2所示：其中，N
c
(i,j)为初步显著图中各像素点的特征显著值，
×
表示像素对应的乘法，z
n
表示距离图的权重，z
n
定义如公式3所示。其中，z
n
∈[0,1]，权重值即为每个聚类群组的样本数目num(n)与总样本数目之比。
5.如权利要求4所述的基于显著性的动态目标检测与识别方法，其特...

【专利技术属性】
技术研发人员：郝肖冉，井世丽，曹璨，陈延真，吴盼良，
申请(专利权)人：河北汉光重工有限责任公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人