多视角目标检测方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:33922583 阅读:19 留言:0更新日期:2022-06-25 21:15
本发明专利技术实施例提出一种多视角目标检测方法、装置、计算机设备及存储介质,属于计算机视觉领域,方法包括:获取待测图像的多个局部图像块,以及每个局部图像块的图像块特征,根据每个图像块特征,利用预设的随机森林模型,将多个局部图像块划分成多个视觉单词,从而计算每个视觉单词对待测图像的每个候选中心位置的投票分,获得每个候选中心位置关于各个视觉单词的投票组合权重,进而根据投票组合权重和投票分,计算每个候选中心位置的总得分,并根据每个候选中心位置的总得分,确定出目标中心位置,能够充分考虑视角因素,从而能够降低目标被遮挡、发生变形和角度变化等干扰情况的影响,提高目标检测的准确性。提高目标检测的准确性。提高目标检测的准确性。

【技术实现步骤摘要】
多视角目标检测方法、装置、计算机设备及存储介质


[0001]本专利技术涉及计算机视觉领域,具体而言,涉及一种多视角目标检测方法、装置、计算机设备及存储介质。

技术介绍

[0002]目标检测是计算机视觉领域最基本的问题,其核心任务是对任意一幅给定的图像,采用某种目标识别算法和搜索策略,确定特定目标在图像中的位置和大小。目前,虽然目标检测技术已有了显著的发展,但是目标检测技术的跟踪器大多通过全局整体外观模型提取特征的方式,来确定目标位置。当目标被遮挡、发生变形和角度变化等干扰情况发生时,极易出现因跟踪器的跟踪效果不佳,导致目标检测准确性低的问题。

技术实现思路

[0003]有鉴于此,本专利技术的目的在于提供一种多视角目标检测方法、装置、计算机设备及存储介质,其能够改善目前的目标检测方法,其能够改善传统的目标检测方法目标检测准确性低的问题。
[0004]为了实现上述目的,本专利技术实施例采用的技术方案如下。
[0005]第一方面,本专利技术实施例提供了一种多视角目标检测方法,采用如下的技术方案。
[0006]一种多视角目标检测方法,所述方法包括:
[0007]获取待测图像的多个局部图像块,以及每个所述局部图像块的图像块特征;
[0008]根据每个所述图像块特征,利用预设的随机森林模型,将多个所述局部图像块划分成多个视觉单词,其中,同一个所述视觉单词的局部图像块具有相同的外观特征和几何位置;
[0009]计算每个所述视觉单词对所述待测图像的每个候选中心位置的投票分;
[0010]获得每个所述候选中心位置关于各个所述视觉单词的投票组合权重,根据所述投票组合权重和所述投票分,计算每个所述候选中心位置的总得分;
[0011]根据每个所述候选中心位置的总得分,确定出目标中心位置。
[0012]进一步地,所述根据每个所述候选中心位置的总得分,确定出目标中心位置的步骤,包括:
[0013]根据每个所述候选中心位置的总得分,得到投票均值;
[0014]将所述待测图像在多个尺度因子下进行放缩,结合所述总得分,得到各个尺度因子下的霍夫图;
[0015]根据各个尺度因子下的所述霍夫图,得到3D霍夫空间;
[0016]结合所述投票均值,利用均值漂移算法,在所述3D霍夫空间中确定出目标中心位置。
[0017]进一步地,所述获得每个所述候选中心位置关于各个所述视觉单词的投票组合权重的步骤,包括:
[0018]获取各种视角下关于验证对象和背景的多个样本图像,并将所有所述样本图像划分成多个视觉子类;
[0019]根据由预设的随机森林模型的叶子节点得到多个视觉子类,基于所述视觉子类,生成每个所述样本图像的表达向量,并根据每个所述样本图像所属的所述视觉子类,给每个所述样本图像加入子类标签;
[0020]基于所有所述样本图像的所述表达向量和所述子类标签,利用多类别线性分类算法,训练出每个所述视觉子类的分值权重。
[0021]进一步地,所述将所有所述样本图像划分成多个视觉子类的步骤,包括:
[0022]计算每个所述样本图像的HOG特征,并利用局部线性嵌入算法,将所有所述HOG特征嵌入到2D空间,所述2D空间包括多个样本点,每个所述样本点对应一个所述样本图像;
[0023]在所述2D空间内,将所有所述样本图像规则化到一个圆形上,对所述圆形上的样本图像进行无监督聚类,得到多个视觉子类。
[0024]进一步地,所述根据每个所述图像块特征,利用预设的随机森林模型,将多个所述局部图像块划分成多个视觉单词的步骤,包括:
[0025]针对每个所述图像块特征,利用该图像块特征遍历随机森林模型,直到该图像块特征到达所述随机森林模型的一个叶子节点,每个所述叶子节点对应一个视觉单词;
[0026]根据所有所述图像块特征所到达的叶子节点,将到达同一个叶子节点的所有图像块特征所对应的局部图像块作为一个视觉单词。
[0027]进一步地,所述方法还包括训练随机森林模型的步骤,该步骤包括:
[0028]获取不同视角下的样本对象的样本图像,将每个所述样本图像划分为多个局部图像块,以所有所述局部图像块作为训练集;
[0029]根据每个所述局部图像块的特征,基于训练算法,构建并训练随机森林模型,所述特征包括外观特征、视角类别,局部图像块到目标中心的偏移向量,以及局部图像块在随机森林模型的每层节点上的分类权重。
[0030]进一步地,所述根据每个所述局部图像块的特征,基于训练算法,构建并训练随机森林模型的步骤,包括:
[0031]根据训练算法和各所述局部图像块的特征,生成随机森林模型的每棵树的第一层节点;
[0032]每生成一层节点时,根据当前层节点上各节点中的局部图像块集合,得到分裂函数;
[0033]根据所述分裂函数,预测并更新各所述局部图像块在下层节点上的分类权重;
[0034]每生成一层节点时,判断当前的随机森林模型是否满足终止条件时,若是,则终止训练,得到训练好的随机森林模型,若否,则根据各所述局部图像块更新分类权重后的特征,继续生成随机森林模型的每棵树的下一层节点。
[0035]第二方面,本专利技术实施例提供一种多视角目标检测装置,采用如下的技术方案。
[0036]一种多视角目标检测装置,包括预处理模块、匹配模块和投票模块;
[0037]所述预处理模块,用于获取待测图像的多个局部图像块,以及每个所述局部图像块的图像块特征;
[0038]所述匹配模块,用于根据每个所述图像块特征,利用预设的随机森林模型,将多个
所述局部图像块划分成多个视觉单词,同一个所述视觉单词的局部图像块具有相同的外观特征和几何位置;
[0039]所述投票模块,用于计算每个所述视觉单词对所述待测图像的每个候选中心位置的投票分,获得每个所述候选中心位置关于各个所述视觉单词的投票组合权重,根据所述投票组合权重和所述投票分,计算每个所述候选中心位置的总得分,根据每个所述候选中心位置的总得分,确定出目标中心位置。
[0040]第三方面,本专利技术实施例提供一种计算机设备,采用如下的技术方案。
[0041]一种计算机设备,包括处理器和存储器,所述存储器存储有能够被所述处理器执行的机器可执行指令,所述处理器可执行所述机器可执行指令以实现如第一方面所述的多视角目标检测方法。
[0042]第四方面,本专利技术实施例提供一种存储介质,采用如下的技术方案。
[0043]一种存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如第一方面所述的多视角目标检测方法。
[0044]本专利技术实施例提供的多视角目标检测方法、装置、计算机设备及存储介质,利用随机森林模型,将待测图像的多个局部图像块划分成多个视觉单词,每个视觉单词表征一个视角,从而得到每个视觉单词(即从每个视角)对待测图像的候选中心位置的投票分,即多视角对候选中心位置进行投票,并根据投票组合权重本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种多视角目标检测方法,其特征在于,所述方法包括:获取待测图像的多个局部图像块,以及每个所述局部图像块的图像块特征;根据每个所述图像块特征,利用预设的随机森林模型,将多个所述局部图像块划分成多个视觉单词,其中,同一个所述视觉单词的局部图像块具有相同的外观特征和几何位置;计算每个所述视觉单词对所述待测图像的每个候选中心位置的投票分;获得每个所述候选中心位置关于各个所述视觉单词的投票组合权重,根据所述投票组合权重和所述投票分,计算每个所述候选中心位置的总得分;根据每个所述候选中心位置的总得分,确定出目标中心位置。2.根据权利要求1所述的多视角目标检测方法,其特征在于,所述根据每个所述候选中心位置的总得分,确定出目标中心位置的步骤,包括:根据每个所述候选中心位置的总得分,得到投票均值;将所述待测图像在多个尺度因子下进行放缩,结合所述总得分,得到各个尺度因子下的霍夫图;根据各个尺度因子下的所述霍夫图,得到3D霍夫空间;结合所述投票均值,利用均值漂移算法,在所述3D霍夫空间中确定出目标中心位置。3.根据权利要求1或2所述的多视角目标检测方法,其特征在于,所述获得每个所述候选中心位置关于各个所述视觉单词的投票组合权重的步骤,包括:获取各种视角下关于验证对象和背景的多个样本图像,并将所有所述样本图像划分成多个视觉子类;根据由预设的随机森林模型的叶子节点得到多个视觉子类,基于所述视觉子类,生成每个所述样本图像的表达向量,并根据每个所述样本图像所属的所述视觉子类,给每个所述样本图像加入子类标签;基于所有所述样本图像的所述表达向量和所述子类标签,利用多类别线性分类算法,训练出每个所述视觉子类的分值权重。4.根据权利要求3所述的多视角目标检测方法,其特征在于,所述将所有所述样本图像划分成多个视觉子类的步骤,包括:计算每个所述样本图像的HOG特征,并利用局部线性嵌入算法,将所有所述HOG特征嵌入到2D空间,所述2D空间包括多个样本点,每个所述样本点对应一个所述样本图像;在所述2D空间内,将所有所述样本图像规则化到一个圆形上,对所述圆形上的样本图像进行无监督聚类,得到多个视觉子类。5.根据权利要求1或2所述的多视角目标检测方法,其特征在于,所述根据每个所述图像块特征,利用预设的随机森林模型,将多个所述局部图像块划分成多个视觉单词的步骤,包括:针对每个所述图像块特征,利用该图像块特征遍历随机森林模型,直到该图像块特征到达所述随机森林模型的一个叶...

【专利技术属性】
技术研发人员:王堃顾杏春林业伟王军
申请(专利权)人:南京大牛信息科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1