【技术实现步骤摘要】
本专利技术涉及使用多尺度特征提取网络、金字塔视觉自注意力模型、单侧松弛最优传输、点到点精确定位、匈牙利算法和密度估计与纯点基精确定位相结合的密集检测。
技术介绍
1、密集检测是计算机视觉的一个研究热点,它是对场景中密集目标数量的估计,广泛应用于城市规划、交通拥挤估计和人群管理等诸多领域。密集检测在公安领域也具有特别重要的实际应用价值。
2、在具有数千个目标、严重遮挡和巨大规模变化的复杂场景中,计算目标是一个挑战。因此,在现代密集检测数据集中,提供粗标注(如点)比提供细标注(如边框甚至轮廓)更可行,更省力。然而,从图像生成开始的密集检测仍面临多项挑战。
3、首先,对密集检测原图像的特征处理,主流的方法集中于设计各种卷积神经网络(cnns)。但是相机附近的密集目标规模更大,密度更低,反之亦然,这导致图像中的规模和密度存在巨大差异。一个公认的解决方案是增强基于卷积神经网络模型的全局上下文建模能力。卷积神经网络具有很强的局部特征提取能力,但由于卷积神经网络感受野有限,它并不完美。因此,研究人员提出了各种机制来完善基于卷积
...【技术保护点】
1.基于单侧松弛最优传输与纯点基精确定位的密集检测方法,其特征在于:至少包括以下步骤:
2.根据权利要求1所述的一种基于单侧松弛最优传输与纯点基精确定位的密集检测方法,其特征在于:步骤一中预训练一种金字塔视觉自注意力模型;该模型以密集检测原图像作为输入,其骨干网络部分,可以使用大规模分类数据集进行预训练,提升其特征提取的能力,在这期间需要定义好金字塔每一层中,视觉自注意力模型的规模和patch大小,在有效聚合细粒度特征和粗粒度特征与降低计算复杂度之间找到平衡点;高效回归头与多尺度扩张卷积(MDC)组成的预测模块,可以在使用密集检测数据集进行训练的过程中进行
...【技术特征摘要】
1.基于单侧松弛最优传输与纯点基精确定位的密集检测方法,其特征在于:至少包括以下步骤:
2.根据权利要求1所述的一种基于单侧松弛最优传输与纯点基精确定位的密集检测方法,其特征在于:步骤一中预训练一种金字塔视觉自注意力模型;该模型以密集检测原图像作为输入,其骨干网络部分,可以使用大规模分类数据集进行预训练,提升其特征提取的能力,在这期间需要定义好金字塔每一层中,视觉自注意力模型的规模和patch大小,在有效聚合细粒度特征和粗粒度特征与降低计算复杂度之间找到平衡点;高效回归头与多尺度扩张卷积(mdc)组成的预测模块,可以在使用密集检测数据集进行训练的过程中进行微调;密集检测原图像经过该模型将得到其对应的单通道的特征图。
3.根据权利要求1所述的一种基于单侧松弛最优传输与纯点基精确定位的密集检测方法,其特征在于:步骤二中提出一种新的基于测度理论的计数方法,推导了sinkhorn距离的单侧松弛形式,并设计了一个单侧松弛的sinkhorn计数损失,将预测的密度图直接回归到点标注,作为损失之一来优化我们的模型;将离散的真值图和步骤一得到的预测密度图分别用离散的点测度和连续测度表示,并分别作为单侧松弛最优传输矩阵的边缘分布,并以坐标点的像素的欧氏距离作为最优传输的代价矩阵,以传输矩阵的信息熵作为熵正则化项,将两种测度、代价矩阵和熵正则化项带入sinkhorn公式,可以计...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。