一种基于金字塔渐进擦除学习的自步学习排序方法技术

技术编号：30701783 阅读：17 留言：0更新日期：2021-11-06 09:39

本发明专利技术公开了一种基于金字塔渐进擦除学习的自步学习排序方法，其包括粗金字塔网络和细金字塔网络，在粗金字塔网络中，提出金字塔对抗擦除机制，该机制逐层擦除和融合不同尺度的目标，鼓励网络发现完整的目标，以此在最后的定位图中分割出初始的目标区域；对初始目标区域进行掩码操作，提出相关得分，用于目标区域的伪标注标签；在细金字塔网络中，将初始目标区域及其伪标签用于训练，提出掩码兴趣区域网络层，该网络层可以保留输入大小的同时仅仅保留兴趣区域，最后使用金字塔对抗机制以细化更准确的目标边界，本发明专利技术有效减少了弱监督目标定位过程中对于大量精细位置注释的依赖，消耗资源较少，网络训练更稳定，应用广泛。应用广泛。应用广泛。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于金字塔渐进擦除学习的自步学习排序方法

[0001]本专利技术涉及.计算机视觉
，尤其是涉及一种基于金字塔渐进擦除学习的自步学习排序方法。

技术介绍

[0002]目标定位是计算机视觉领域一个重要的组成部分，它旨在识别场景中不同目标的位置。作为许多高级视觉任务的前提，目标定位可以应用于很多实际场景，例如视频智能监控，图像检索，机器人导航，无人机巡航，增强现实等。随着深度学习技术在计算机视觉领域的大规模应用，目标定位已经取得了巨大的突破，在识别准确度，定位准确度上已经可以应用于很多实际应用，随着大量研究人员的大投入研究，针对目标定位的研究成果层出不穷，是计算机视觉领域十分重要的研究课题。
[0003]然而，目前最先进的目标定位模型都需要大量人工标注的精细位置注释，这种位置注释需要大量人力物力来获取，意味着只有获取大量精细标注才有可能训练能够实际应用的模型。毫无疑问，这种完全监督的方式严重影响了目标定位算法的实际应用。因为在现实场景中，精细的位置注释往往难以获得，大部分获取的数据仅仅只有图像级标签，有些位置标签也存在缺失严重的情况，并且在人为的位置注释下也很容易引入人工误差影响实际模型训练。为了解决这个问题，仅仅利用图像级标签训练目标定位的弱监督算法开始成为很多研究者重点关注的热点，受到越来越多的关注。
[0004]目前，弱监督目标定位主流的方法是多实例学习(Multiple Instances Learning,MIL),这种方法通过将实例看做一个个实例，通过迭代的方式挑选置信度最高的实例。这...

【技术保护点】

【技术特征摘要】
1.一种基于金字塔渐进擦除学习的自步学习排序方法，其特征在于，所述自步学习排序方法包括如下步骤：S1：提出定位网络，所述定位网络包括两个子网络，分别为粗金字塔网络和细金字塔网络；S2：在S1中的所述粗金字塔网络中，提出金字塔对抗擦除机制，所述金字塔对抗擦除机制用于逐层擦除和融合不同尺度的目标，并鼓励所述粗金字塔网络发现完整的目标，以此在最后的定位图中分割出初始目标区域；S3：对S2中的所述初始目标区域进行掩码操作，提出相关得分，用于对初始目标区域的伪标注标签；S4：在S1中的所述细金字塔网络中，将S3中的所述初始目标区域及其伪标注标签用于训练，并提出掩码兴趣区域网络层，所述掩码兴趣区域网络层可以在保留输入大小的同时仅仅保留兴趣区域；S5：使用金字塔对抗机制以细化更准确的目标边界，结束。2.根据权利要求1所述的一种基于金字塔渐进擦除学习的自步学习排序方法，其特征在于，所述S2中的金字塔对抗擦除机制定义为：在以ResNet50为基本架构的网络中，逐步擦除四种尺寸的特征图，所述特征图的尺寸包括{56
×
56,28
×
28,14
×
14,7
×
7},进而将所述金字塔对抗擦除机制重新定义为AE step{1,2,3,4},在每一个AE step中，包括如下步骤：步骤一：定义每个AE step i开始的第一层为最后一层为步骤二：将和归一化到[0,1]，其输出定义为和步骤三：在中，将最具辨别力的部分定义为特征图一系列像素点的值大于给定阈值δ的部分，通过将其像素值置为0，从而擦除中最具辨别力的部分；步骤四：单纯地擦除无法鼓励网络发现目标的不同部分，因此，使用跳远连接(skip connection)对擦除前和擦除后的相同大小的层进行特征融合，步骤五：令表示融合过的层，其计算方式为对和逐元素求最大值，如下式所示：3.根据权利要求1所述的一种基于金字塔渐进擦除学习的自步学习排序方法，其特征在于，所述S2中，在最后的定位图中分割出初始目标区域的操作步骤如下：步骤一：获取最后一层的融合定位图；步骤二：调整定位图与原始图片一样的大小；步骤三：使用固定的阈值分割前景和背景，用于产生相应的预测回归框用于定位；步骤四：寻找覆盖前景像素中最大连接区域的边界框；步骤五：生成对应的回归框。4.根据权利要求1所述的一种基于金字塔渐进擦除学习的自步学习排序方法，其特征在于，所述S4中，使用对抗多标签损失函数对初始目标区域及其伪标注标签进行训练，所述对抗多标签损失函数定义如下：假设训练集包含N张图片，需要识别的目...

【专利技术属性】
技术研发人员：琚小明，
申请(专利权)人：浙江捷瑞电力科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人