一种图像特征金字塔的自适应加权融合方法技术

技术编号：25186751 阅读：77 留言：0更新日期：2020-08-07 21:14

本发明专利技术公开了一种图像特征金字塔的自适应加权融合方法。本发明专利技术步骤：1.首先在计算机视觉有名的超大规模数据库ImageNet上预训练神经网络模型；2.将二次训练用的训练集数据输入预训练神经网络模型；3.针对训练集中的目标检测任务，重复步骤4‑8继续训练神经网络模型，直至网络能够准确的检测训练集中的图片；4.使用步骤(1)预训练后的神经网络模型提取图片的特征图；5.把获得的特征图按分辨率建立特征图金字塔模型；6.计算每一层特征图在整个金字塔模型中的重要程度；7.根据特征图在金字塔模型中的重要程度，对每一层特征图分配不同的权重；8.对特征图按照所分配的权重进行融合，然后进行检测。本发明专利技术提高目标定位和分类的准确性。

全部详细技术资料下载

【技术实现步骤摘要】
一种图像特征金字塔的自适应加权融合方法
本专利技术设计特征融合方法，具体来讲是一种图像特征金字塔的自适应加权融合方法，属于计算机视觉图像处理

技术介绍
目标检测作为计算机视觉的基本问题之一，是许多其他计算机视觉任务的基础，如实例分割、图像字幕、对象跟踪等。从应用程序的角度来看，目标检测可以被分为两个研究主题“通用目标检测”和“特定目标检测”，前者旨在探索在统一的框架下检测不同类型物体的方法，以模拟人类的视觉和认知；后者是指特定应用场景下的检测，如行人检测、人脸检测、文本检测等。近年来，随着深度学习技术的快速发展，为目标检测注入了新的血液，取得了显著的突破，将其推向了一个前所未有的研究热点。目前，目标检测已广泛应用于自主驾驶、机器人视觉、视频监控等领域。
技术实现思路
本专利技术主要是为了处理同一图像中多种尺度的目标而提出来的一种图像特征金字塔的自适应加权融合方法。为实现以上的技术目的，本专利技术将采用以下的技术方案：步骤(1)首先在计算机视觉有名的超大规模数据库ImageNet上预训练神经网络模型，数据库ImageNet包含超过1400万张图像，涵盖20000个类别；步骤(2)将二次训练用的训练集数据输入预训练神经网络模型；步骤(3)针对训练集中的目标检测任务，重复步骤(4)到(8)继续训练神经网络模型，直至网络能够准确的检测训练集中的图片；步骤(4)使用步骤(1)预训练后的神经网络模型提取图片的特征图；步骤(5)把获得的特征图按分辨率建立特...

【技术保护点】
1.一种图像特征金字塔的自适应加权融合方法，其特征在于包括如下步骤：/n步骤(1)首先在计算机视觉有名的超大规模数据库ImageNet上预训练神经网络模型，数据库ImageNet包含超过1400万张图像，涵盖20000个类别；/n步骤(2)将二次训练用的训练集数据输入预训练神经网络模型；/n步骤(3)针对训练集中的目标检测任务，重复步骤(4)到(8)继续训练神经网络模型，直至网络能够准确的检测训练集中的图片；/n步骤(4)使用步骤(1)预训练后的神经网络模型提取图片的特征图；/n步骤(5)把获得的特征图按分辨率建立特征图金字塔模型；/n步骤(6)计算每一层特征图在整个金字塔模型中的重要程度；/n步骤(7)根据特征图在金字塔模型中的重要程度，对每一层特征图分配不同的权重；/n步骤(8)对特征图按照所分配的权重进行融合，然后进行检测。/n

【技术特征摘要】
1.一种图像特征金字塔的自适应加权融合方法，其特征在于包括如下步骤：
步骤(1)首先在计算机视觉有名的超大规模数据库ImageNet上预训练神经网络模型，数据库ImageNet包含超过1400万张图像，涵盖20000个类别；
步骤(2)将二次训练用的训练集数据输入预训练神经网络模型；
步骤(3)针对训练集中的目标检测任务，重复步骤(4)到(8)继续训练神经网络模型，直至网络能够准确的检测训练集中的图片；
步骤(4)使用步骤(1)预训练后的神经网络模型提取图片的特征图；
步骤(5)把获得的特征图按分辨率建立特征图金字塔模型；
步骤(6)计算每一层特征图在整个金字塔模型中的重要程度；
步骤(7)根据特征图在金字塔模型中的重要程度，对每一层特征图分配不同的权重；
步骤(8)对特征图按照所分配的权重进行融合，然后进行检测。

2.根据权利要求1所述的图像特征金字塔的自适应加权融合方法，其特征在于所述的神经网络模型采用的是深度残差网络ResnetNet-101，具体实现如下：
2-1.深度残差网络ResnetNet-101是通过给非线性的卷积层增加直连边的方式来提高信息的传播效率；深度残差网络ResnetNet-101包含4组残差块，共101层卷积层；
2-2.深度残差网络ResnetNet-101中卷积计算使用卷积公式：

其中kernel_size表示使用的卷积核大小，pad表示边缘填充位数，stride表示卷积核每次移动位数；深度残差网络ResnetNet-101中使用kernel_size＝3,pad＝1,stride＝2,根据公式可知conv层不会改变图片大小；
2-3.每个卷积层后的激活层负责将前一个卷积层的输出映射到后一个卷积层的输入；
2-4.将每组残差块的最后一个卷积层的输出通过激活层映射到两个池化层，池化层最终输出特征图；其中，池化层中kernel_size＝2，stride＝2，池化层会让输出图片是输入图片的1/2；
2-5.经过步骤2-2到2-4的特征提取后，图片大小会随着卷积次数的增多而变小，且特征图的数目会随着使用卷积核的数目变化，将所得的不同分别率的特征图组建初步特征图金字塔。

3.根据权利要求2所述的图像...

【专利技术属性】
技术研发人员：姜明，何利飞，张旻，李鹏飞，汤景凡，
申请(专利权)人：杭州电子科技大学，
类型：发明
国别省市：浙江;33

全部详细技术资料下载我是这个专利的主人