基于多特征提取和多任务融合的目标检测算法制造技术

技术编号：17655709 阅读：28 留言：0更新日期：2018-04-08 08:48

本发明专利技术涉及一种基于多特征提取和多任务融合的目标检测算法，其技术特点是：基于深度学习卷积神经网络架构提取图像特征，提取多层卷积输出结果形成多特征图，在多特征图上提取不同可视野的目标感兴趣区域并进行特征连接；对原图实现语义分割提取目标分割区域结果，并将目标检测结果和目标分割结果在全连接层中通过一定的比例系数进行多任务交叉辅助目标检测；上述结果通过最后的全连接层后，通过组合分类定位损失函数对图像特征进行分类和回归定位，得到最终目标检测的结果。本发明专利技术通过深度学习卷积神经网络提取特征、对图像特征进行多组多层融合连接及组合损失函数实现了高精度的目标检测定位和分类，获得了良好的目标检测结果。

全部详细技术资料下载

【技术实现步骤摘要】
基于多特征提取和多任务融合的目标检测算法
本专利技术属于目标检测
，尤其是一种基于多特征提取和多任务融合的目标检测算法。
技术介绍
目标检测的主要任务是对图像序列中的目标物体进行自动检测，包括分类和定位。目前流行的目标检测算法，首先在一张图片上生成1K-2K的候选框，然后对于每个候选框使用CNN卷积神经网络提取特征，其次将特征输入每一类的SVM分类器或Softmax分类器来判断目标是否属于该类，最后使用回归器修正候选框的位置实现目标的精准定位。传统的目标检测算法采用SIFT、HOG和LBP等特征，通过寻找图片中具有平移、仿设、旋转等变换情况下的不变特征点实现图像间的匹配，从而实现目标检测。然而提取特征的好坏直接影响到分类的准确性，由于目标的形态多样性，光照变化多样性，背景多样性等因素使得设计一个鲁棒的特征并不是那么容易，传统特征的适应能力并不强。而基于CNN卷积神经网络的特征提取具有很好的鲁棒性，卷积神经网络是为识别二维形状而特殊设计的一个多层感知器，这种网络结构对平移、比例缩放、倾斜或者共他形式的变形具有高度不变性。提取特征的CNN模型经过预先训练得到，预训练基于ILVCR2012计算机视觉识别挑战赛的全部数据集进行训练，然后针对预训练模型基于PASCALVOC2007训练集进行调优训练，从而实现通过CNN网络提取图片特征。深度学习广泛应用于目标检测源于Alex等人提出的深度卷积神经网AlexNet网络架构，该框架在ILSVRC2012比赛中取得了非常好的成绩，此后，卷积神经网络被广泛应用于各类图像相关领域。GeoffreyHinton设计的Ale...
基于多特征提取和多任务融合的目标检测算法

【技术保护点】
一种基于多特征提取和多任务融合的目标检测算法，其特征在于包括以下步骤：步骤1、基于深度学习卷积神经网络架构提取图像特征，提取多层卷积输出结果形成多特征图，并在多特征图上提取不同可视野的目标感兴趣区域，对提取的目标感兴趣区域进行特征连接；步骤2、对原图实现语义分割提取目标分割区域结果，并将目标检测结果和目标分割结果在全连接层中通过一定的比例系数进行多任务交叉辅助目标检测；步骤3、上述结果通过最后的全连接层后，通过组合分类定位损失函数对图像特征进行分类和回归定位，得到最终目标检测的结果。

【技术特征摘要】
1.一种基于多特征提取和多任务融合的目标检测算法，其特征在于包括以下步骤：步骤1、基于深度学习卷积神经网络架构提取图像特征，提取多层卷积输出结果形成多特征图，并在多特征图上提取不同可视野的目标感兴趣区域，对提取的目标感兴趣区域进行特征连接；步骤2、对原图实现语义分割提取目标分割区域结果，并将目标检测结果和目标分割结果在全连接层中通过一定的比例系数进行多任务交叉辅助目标检测；步骤3、上述结果通过最后的全连接层后，通过组合分类定位损失函数对图像特征进行分类和回归定位，得到最终目标检测的结果。2.根据权利要求1所述的基于多特征提取和多任务融合的目标检测算法，其特征在于：所述深度学习卷积神经网络架构为VGG-16卷积神经网络架构。3.根据权利要求1或2所述的基于多特征提取和多任务融合的目标检测算法，其特征在于：所述步骤1的具体实现方法包括以下步骤：⑴将带有物体真实包围框的图片输入到目标检测卷积神经网络架构中，使用Caffe框架提取图像并通过卷积神经网络输出的不同层的图像特征；⑵隔层提取出多层卷积层的输出并进行连接形成多特征的特征图，第一个卷积层输出卷积特征最大池化，最后一个卷基层输出卷积特征反卷积，使两个卷积层的输出特征尺寸与中间卷积层的输出特征尺寸大小一致，连接多层卷积层的输出图像特征形成多特征图；⑶在多特征图上，对于生成的可能包含物体的目标感兴趣区域，进行不同倍数的区域缩放，得到不同的目标感兴趣区域，然后将不同的目标感兴趣区域进行连接形成最终的目标感兴趣区域。4.根据...

【专利技术属性】
技术研发人员：娄英欣，郭晓强，王琳，夏治平，姜竹青，门爱东，
申请(专利权)人：国家新闻出版广电总局广播科学研究院，北京邮电大学，
类型：发明
国别省市：北京,11

全部详细技术资料下载我是这个专利的主人