The invention discloses a cross domain target detection method based on multi-layer feature alignment. First of all, the detector is trained on the data set of the source domain labeled by the deep convolution neural network. Then, the trained detector is used as the pre training model, and the source domain and the target domain are extracted by the deep convolution neural network VGg \u2011 16, so that the source domain and the target share the feature parameters. Secondly, the domain classifier is designed. The extracted multi-layer source domain and target domain feature layer are used as the input of domain classifier to determine whether the feature layer is from the source domain or the target domain. Then through the training method of the network, the feature distribution of the source domain and the target domain is aligned, and then the data deviation between the two domains is reduced. Finally, the final model is obtained by training the detector and the discriminator. The invention realizes the transfer of the source domain knowledge to the target domain, and improves the detection accuracy of the target domain data without border annotation.
【技术实现步骤摘要】
一种基于多层特征对齐的跨域目标检测方法
本专利技术涉及计算机视觉领域,特别是涉及一种基于多层特征对齐的跨域目标检测方法。技术背景近年来,随着深度神经网络的发展,基于数据驱动的计算机视觉,取得了重大进展。目标检测作为计算机视觉的基础任务,更是得到了研究人员广泛的关注,在人们的智能生活中扮演着越来越多的角色。例如,在智能驾驶中,通过3D目标检测可以实现过往车辆以及周边场景的快速的定位,从而汽车可以避开障碍物并顺利行驶;在智慧零售业务中,通过精确的目标检测,可以清点货架上的商品,实现无人销售,节省劳力;在智能小区中,通过车牌检测,可以快速识别过往车辆,从而实现自动放行。总而言之,目标检测,越来越成为我们生活中不可缺少的一部分。尽管基于数据驱动的目标检测任务取得了重大的进展,但是在实际生产应用中,却面临诸多的困难。基于深度卷积神经网络的目标检测算法,需要大量的边框标注与分类标注,而在实际场景业务中,从数据的收集到标注,需要耗费大量的人力物力。一方面,我们在许多场景中,如天气良好情况下的道路场景,已经收集了大量的数据,并且在相关业务中取得了不错的效果。另一方面,我们在某些特殊领域,如在少见的雾霾天气下的道路场景图片,却难以收集。如何将已有的大量数据应用到新的业务场景中,以节省人力物力,是我们面临的一项难题。目前,主要的解决方法有两类:弱监督的目标检测方法与基于领域对齐的方法。在弱监督的目标检测任务中,只用到了分类标注,故而实际的定位精度较差,在实际中难以使用。另一种是基于迁移学习的领域对齐方法。在这种方法中,通常采用使源域与目标域的第一或第二统计量距离最小,或者 ...
【技术保护点】
1.一种基于多层特征对齐的跨域目标检测方法,其特征在于,包括以下步骤:Step1:对源域数据和目标域数据进行预处理;Step2:将预处理后的源域数据输入SSD检测模型,通过对有标注信息的源域数据进行端到端的训练,得到一个全监督的初始检测模型,并作为下一步训练的预训练模型;Step3:利用预训练模型对预处理后的源域数据和目标域数据进行特征提取;Step4:使用对抗生成网络实现源域与目标域多层特征对齐;Step5:将对抗生成网络即对齐网络模型与预训练模型联合训练,得到在源域数据集上训练好的最终检测模型。
【技术特征摘要】
1.一种基于多层特征对齐的跨域目标检测方法,其特征在于,包括以下步骤:Step1:对源域数据和目标域数据进行预处理;Step2:将预处理后的源域数据输入SSD检测模型,通过对有标注信息的源域数据进行端到端的训练,得到一个全监督的初始检测模型,并作为下一步训练的预训练模型;Step3:利用预训练模型对预处理后的源域数据和目标域数据进行特征提取;Step4:使用对抗生成网络实现源域与目标域多层特征对齐;Step5:将对抗生成网络即对齐网络模型与预训练模型联合训练,得到在源域数据集上训练好的最终检测模型。2.根据权利要求1所述的基于多层特征对齐的跨域目标检测方法,其特征在于,所述Step1中预处理是指对数据进行增广,具体为通过亮度、饱和度以及色调调整,随机裁剪固定区,随机裁剪随机大小,随机翻转固定角度和随机翻转随机角度,得到増广图片,再做归一化处理,并将图片裁剪到固定大小,使其尺寸为300×300。3.根据权利要求1所述的一种基于多层特征对齐的跨域目标检测方法,其特征在于,所述Step2的具体过程为:构建SSD检测模型,其以去掉全连接层的VGG16为基本网络模型,然后再加入Conv6、Conv7、Conv8、Conv9、Conv10和Conv11六个卷积层,并抽取Conv4_3、Conv7、Conv8_2、Conv9_2、Conv10_2和Conv11_2作为特征层,将预处理的源域数据输入SSD检测模型进行特征提取,在每个特征层的每个像素点上生成尺度大小和长宽比不一的6个默认边框,对默认边框进行与标注边框进行匹配,得到训练过程中的正样本与负样本;首先,将与标注边框交并比最大的默认边框进行匹配,然后,对于默认边框,将标注边框与其交并比大于0.5的进行匹配;具体而言,Conv7、Conv8_2、Conv9_2、Conv10_2和Conv11_2层的特图征上的默认边框尺寸所占原图比例大小为:式中,u=5表示进行预测的层数,smin取值0.2,smax取值0.9,sk表示第k个预测层的默认边框尺寸所占原图像的比例大小,在预测层Conv4_3上的默认边框尺寸所占原图像的比例大小为0.1,即当k=6时,sk=0.1,令Sk表示第k个预测层的默认边框尺寸,则Sk=300×sk;对于默认边框的长宽比,取αr={1,2,3,1/2,1/3},则第k层的前五个默认边框宽和高分别为和r=1,2,...,5,对于第k层的第六个默认边框Sk′长宽比取1,且有取S7=312,从而在每个预测层的每个像素点将会根据上述设置的尺寸大小的长宽比生成不同的默认边框;此外,每个预测的特征层的每个像素点将分别送入尺寸大小为3×3×qm的卷积核,以进一步得到分类置信得分与回归偏量,qm为第m层特征层的通道数;在训练过程中,目标损失函数为:其中,N为与标注边框相匹配的默认边框的个数,Lloc为定位损失函数,Lconf为分类置信度的损失量,α为正则化参数,x为输入图像,c为目标类...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。