【技术实现步骤摘要】
一种引入双向注意力的目标检测方法
本专利技术属于目标检测领域,涉及一种引入双向注意力的目标检测方法。
技术介绍
目标检测技术是指:给定一幅图像以及检测类别,确定在该图像中是否存在给定类别(比如人、鸟、风筝等)的任何实例,若存在,则返回该实例的空间位置和范围(通常用矩形框框出)。基于深度神经网络的目标检测算法框架可以分为两类:(1)基于候选区域的两阶段算法;(2)基于边框回归的单阶段算法。具体来说:(1)基于候选区域的两阶段算法:该算法框架分为两个阶段,首先提取图片中目标可能存在的区域,其次,将所有的区域输入到卷积神经网络中进行特征提取,再对这些区域进行目标分类和边框回归修正。较典型的工作包括RossGirshick等人发表的“FasterR-CNN:Towardsrealtimeobjectdetectionwithregionproposalnetworks”,(见,IEEETransactionsonPatternAnalysis&MachineIntelligence,2015.)它创造性地将神经网络应用于候选框的提取,从而实现了整个算法的端到端训练。(2)基于边框回归的单阶段算法:该算法框架不再提取候选区域,而是将原图像作为输入,直接对边框进行回归,输出预测结果,如Redmon等人在“ProceedingsoftheIEEEConferenceonComputerVisionandPatternRecognition.2016.”发表的“Youonlylookonce:Unif ...
【技术保护点】
1.一种引入双向注意力的目标检测方法,其特征在于,其具体步骤如下:/n步骤1,获取用于目标检测的训练样本,并对训练样本进行预处理;/n步骤2,建立引入双向注意力的目标检测算法模型,所述引入双向注意力的目标检测算法模型包括共享卷积网络、基础目标检测器和注意力模块;/n步骤3,将训练样本送入引入双向注意力的目标检测算法模型中训练,优化模型的多任务损失;/n步骤4,将实际应用场景中的测试样本送入训练好的引入双向注意力的目标检测算法模型进行测试,得到目标检测结果。/n
【技术特征摘要】
1.一种引入双向注意力的目标检测方法,其特征在于,其具体步骤如下:
步骤1,获取用于目标检测的训练样本,并对训练样本进行预处理;
步骤2,建立引入双向注意力的目标检测算法模型,所述引入双向注意力的目标检测算法模型包括共享卷积网络、基础目标检测器和注意力模块;
步骤3,将训练样本送入引入双向注意力的目标检测算法模型中训练,优化模型的多任务损失;
步骤4,将实际应用场景中的测试样本送入训练好的引入双向注意力的目标检测算法模型进行测试,得到目标检测结果。
2.根据权利要求1所述的一种引入双向注意力的目标检测方法,其特征在于:所述步骤1中训练样本的预处理具体包括以下子步骤:
步骤11,读取目标检测训练样本,每个样本包括图像和标签;
步骤12,对图像进行预处理,将图像进行随机大小,随机长宽比的裁剪,然后将裁剪后的图像调整为固定大小;
步骤13,依概率p对图像进行水平翻转;
步骤14,将读入的图像数据转换为张量,并将RGB三个通道[0,255]的数值归一化至[0,1];
步骤15,将图像数据按通道进行标准化。
3.根据权利要求2所述的一种引入双向注意力的目标检测方法,其特征在于:所述步骤2具体包括以下子步骤:
步骤21,所述共享卷积网络用于提取图像的浅层特征图;
步骤22,基础目标检测器通过深度卷积神经网络组成的主干网络对浅层特征图继续提取特征,得到深层特征图;再对深层特征图进行分类和回归,得到矩形框和分类得分矩阵R;
步骤23,注意力模块根据基础目标检测器的结果给浅层特征图赋予不同的注意力权值,浅层特征图中的每个像素对应的特征向量和注意力权值进行点乘之后再继续输入到卷积网络中进行处理,得到注意力模块分类得分矩阵M;
步骤24,注意力模块的结果以一定的注意力权重和基础目标检测器的结果进行结合得到最后的目标检测结果。
4.根据权利要求3所述的一种引入双向注意力的目标检测方法,其特征在于:所述基础目标检测器采用一阶段或者两阶段的目标检测算法。
5.根据权利要求3所述的一种引入双向注意力的目标检测方法,其特征在于:所述注意力模块的卷积网络采用MobileNetV3网络。
6.根据权利要求3所述的一种引入双向注意力的目标检测方法,其特征在于:所述注意力权值按照如下的方法进行赋予:
(1)如果基础目标...
【专利技术属性】
技术研发人员:欧阳胜雄,李英明,钱小鸿,陈才君,蒋立靓,罗鹏,
申请(专利权)人:银江股份有限公司,浙江大学,
类型:发明
国别省市:浙江;33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。