【技术实现步骤摘要】
基于注意力机制深度学习网络的目标检测方法及装置
本专利技术属于计算机视觉以及人工智能
,涉及一种在复杂生活的场景下的进行特定目标的检测的方法及装置,具体涉及一种基于注意力机制深度学习网络的目标检测方法及装置。
技术介绍
在当前的计算机视觉领域,深度学习已经得到了快速的发展。使用基于卷积神经网络的模型方法,被广泛的应用在计算机视觉的各个领域,如目标检测、图像分类、语义分割、实例分割等任务。其中目标检测是一项十分重要而又充满挑战性的工作,目标检测任务可分为两个关键的子任务:目标分类与目标定位。目标分类是指:将一张图片中包含的目标对象,目标对象为一个或多个,将其利用方法对其类别正确的进行一一对应识别,识别的方法是给包含的目标输出一组代表不同类别可能性的数值,使用最大的数值代表该类别。目标定位是指:将图片的包含的一个或多个目标所在的位置,使用特定的形状进行标出,目前在该领域常用的方法是使用矩形框将包含的目标进行正确框出。目前,目标检测已经在速度与精度上达到了很好的程度,现有的目标检测的方法主要分为一阶段 ...
【技术保护点】
1.一种基于注意力机制深度学习网络的目标检测方法,其特征在于,通过含有注意力机制模块的目标检测模型对待检测图像进行特征图提取并从中检测出目标的位置和类别,所述注意力机制模块包括:/n至少一个注意力模块M1,用于根据所述特征图生成相同大小注意力权重矩阵并作用于该特征图;/n至少一个注意力感受野模块M2,用于对所述特征图进行特征提取;以及/n至少一个注意力特征融合模块M3,用于对网络不同层次的特征进行融合,/n其中,所述注意力模块M1由shortcut支路、multi-branch支路,合并层构成,/n所述shortcut支路用于将所述注意力模块M1的输入直接作为输出F或是将所 ...
【技术特征摘要】
1.一种基于注意力机制深度学习网络的目标检测方法,其特征在于,通过含有注意力机制模块的目标检测模型对待检测图像进行特征图提取并从中检测出目标的位置和类别,所述注意力机制模块包括:
至少一个注意力模块M1,用于根据所述特征图生成相同大小注意力权重矩阵并作用于该特征图;
至少一个注意力感受野模块M2,用于对所述特征图进行特征提取;以及
至少一个注意力特征融合模块M3,用于对网络不同层次的特征进行融合,
其中,所述注意力模块M1由shortcut支路、multi-branch支路,合并层构成,
所述shortcut支路用于将所述注意力模块M1的输入直接作为输出F或是将所述注意力模块M1的输入进行两层卷积处理为输出F并输出给所述合并层,
所述multi-branch支路具有两个对称互补相反的分支结构,在所述分支结构对所述注意力模块M1的输入进行处理后,所述multi-branch支路还对两个所述分支结构的输出进行合并操作、使用卷积进行平滑操作、最后通过softmax得到输出W,
所述合并层用于将所述输出F以及所述输出W合并后输出,
所述注意力感受野模块M2包含基础部分以及卷积部分,
所述基础部分用于对所述注意力感受野模块M2的输入通过多分支进行处理,
所述卷积部分用于对所述基础部分的输出通过连接操作层、卷积操作层以及所述注意力模块M1进行处理,
所述注意力特征融合模块M3通过下采样操作、特征融合操作、所述注意力模块M1以及融合之后的平滑卷积操作对输入进行处理。
2.根据权利要求1所述的基于注意力机制深度学习网络的目标检测方法,其特征在于:
其中,所述分支结构中含有至少两个卷积层,且每一个所述卷积层均跟随着激活函数与归一化处理,
所述分支结构最终输出的特征图大小不变且与原输入的特征图大小一致。
3.根据权利要求2所述的基于注意力机制深度学习网络的目标检测方法,其特征在于:
其中,所述卷积层...
【专利技术属性】
技术研发人员:苗书宇,李华宇,刘天弼,冯瑞,
申请(专利权)人:复旦大学,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。