【技术实现步骤摘要】
目标检测方法、装置、电子设备、计算机可读存储介质
[0001]本公开涉及图像处理
,尤其涉及深度学习、目标检测
,具体而言,本公开涉及一种目标检测方法、装置、电子设备、计算机可读存储介质。
技术介绍
[0002]目标检测是计算机视觉领域中的一个重要问题。近年来,随着深度学习技术的发展,基于深度神经网络的目标检测方法已经成为研究热点。
[0003]目标检测的一大难题在于图像中存在不同尺度的目标,单一尺度的特征无法涵盖不同大小的物体。
技术实现思路
[0004]本公开提供了一种目标检测方法、装置、电子设备、计算机可读存储介质。
[0005]根据本公开的第一方面,提供了一种目标检测的方法,该方法包括:
[0006]对待检测图像进行多尺度特征提取,获取多个对应不同尺度的尺度特征,多个所述尺度特征包括一个深层特征和至少一个浅层特征,所述浅层特征对应的尺度小于所述深层特征对应的尺度;
[0007]基于多个所述尺度特征,进行交叉注意力计算,获取全局语义特征;
[0008]将所述全局语义特征与所述浅层特征进行特征融合,获取检测特征;
[0009]根据所述检测特征获取所述待检测图像中的目标类别以及目标位置。
[0010]根据本公开的第二方面,提供了一种目标检测的装置,该装置包括:
[0011]特征提取模块,用于对待检测图像进行多尺度特征提取,获取多个对应不同尺度的尺度特征,多个所述尺度特征包括一个深层特征和至少一个浅层特征,所述浅层特征对应的尺 ...
【技术保护点】
【技术特征摘要】
1.一种目标检测的方法,包括:对待检测图像进行多尺度特征提取,获取多个对应不同尺度的尺度特征,多个所述尺度特征包括一个深层特征和至少一个浅层特征,所述浅层特征对应的尺度小于所述深层特征对应的尺度;基于多个所述尺度特征,进行交叉注意力计算,获取全局语义特征;将所述全局语义特征与所述浅层特征进行特征融合,获取检测特征;根据所述检测特征获取所述待检测图像中的目标类别以及目标位置。2.根据权利要求1所述的方法,其中,所述基于多个所述尺度特征,进行交叉注意力计算,获取全局语义特征,包括:对多个所述尺度特征进行拼接,将拼接后的特征作为内容特征,将所述尺度特征映射成特征向量,将所述特征向量作为查询特征,将所述尺度特征作为键值特征;基于所述内容特征、所述键值特征以及所述查询特征进行交叉注意力处理,获取所述尺度特征对应的注意力特征;基于多个所述尺度特征对应的注意力特征,获取全局语义特征。3.根据权利要求1所述的方法,其中,所述基于多个所述尺度特征,进行交叉注意力计算,获取全局语义特征,包括:对所述浅层特征进行池化操作,获取池化特征,使所述池化特征的分辨率与所述深层特征的分辨率一致;基于所述池化特征和所述深层特征进行交叉注意力计算,获取所述全局语义特征。4.根据权利要求3所述的方法,其中,所述池化操作为最大池化操作。5.根据权利要求1所述的方法,其中,所述将所述全局语义特征与所述浅层特征进行特征融合,获取检测特征,包括:对所述全局语义特征进行上采样,将所述全局语义特征与所述浅层特征进行融合,获取所述浅层特征对应的第一融合特征;对所述浅层特征对应的第一融合特征进行下采样,将所述浅层特征对应的第一融合特征与所述全局语义特征进行融合,获取所述检测特征。6.根据权利要求1所述的方法,其中,所述对待检测图像进行多尺度特征提取,包括:使用预先训练的骨干网络,对所述待检测图像进行多尺度特征提取;所述基于多个所述尺度特征,进行交叉注意力计算,获取全局语义特征,包括:基于多个所述尺度特征,使用预先训练的注意力网络进行交叉注意力计算,获取全局语义特征;所述根据所述检测特征获取所述待检测图像中的目标类别以及目标位置,包括:将所述检测特征输入预先训练的检测头获取所述待检测图像中的目标类别以及目标位置。7.根据权利要求6所述的方法,其中,所述骨干网络、所述注意力网络、所述检测头串行组成目标检测网络;所述骨干网络、所述注意力网络、所述检测头是通过对所述目标检测网络预先进行端到端训练获取的。8.一种目标检测的装置,包括:特征提取模块,用于对待检测图像进行多尺度特征提取,获取多个对应不同尺度的尺
度特征,多个所述尺度特征包括包括一个深层特征和至少一个浅层特征,所述浅层特征对应的尺度小于所述深层特征对应的尺度;注意力模块,用于基于多...
【专利技术属性】
技术研发人员:吕文玉,赵祎安,徐尚良,王冠中,党青青,
申请(专利权)人:北京百度网讯科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。