【技术实现步骤摘要】
基于多尺度特征的多对象检测方法与数据平台
[0001]本专利技术涉及计算机视觉物体检测
,尤其涉及基于多尺度特征的多对象检测方法与数据平台。
技术介绍
[0002]物体检测是计算机视觉的重要研究方向,其在无人驾驶、机器人、导航、监控、医疗等领域的应用需求非常广泛,研究价值非常重大。
[0003]目前提出的基于单目图像的物体检测算法对于图像中的物体,尤其是遮挡物体,只能检测其未被遮挡的部分(即可视部分),无法准确检测其完整的2D边界框(本专利技术简称为完整2D框)。然而物体的完整2D框检测对于物体的准确定位非常重要。脑视觉神经网络物体感知研究发现,大脑视觉皮层可以基于物体可视部分的图像特征准确脑补出物体的完整2D框,以实现对物理世界中物体的准确检测和定位。因此亟待一种基于网络模型的检测方法,实现物体多尺度特征的多对象的准确检测和定位。
技术实现思路
[0004]本专利技术旨在至少在一定程度上解决相关技术中的技术问题之一。
[0005]为此,本专利技术的目的在于提出基于多尺度特征的多对象检测 ...
【技术保护点】
【技术特征摘要】
1.一种基于多尺度特征的多对象检测方法,其特征在于,包括以下步骤:将多对象的物体图像输入预训练的神经网络模型,所述神经网络模型包括实例分割网络模型和物体完整框检测网络模型;利用所述实例分割网络模型对所述物体图像的多种特征图进行特征处理操作,得到各个对象的类别、可视边界框和对应的掩膜;基于所述物体完整框检测网络模型根据所述各个对象的可视边界框和对应的掩膜对所述多种特征图中的初始特征图进行分割操作得到最终特征图;根据所述物体完整框检测网络模型预测所述各个对象的可视边界框和完整框在所述最终特征图上的坐标差值并计算得到完整框的坐标数据,根据所述完整框的坐标数据得到所述各个对象在物体图像上的位置信息。2.根据权利要求1所述的方法,其特征在于,所述利用实例分割网络模型对物体图像的多种特征图进行特征处理操作,得到物体图像中各个对象的类别、可视边界框和对应的掩膜,包括:利用第一预设网络对相同像素的物体图像进行特征提取,得到所述初始特征图;根据第二预设网络对所述初始特征图进行分割处理,得到第一特征图;基于第三预设网络对所述第一特征图进行特征处理,得到物体图像中各个对象的类别、各个对象可视边界框和对应的掩膜;其中,所述特征处理包括池化操作、物体分类、边界框回归以及掩膜预测。3.根据权利要求2所述的方法,其特征在于,所述利用第一预设网络对相同像素的物体图像进行特征提取,得到所述初始特征图,包括:获取多个不同像素的物体图像;将所述多个不同像素的物体图像进行像素转化操作,得到相同像素的物体图像;利用残差网络ResNet和特征图金字塔网络FPN对所述相同像素的物体图像进行特征提取,得到所述初始特征图。4.根据权利要求2所述的方法,其特征在于,所述根据第二预设网络对所述初始特征图进行分割,得到第一特征图,包括:获取区域建议网络RPN,并生成RPN的多个建议框;利用所述多个建议框对所述初始特征图进行图像分割,得到对应所述建议框内的第一特征图。5.根据权利要求2所述的方法,其特征在于,所述基于第三预设网络对所述第一特征图进行特征处理,得到物体图像中各个对象的类别、各个对象可视边界...
【专利技术属性】
技术研发人员:方璐,李晓飞,戴琼海,董众,袁肖赟,肖京,曾凡涛,
申请(专利权)人:平安科技深圳有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。