一种街道场景视频实例分割方法及系统技术方案

技术编号:35433000 阅读:28 留言:0更新日期:2022-11-03 11:38
本发明专利技术提供了一种街道场景视频实例分割方法及系统,其中,所述方法包括:构建多感受野下采样模块;基于所述多感受野下采样模块设计空间位置信息补偿特征金字塔;构建锚框校准模块;基于所述锚框校准模块设计锚框校准检测器;基于所述空间位置信息补偿特征金字塔和所述锚框校准检测器构建街道场景视频实例分割模型;获得街道场景数据集,并基于所述街道场景数据集提取街道场景实例;使用所述街道场景视频实例分割模型对所述街道场景实例进行分割。解决了现有技术中存在多类型纵横比锚框采用单一感受野采样导致边缘特征提取不充分和特征金字塔高层特征空间位置细节信息匮乏的技术问题。技术问题。技术问题。

【技术实现步骤摘要】
一种街道场景视频实例分割方法及系统


[0001]本专利技术涉及无人驾驶领域,具体涉及一种街道场景视频实例分割方法及系统。

技术介绍

[0002]环境感知是无人驾驶技术研究中的关键问题之一,为车辆在交通场景下的路径规划和决策、控制执行提供重要依据。车辆在行驶过程中需要实时获取环境信息并进行处理,目前常见的环境感知方法根据获取环境信息的传感器类型主要分为雷达、多传感器信息融合以及视觉的方法。雷达设备成本高并且只能识别深度信息而无法获取纹理和色彩;多传感器信息融合的方法成本更高并且技术难度大;而视觉的方法具有成本低,能获取纹理和色彩信息等优点,因此具有更广阔的研究和应用价值。
[0003]但现有技术中存在多类型纵横比锚框采用单一感受野采样导致边缘特征提取不充分和特征金字塔高层特征空间位置细节信息匮乏的技术问题。

技术实现思路

[0004]本申请通过提供了一种街道场景视频实例分割方法及系统,解决了现有技术中存在多类型纵横比锚框采用单一感受野采样导致边缘特征提取不充分和特征金字塔高层特征空间位置细节信息匮乏的技术问题。达到了通过所本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种街道场景视频实例分割方法,其特征在于,所述方法包括:构建多感受野下采样模块;基于所述多感受野下采样模块设计空间位置信息补偿特征金字塔;构建锚框校准模块;基于所述锚框校准模块设计锚框校准检测器;基于所述空间位置信息补偿特征金字塔和所述锚框校准检测器构建街道场景视频实例分割模型;获得街道场景数据集,并基于所述街道场景数据集提取街道场景实例;使用所述街道场景视频实例分割模型对所述街道场景实例进行分割。2.如权利要求1所述的方法,其特征在于,所述方法还包括:所述多感受野下采样模块包括第一分支、第二分支、第三分支和第四分支;分别使用所述第一分支、所述第二分支、所述第三分支、所述第四分支对图像进行特征提取,获得第一特征图、第二特征图、第三特征图和第四特征图;将所述第一特征图、所述第二特征图、所述第三特征图、所述第四特征图进行相加、激活和归一化后,获得输出结果。3.如权利要求2所述的方法,其特征在于,所述获得输出结果,所述方法还包括:获得所述输出结果的公式如下:P
cc
=Conv
i
×
j
(Conv
i
×
j
(F
in
))P
pc
=Conv
i
×
j
(Pool
i
×
j
(F
in
))其中,P
cc
表示为两个串联的卷积;P
pc
表示为先池化再卷积;Conv
i
×
j
(g)表示卷积核为i
×
j的卷积操作;Pool
i
×
j
(g)表示池化核为i
×
j的池化操作;F
in
表示输入的特征图;MRFS表示最终输出;Relu为激活函数;BN为归一化。4.如权利要求1所述的方法,其特征在于,所述基于所述多感受野下采样模块设计空间位置信息补偿特征金字塔,还包括:获取骨干网中C2

C5层特征,进行通道数量压缩;将压缩通道数量后的所述C5层作为P5层;所述P5层使用双线性插值上采样与C4特征图融合获得P4层;所述P4层使用双线性插值上采样后与C3特征图融合获得P3层;所述C2层利用所述多感受野下采样模块对特征图进行下采样,与经过卷积处理的P3层特征图进行相加后,再经过一次卷积处理后获得F3层;所述F3层经过所述多感受野下采样模块进行下采样操作后,与经过一次卷积处理的P4进行相加,获得F4层;所述F4层经过所述多感受野下采样模块进行下采样操作与经过一次卷积处理后的P5进行相...

【专利技术属性】
技术研发人员:张印辉赵崇任何自芬杨宏宽黄滢
申请(专利权)人:昆明理工大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1