一种基于混合深度可分离卷积的实时语义分割方法技术

技术编号:28624733 阅读:26 留言:0更新日期:2021-05-28 16:20
本发明专利技术公开了一种基于混合深度可分离卷积的实时语义分割方法,在预测效率和预测准确率方面取得了比较好的平衡,所述方法包括:数据预处理和数据增强;设计混合深度可分离卷积单元,提升多尺度特征表达能力;构建混合深度可分离卷积模块;搭建混合深度可分离卷积语义分割网络,提取图像高级语义特征;训练并验证混合深度可分离卷积的语义分割网络。本发明专利技术具有预测精度较高、模型参数量小,快速轻量化的优点。

【技术实现步骤摘要】
一种基于混合深度可分离卷积的实时语义分割方法
本专利技术属于计算机视觉中的图像实时语义分割领域,是一种利用卷积神经网络进行语义分割的方法。
技术介绍
在计算机视觉领域中,图像语义分割是一个关键任务,这个任务也是研究的热点。语义分割的目的是将摄像机拍摄的场景图片分割成一系列不相交的图像区域,为图像中的每个像素赋予一个特定的类别,这些类别通常包括可数对象(如自行车、汽车、人)和不可数对象(如天空、道路、草地)。随着深度学习的兴起,图像语义分割技术为场景解析中铺平了道路,在自动驾驶、增强现实、视频监控中发挥着举足轻重的作用。然而现有的语义分割方法主要着眼于提高性能,这些算法为了提高分割的准确率,特征编码器通常会采用较为复杂的主干网络,语义解码器也会采用密集计算型的网络结构,例如空间金字塔池化,浅层深层特征融合,设置不同扩张率的空洞卷积扩大感受野,所以网络模型规模很大,场景分割效率较低。但对于实际应用来说,算法需要保持较高的分割精度,同时实时性的要求也必须满足。而一些实时语义分割算法(例如ICNet算法)虽然速度较快,但是受局部感受野机制的限制本文档来自技高网...

【技术保护点】
1.一种基于混合深度可分离卷积的实时语义分割方法,其特征在于,该方法包含下列步骤:/n步骤S1,从公开的城市景观数据集中选取了3475张图片,挑选出合适的类别并将不合适的类别设置为忽略类,对挑选的这些数据进行预处理和数据增强;/n步骤S2,针对步骤S1图像数据的多尺度特征表达和实时预测的要求,设计了混合深度可分离卷积单元,该单元首先将输入的特征图平均分成4组,采用4组不同大小的深度可分离卷积核进行特征提取,然后将特征映射拼接,最后将特征映射进行交替重排;/n步骤S3,在步骤S2基础上构建混合深度可分离卷积模块,串联堆叠了4次不同卷积核次序的混合深度可分离卷积单元,消除多尺度混叠效应;/n步骤S...

【技术特征摘要】
1.一种基于混合深度可分离卷积的实时语义分割方法,其特征在于,该方法包含下列步骤:
步骤S1,从公开的城市景观数据集中选取了3475张图片,挑选出合适的类别并将不合适的类别设置为忽略类,对挑选的这些数据进行预处理和数据增强;
步骤S2,针对步骤S1图像数据的多尺度特征表达和实时预测的要求,设计了混合深度可分离卷积单元,该单元首先将输入的特征图平均分成4组,采用4组不同大小的深度可分离卷积核进行特征提取,然后将特征映射拼接,最后将特征映射进行交替重排;
步骤S3,在步骤S2基础上构建混合深度可分离卷积模块,串联堆叠了4次不同卷积核次序的混合深度可分离卷积单元,消除多尺度混叠效应;
步骤S4,在步骤S3基础上搭建混合深度可分离卷积语义分割网络,它由混合深度可分离卷积模块串联堆叠4次构成,模块内使用了3个跳跃连接,模块之间使用了1×1卷积进行残差连接;
步骤S5,训练并验证混合深度可分离卷积的语义分割网络,使用步骤S1处理好的图片输入到网络中训练,通过网络的前向推理进行性能验证并输出预测的分割结果。


2.根据权利要求1所述的基于混合深度可分离卷积的实时语义分割方法,其特征在于:步骤S2所设计的混合深度可分离卷积单元;将待处理的特征图按通道平均分成4组,并对这4组特征图的边缘用0来进行填充,对齐输出的4组特征映射分辨率;这4组分别使用不同大小的奇数深度可分离卷积核进行特征提取,这些不同大小的卷积核分别是3×3、5×5、7×7、9×9的深度可分离卷积核;将得到的4组相同分辨率的特征按通道进行拼接;最后将特征映射进行交替重排。


3.根据权利要求1所述的基于混合深度可分离卷积的实时语义分割方法,其特征在于:步骤S3构建的混合深度可分离卷积模块;由步骤S2设计的混合深度可分离卷积单元、归一化层、非线性激活层依次串联堆叠4次构成,其中第一、二、三个混合深度可分离...

【专利技术属性】
技术研发人员:王素玉王维珍
申请(专利权)人:北京工业大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1