【技术实现步骤摘要】
一种基于多接受野的交替更新网络的场景分割方法
本专利技术涉及计算机视觉领域,具体涉及一种基于多接受野的交替更新网络的场景分割方法。
技术介绍
卷积网络一直在推动计算机视觉领域各个方向的进步,例如目标定位、目标检测、图像识别。同时人们也将卷积网络引入到语义分割的问题上,从而取代传统的手工标记方法,实现端到端的分割输出。图像识别的作用是识别出一幅图像里面有什么东西,目标定位的结果是目标的位置,语义分割则是从像素级的角度来回答图像里面有什么类别以及这些类别的具体位置。语义分割包括了许多子方向,例如:衣物解析,场景分割,任务解析等,其一直是计算机视觉领域上很有挑战性方向,虽然国内外对这个方向投入了大量的研究,但仍然存在着许多挑战。场景语义分割是语义分割的关键问题之一,其功能是将一张场景图里面的街景、人物和建筑等进行像素级分类。一直以来,人们致力于提高场景语义分割的准确性,然而一些问题还是没有能够很好地解决,主要的挑战和缺点有:(1)特征分辨率减小:在神经网络重复池化和降采样过程中,图像的特征分辨率会减小,从而导致一些
【技术保护点】
1.一种基于多接受野的交替更新网络的场景分割方法,其特征在于,包括以下步骤:/nS1、将输入图像通过一个预训练好的卷积神经网络,进行特征图的提取;/nS2、通过预训练好的集合网络空洞金字塔模块,得到包含高层语义信息的特征图;/nS3、在步骤S2中得到的特征图的基础上对逐个像素计算分类的损失,获得分割热图。/n
【技术特征摘要】
1.一种基于多接受野的交替更新网络的场景分割方法,其特征在于,包括以下步骤:
S1、将输入图像通过一个预训练好的卷积神经网络,进行特征图的提取;
S2、通过预训练好的集合网络空洞金字塔模块,得到包含高层语义信息的特征图;
S3、在步骤S2中得到的特征图的基础上对逐个像素计算分类的损失,获得分割热图。
2.根据权利要求1所述的基于多接受野的交替更新网络的场景分割方法,其特征在于,在所述步骤S1中提取得到的特征图为输入图像上经过1/8降采样得到的特征图。
3.根据权利要求1所述的基于多接受野的交替更新网络的场景分割方法,其特征在于,对在步骤S2中得到的特征图按照取值为8的上采样率进行上采样。
4.根据权利要求1所述的基于多接受野的交替更新网络的场景分割方法,其特征在于,所述集合网络空洞金字塔模块具有扩张卷积核,在特征图输入时,输入特征逐层进行卷积计算,并作为输入拼接在该所述集合网络空洞金字塔模块中的其他神经层中。
5.根据权利要求4所述的基于多接受野的交替更新网络的场景分割方法,其特征在于,在同一个所述集合网络空洞金字塔模块的任意两个网络层中,其信息流包括前传部分和后传部分,通过其后面的网络层级输出对前面的层级输出进行优化。
6.根据权利要求5所述的基于多接受野的交替更新网络的场景分割方法,其特征在于,所述集合网络空洞金字塔模块内的前传部分,其相邻两层之间进行空洞卷积,通过多尺度扩张核提取多尺度的特征。
7.根据权利要求6所述的基于多接受野的交替更新网络的场景分割方法,其特征在于,在空洞卷积的过程中,其表达式...
【专利技术属性】
技术研发人员:王金桥,林佳玲,胡建国,唐明,朱贵波,蔡佳辉,
申请(专利权)人:杰创智能科技股份有限公司,广州智慧城市发展研究院,中山大学,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。