【技术实现步骤摘要】
一种苗族服饰图像语义分割方法
[0001]本专利技术涉及图像处理和机器视觉技术,具体是一种苗族服饰图像语义分割方法。
技术介绍
[0002]少数民族将自己的宗教文化、图腾文化体现在服饰的纹样和建筑的装饰上,这样不仅起到美化自身的作用,还能够传达特殊的文化意义。我国少数民族种类繁多,民族服饰多姿多彩,如何正确、高效地分割少数民族服饰的图案,对于辅助研究人员研究少数民族文化具有重要的意义。
[0003]图像语义分割Semantic Segmentation是图像处理和是机器视觉技术中关于图像理解的重要一环,也是AI领域中一个重要的分支。语义分割即是对图像中每一个像素点进行分类,确定每个点的类别,如属于背景、人或车,从而进行区域划分。目前,语义分割已经被广泛应用于自动驾驶、无人机落点判定等场景中。
[0004]虽然已经有学者对民族服饰图像进行了研究,但在民族服饰图像分割的自动优化、提取、分类、识别等方面的研究还很少,这影响了从大量民族服饰图像中快速检索和识别。区别于时尚服饰,少数民族服装具有以下特点:(1)服饰图案 ...
【技术保护点】
【技术特征摘要】
1.一种苗族服饰图像语义分割方法,其特征在于,包括如下步骤:1)数据增强:采用Mosaic数据增强的方法,将苗族服饰四张图像合成一张图像、提取四张图像特征信息,所述数据增强是指对图片裁剪、翻转、旋转、缩放、扭曲几何变换及像素扰动、添加噪声、光照调节、对比度调节、样本加和或插值、分割补丁;2)编码:采用基于多尺度渐进式注意力学习金字塔网络模型MutilPPL将输入的服饰图片经过卷积的3次下采样操作,每次下采样操作将特征图的长和宽缩小2倍、通道数扩大2倍,然后将卷积输出的特征图逐层传入不同尺度的特征层进行特征融合;3)解码:将MutilPPL模型中的编码器和解码器的特征层进行密集跨级连接,使MutilPPL模型提取服饰多尺度特征信息,再采用金字塔结构融合特征局部与全局信息,最后在解码器中进行3次转置卷积逐步恢复高分辨率图像,得到语义分割结果,MutilPPL模型中的解码器结构与编码器结构对称,解码器每次采用转置卷积操作,将特征图尺寸扩大2倍、通道数缩小2倍;4)辅助分支结构:辅助分支结构由Conv
‑
Classes模块、渐进式注意力学习金字塔结构(PPL)模块、Softmax分类器3个部分组成,定义编码器中的Layer6、Layer 7、Layer 8作为辅助分支结构的输入,其中,Conv
‑
Classes模块设有转置卷积和1
×
1卷积,且在每个1
×
1卷积后面都加上实例化归一化(Instance Normalization,简称IN)和ACON激活函数,将Layer6、Layer 7、Layer 8输入到Conv
‑
Classes模块中得到不同类别的置信系数,然后将不同置信系数的通道进行连接并进行1
×
1卷积操作,并将它们的特征信息交叉输入到两个PPL模块中,每个PPL模块的输出都进行一次1
×
1卷积操作,最后将PPL模块聚合的多层特征输入到Softmax分类器实现最终的输出,具体是:Layer 6和Layer 7对应浅和中层网络,而Layer 8对应深层网络,首先,解码器根据不同层次的深度的卷积层Layer 6、Layer 7、Layer 8划分不同的阶段,获得不同语义的特征信息,每个阶段通过转置卷积得到相同大小的特征图,并经过卷积,得到不同阶段的不同类别置信系数;然后,将不同置信系数的通道进行连接,同时将它们的特征信息交叉输入到渐进式注意力学习金字塔结构(PPL),使网络能够合理利用不同阶段学习的特征,专注有效特征提取,丢弃冗余特征;最后,将渐进式注意力学习金字塔结构聚合的多层特征输入到Softmax分类器实现最终的输出,辅助分支结构在解码过程中分别提取三次转置卷积的输出特征,利用1
×
1卷积层将特征通道减少为7,并将卷积的结果进行融合;5)实现语义分割:采用Softmax激活函数对特征图进行分类,实现语义分割。2.根据权利要求1所述的苗族服饰图像语义分割方法,其特征在于,所述Mu...
【专利技术属性】
技术研发人员:覃琴,冯意,王鑫,许文全,颜靖柯,
申请(专利权)人:桂林电子科技大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。