【技术实现步骤摘要】
图像处理方法、装置和计算机可读存储介质
本公开涉及计算机
,特别涉及一种图像处理方法、装置和计算机可读存储介质。
技术介绍
图像语义分割技术,是指给定一张图像,将图像中每个像素点分为预定义的语义类别(如人、道路、建筑、树木、动物等),从而分割得到图像中语义类别相同的区域。传统图像语义分割方法包括非参数化方法和基于机器学习的方法。非参数化方法一般根据像素值的相似性,将临近的相似像素分为相同类别。基于机器学习的方法通过人工设计的算子或算法自动学习的特征表示图像中的像素或临近区域的视觉特征,并使用机器学习算法从大量数据中学习分类模型,从而将像素分类为预定义的类别。传统图像语义分割方法主要面向一般性图像中的粗粒度对象的分割,如行人、道路、车辆、树木、建筑等。
技术实现思路
专利技术人发现:传统图像语义分割方法对图像中的小尺度目标分割效果较差、对局部细节分割较为粗糙。例如,图像中人体解析技术是图像语义分割的一种特例,其分割目标是图像中人体的各个部位及着装配饰等区域(如人脸、头发、躯干、上肢、下肢、帽子、上装、裤子、裙子、鞋等),其他区域分类为背景。应用现有的语义分割方法进行人体解析,容易导致相似类别间(如头发与帽子、T恤与外套、短裤与短裙等)极易混淆,无法实现准确的解析。本公开所要解决的一个技术问题是:提高对图像进行语义分割的准确性。根据本公开的一些实施例,提供的一种图像处理方法,包括:将待处理图像输入图像分割网络中的语义分割模型和细节提取模型;其中,细节提取模型用于获 ...
【技术保护点】
1.一种图像处理方法,包括:/n将待处理图像输入图像分割网络中的语义分割模型和细节提取模型;其中,所述细节提取模型用于获取所述待处理图像的细节特征;/n获得所述语义分割模型输出的所述待处理图像的第一特征张量,以及所述细节提取模型输出的所述待处理图像的第二特征张量;/n根据所述第一特征张量和第二特征张量,确定所述待处理图像中各个像素点所属的类别,从而确定所述待处理图像的分割结果;/n其中,所述图像分割网络还包括:辫形模块;所述语义分割模型的中间层和对应的所述细节提取模型的中间层通过辫形模块连接;所述辫形模块用于对所述语义分割模型的中间层输出的特征张量和所述细节提取模型的中间层输出的特征张量进行融合。/n
【技术特征摘要】
1.一种图像处理方法,包括:
将待处理图像输入图像分割网络中的语义分割模型和细节提取模型;其中,所述细节提取模型用于获取所述待处理图像的细节特征;
获得所述语义分割模型输出的所述待处理图像的第一特征张量,以及所述细节提取模型输出的所述待处理图像的第二特征张量;
根据所述第一特征张量和第二特征张量,确定所述待处理图像中各个像素点所属的类别,从而确定所述待处理图像的分割结果;
其中,所述图像分割网络还包括:辫形模块;所述语义分割模型的中间层和对应的所述细节提取模型的中间层通过辫形模块连接;所述辫形模块用于对所述语义分割模型的中间层输出的特征张量和所述细节提取模型的中间层输出的特征张量进行融合。
2.根据权利要求1所述的图像处理方法,其中,
所述辫形模块的数量为至少一个;在所述辫形模块的数量为多个的情况下,不同的辫形模块分别连接所述语义分割模型的不同卷积层和所述细节提取模型的不同卷积层。
3.根据权利要求2所述的图像处理方法,其中,
所述对所述语义分割模型的中间层输出的特征张量和所述细节提取模型的中间层输出的特征张量进行融合包括:
针对每个辫形模块,将所述语义分割模型的一个卷积层输出的特征张量和所述细节提取模型的一个卷积层输出的特征张量输入所述辫形模块,分别得到所述辫形模块输出的所述语义分割模型对应的融合后的特征张量,以及所述辫形模块输出所述细节提取模型对应的融合后的特征张量;
将所述语义分割模型对应的融合后的特征张量输入所述语义分割模型下一个卷积层;将所述细节提取模型对应的融合后的特征张量输入所述细节提取模型下一个卷积层。
4.根据权利要求2所述的图像处理方法,其中,
所述辫形模块包括第一融合子模块和第二融合子模块;
所述对所述语义分割模型的中间层输出的特征张量和所述细节提取模型的中间层输出的特征张量进行融合包括:
将所述语义分割模型的一个卷积层输出的特征张量和对应的所述细节提取模型的一个卷积层输出的特征张量,输入第一融合子模块,得到输出的语义分割模型对应的融合后的特征张量;
将所述语义分割模型的所述卷积层输出的特征张量和所述细节提取模型的所述卷积层输出的特征张量,输入第二融合子模块,得到输出的细节提取模型对应的融合后的特征张量。
5.根据权利要求4所述的图像处理方法,其中,
在第一融合子模块中,根据输入的细节提取模型对应的特征张量的尺寸,调整语义分割模型对应的特征张量长和宽两个维度的尺寸,将输入的细节提取模型对应的特征张量和调整后的语义分割模型对应的特征张量进行特征级联,得到第一级联特征;根据不同通道的第一权重,对第一级联特征进行调整,得到语义分割模型对应的融合后的特征张量;
在第二融合子模块中,根据输入的语义分割模型对应的特征张量的尺寸,调整细节提取模型对应的特征张量长和宽两个维度的尺寸,将输入的语义分割模型对应的特征张量和调整后的细节提取模型对应的特征张量进行特征级联,得到第二级联特征;根据不同通道的第二权重,对第二级联特征进行调整,得到细节提取模型对应的融合后的特征张量。
6.根据权利要求5所述的图像处理方法,其中,
所述根据不同通道的第一权重,对第一级联特征进行调整包括:
将第一级联特征经过初步处理,将初步处理的第一级联特征中的每个通道对应的元素分别乘以对应的第一权重,再与初步处理的第一级联特征进行加权,得到语义分割模型对应的融合后的特征张量;
所述根据不同通道的第二权重,对第二级联特征进行调整包括:
将第二级联特征经过初步处理,将初步处理的第二级联特征中的每个通道对应的元素分别乘以对应的第二权重,再与初步处理的第二级联特征进行加权,得到细节提取模型对应的融合后的特征张量;
其中,不同的通道对应不同的类别,所述初步处理包括卷积、批正则化。
7.根据权利要求1所述的图像处理方法,其中,
所述根据所述第一特征张量和第二特征张量,确定所述待处理图像中各个像素点所属的类别包括:
将所述第一特征张量与所述第二特征张量进行加权,得到第三特征张量;
将所述第三特征张量中的每个像素点对应的特征,在通...
【专利技术属性】
技术研发人员:刘鑫辰,刘武,梅涛,
申请(专利权)人:北京沃东天骏信息技术有限公司,北京京东世纪贸易有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。