【技术实现步骤摘要】
一种使用门控和自适应注意力的图像分割方法和装置
本专利技术涉及图像处理领域,特别涉及一种使用门控和自适应注意力的图像分割方法和装置。
技术介绍
随着科技的进步,计算机的性能得到了巨大的提升,得益于现代互联网的海量数据以及图形处理器并行处理的强大计算力,计算机视觉得到了飞速的发展。计算机视觉中最重要的基本问题之一就是对图像进行语义级别的分割,其实质是对图像的每个像素点进行分类。图像语义分割方法分为传统的图像自动分割算法和基于深度学习的分割方法。传统的图像自动分割算法,需要人为干预,并且分割结果对噪声敏感,使得分割结果存在较大的误差。基于深度学习的分割方法克服了传统算法的缺点,但是深度学习分割方法仍然不能完全精准的分割,它的性能具有很大的提升空间。视觉注意力机制是人类脑部视觉神经网络特有的一种机制,这种机制可以在人类通过视觉快速扫描全局图像的时候,分辨出需要关注的重点区域,从而对重点区域分配更多的资源,提高视觉处理的速度和效率。深度学习分割方法严重依赖于深度神经网络提取的图像特征,如果深度神经网络能够使用 ...
【技术保护点】
1.一种使用门控和自适应注意力的图像分割方法,将图像的感兴趣区域ROI从整幅图像中分割出来,所述方法包括训练阶段和推理阶段;/n(一)训练阶段包括:/n(1)获取图像:获取待处理的图像,包括互联网下载或者线下采集;/n(2)图像预处理:对图像进行归一化处理,将多模态数据拼接成多通道数据,对数据进行清洗,去除无效数据;/n(3)构建分割模型:使用门控注意力机制和自适应注意力机制构建分割模型,具体步骤包括:/n(3-1)将经过预处理的图像数据送入残差单元,提取出图像的特征,输出的数据进行两倍下采样处理,降低数据量,提高数据的信噪比,该过程重复进行多次;/n(3-2)将经过步骤( ...
【技术特征摘要】
1.一种使用门控和自适应注意力的图像分割方法,将图像的感兴趣区域ROI从整幅图像中分割出来,所述方法包括训练阶段和推理阶段;
(一)训练阶段包括:
(1)获取图像:获取待处理的图像,包括互联网下载或者线下采集;
(2)图像预处理:对图像进行归一化处理,将多模态数据拼接成多通道数据,对数据进行清洗,去除无效数据;
(3)构建分割模型:使用门控注意力机制和自适应注意力机制构建分割模型,具体步骤包括:
(3-1)将经过预处理的图像数据送入残差单元,提取出图像的特征,输出的数据进行两倍下采样处理,降低数据量,提高数据的信噪比,该过程重复进行多次;
(3-2)将经过步骤(3-1)处理的数据送入残差单元,输出的数据送入自适应注意单元,该单元能够利用提取的图像特征之间的差异,进行自适应的注意力操作,自动寻找出每个特征通道的度量值,该度量值表征了每个特征通道对图像分割起作用的重要程度,故可以将该度量值作为每个特征通道的权重,从而对在图像分割中起重要作用的特征赋予更大的权重,而对在图像分割中不起作用的特征,赋予更小的权重,过程如下所示:
yi(t)=f(Xi(t)·Wi+yi(t-1)·Vi+bi)
O(Xi)=Si·Xi+Xi
Xi表示第i个特征通道的值,yi表示自动学习的第i个特征通道的度量值,Si表示第i个特征通道的权重值,Oi表示加权后的第i个特征通道的值,Wi和bi表示t时刻的网络学习到的参数值,Vi表示t-1时刻的值对当前时刻的影响因子;
(3-3)将经过步骤(3-2)处理的数据进行两倍的上采样操作,恢复图像的分辨率,将经过上采样操作的数据送入门控残差单元,该单元使用门控注意力机制,将经过上采样操作的数据...
【专利技术属性】
技术研发人员:吴强,石伟,朱奇晓,刘琚,
申请(专利权)人:山东大学,
类型:发明
国别省市:山东;37
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。