【技术实现步骤摘要】
一种图像显著性区域检测方法及装置
本专利技术涉及计算机图像处理
,具体涉及一种图像显著性区域检测方法和装置。另外,还涉及一种电子设备及非暂态计算机可读存储介质。
技术介绍
近年来,随着计算机图像处理技术的迅速发展,基于深度学习的图像应用,比如图像显著性区域检测已经取得了长足的进步。图像显著性区域检测的任务是检测图像中引起人眼注意的目标对象,比如行人检测中的行人或者特定场景中的目标异常点。现有技术中,基于卷积网络的图像显著性检测方法已经得到了广泛应用。然而,此种方法直接作用在原始图像通道上,没有考虑自然图像的频域特征的分布特征,限制了对图像显著性区域检测性能的进一步提升,很难获得较好的检测效果。随着变换器(Transformer)类模型的深入发展,如何结合全局注意力方法实现更好的图像显著性检测成为本领域研究的重要课题。
技术实现思路
为此,本专利技术提供一种图像显著性区域检测方法及装置,以解决现有技术中存在的图像显著性区域检测方案的检测效果及性能较差的问题。本专利技术提供一种图像显著性 ...
【技术保护点】
1.一种图像显著性区域检测方法,其特征在于,包括:/n将待检测的原始图像转换为亮度色彩通道图像,并对亮度色彩通道图像进行降采样处理;/n将降采样处理后的亮度色彩通道图像输入到傅里叶编码层提取频域特征,得到相应的频域矩阵;/n将所述频域矩阵和所述原始图像对应的矩阵向量输入至全局注意力模型中进行处理,得到对应的定位向量,基于所述定位向量确定图像显著性区域;/n其中,所述全局注意力模型是基于预设原始图像和用于预先标记的图像显著位置的定位向量作为训练样本进行训练后得到的。/n
【技术特征摘要】
1.一种图像显著性区域检测方法,其特征在于,包括:
将待检测的原始图像转换为亮度色彩通道图像,并对亮度色彩通道图像进行降采样处理;
将降采样处理后的亮度色彩通道图像输入到傅里叶编码层提取频域特征,得到相应的频域矩阵;
将所述频域矩阵和所述原始图像对应的矩阵向量输入至全局注意力模型中进行处理,得到对应的定位向量,基于所述定位向量确定图像显著性区域;
其中,所述全局注意力模型是基于预设原始图像和用于预先标记的图像显著位置的定位向量作为训练样本进行训练后得到的。
2.根据权利要求1所述的图像显著性区域检测方法,其特征在于,所述对亮度色彩通道图像进行降采样处理,具体为:对色彩通道进行降采样处理,使得所述色彩通道的分辨率是亮度通道分辨率的四分之一。
3.根据权利要求1所述的图像显著性区域检测方法,其特征在于,所述定位向量构成的矩阵中的各个单元与所述原始图像中的各个区域一一对应,每个单元的值表示所述原始图像中对应区域的显著度均值。
4.根据权利要求1所述的图像显著性区域检测方法,其特征在于,还包括:
对所述原始图像进行切块,获得若干个原始图像小块;
将所述原始图像小块分别变换为对应的一维向量,基于所述一维向量构成所述原始图像对应的矩阵向量。
5.根据权利要求1所述的图像显著性区域检测方法,其特征在于,所述全局注意力模型为基于注意力机制的变换器模型;
所述将所述频域矩阵和所述原始图像对应的矩阵向量输入至全局注意力模型中进行处理,得到对应的定位向量,具体包括:
将编码后的所述频域矩阵和所述原始图像对应的矩阵向量输入至变换器模型中的编码器部分进行处理,获得相应的编码矩阵向量;
将所述编码矩阵向量输出到所述变换器模型中的解码器部分,获得相应的定位向量。
6.一种图像显著性区域检测方法,其特征在于,包括:
将待检测的原始图像转换为亮度色彩通道图像;
将所述亮度色彩通道图像输入到傅里叶编码层提取频域特征,得到相应的频域矩阵;
在频域矩阵上对所述亮度色彩通道图像进行降采样处...
【专利技术属性】
技术研发人员:不公告发明人,
申请(专利权)人:上海壁仞智能科技有限公司,
类型:发明
国别省市:上海;31
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。