一种基于多粒度计算的图像图表示方法技术

技术编号:36078961 阅读:18 留言:0更新日期:2022-12-24 10:51
本发明专利技术属于图像分割领域,具体涉及一种基于多粒度计算的图像图表示方法,包括:对图像进行预处理;采用Sobel算子计算x、y方向上的灰度值,并将最大灰度值梯度的像素点标记;在未标记的像素点中选取灰度值梯度最小的点作为中心点,根据设定的方差阈值和纯度阈值交叉更新x、y方向上的半径Rx,Ry,得到图像的一个粒矩,并将该粒矩内的所有像素点标记;在重复S3步骤直到图像的所有像素点都被标记;判断粒矩之间是否相交,采用画图工具将图像进行矩到图的表示和可视化。本发明专利技术通过将图像中具有相似灰度值的结构模块块,解决了以像素为处理单元的缺陷,提高了可解释性、可信度和鲁棒性。可信度和鲁棒性。可信度和鲁棒性。

【技术实现步骤摘要】
一种基于多粒度计算的图像图表示方法


[0001]本专利技术属于图像分割领域,具体涉及一种基于多粒度计算的图像图表示方法。

技术介绍

[0002]事物的“映射”可以看作是物体在客观世界中反射的分布,是客观世界的反映;而“肖像”可视为人类视觉系统对映射的反应,是人脑对映射的一种感觉。图像是“映射”和“肖像”的结合,它既反映了物体的客观存在,也反映了人类的感知。而人工智能的许多与视觉相关的任务旨在再现人类对视觉场景的感知过程。像素是构成数字图像的基本单元,输入到计算机的图像直接或间接是像素值,图像以二维阵列(数字图像)的形式表示,每个像素对应于二维空间中的特定“位置”,并包含一个或多个采样值。
[0003]目前,从目前来看,图像处理的主流方法是对这种二维矩阵及其像素进行处理。以图像识别任务为例,深度学习模型本质上是学习输入样本之间的差异做出最终决策。当然,是对像素执行上述学习处理或计算。然而,这种以像素为处理单元的方式有不可避免的缺陷。因为人类本身无法区分像素级别的差异,无法理解深度学习模型的决策过程,且深度学习模型易受到像素级攻击。而人类只对图像中具有特定结构或语义的内容感兴趣。因此,需要以图结构的粗粒度表示对图采集领域的数据进行处理,它也可以扩展图像相关性的下游任务处理模式。
[0004]深度学习模型的复杂性和不直观性增加了其可解释性的难度。而普通的卷积神经网络和图神经网络都可以对图片信息进行处理,所不同的是前者输入大多是像素,后者是数学意义上的图(将节点特征信息与图结构相结合的输入),而根据图结构粗粒度的表示输入图像而并非像素级的计算,可以使得更好的理解模型背后如何工作的。

技术实现思路

[0005]为解决上述技术问题本专利技术提出一种基于多粒度计算的图像图表示方法,包括:
[0006]S1:对图像进行高斯滤波平滑去噪处理,并将去噪后的图像转化为灰度图;
[0007]S2:采用Sobel算子计算灰度图x、y方向上的灰度值,得到整个图片的灰度值梯度Grad_map,并将最大灰度值梯度的像素点标记;
[0008]S3:在未标记的像素点中选取灰度值梯度最小的点作为中心点,根据设定的方差阈值和纯度阈值交叉更新x、y方向上的半径Rx,Ry,得到图像的一个粒矩GR=[(x,y),Rx,Ry],并将该粒矩内的所有像素点标记;
[0009]S4:在重复S3步骤直到图像的所有像素点都被标记,得到整个图像的所有粒矩;
[0010]S5:根据的粒矩的中心点、半径判断粒矩之间是否相交,根据粒矩以及粒矩间的相交情况将图像进行矩到图的可视化,得到表示的图G。
[0011]优选的,采用Sobel算子计算灰度图x、y方向上的灰度值,表示为:
[0012][0013]其中,Gx和Gy分别表示检测横向x及纵向y边缘检测的图像灰度值。
[0014]优选的,根据设定的方差阈值和纯度阈值交叉更新x、y方向上的半径Rx,Ry,具体包括:
[0015]初始化Rx和Ry为0,Rx通过横向扩增像素点的方式迭代递增半径,Ry通过上下扩增像素点的方式迭代递增半径,迭代过程Rx和Ry交替加一,每一次迭代完成后计算当前粒矩的纯度,得到当前粒矩的纯度后计算当前粒矩的方差,若当前方向的像素扩增使得当前的粒矩的方差和纯度都满足设定时或某个方向半径增加后粒矩的纯度p小于设定的纯度p或粒矩内方差大于设定的方差var_threshold,则Rx和Ry的半径迭代增加成功,否则将半径Rx和Ry迭代增加的半径减小一并在后续的迭代中停止增加,当两个方向的半径都停止增加后,当前的半径就是该粒矩最终的半径。
[0016]进一步的,纯度计算公式,表示为:
[0017][0018]其中,p表示粒矩的纯度,Rx表示粒矩横向扩增x个像素点的半径,Ry表示粒矩竖直方向扩增y个像素点的半径,n表示异类像素点。
[0019]进一步的,计算当前粒矩的方差,表示为:
[0020][0021]其中,var表示粒矩的方差,pix
i
表示粒矩中第i个像素的像素值,pix
j
表示粒矩中第j个像素的像素值,m表示粒矩内所有的像素点个数。
[0022]优选的,根据粒矩以及粒矩间的相交情况将图像进行矩到图的可视化,得到表示的图G,具体包括:
[0023]将每个粒矩视为图的节点V,如果两个矩形区域具有相交区域,则将这两个粒矩的中心点连接作为图的边,将所有粒矩的节点及其对应的边构成图像的图结构表示G=(V,E)。
[0024]本专利技术的有益效果:本专利技术通过将待处理图像的所有像素聚类成多个不同大小的粒矩区域,每个区域可以被视为图的一个节点,对相交的粒矩中心点连接边构成图像的图结构表示;图结构表示能够将图可视化并得到图的特征信息,可以扩展图像相关性进行下游任务处理,解决了以像素为处理单元的图像处理的缺陷,提高了可解释性、可信度和鲁棒性。
附图说明
[0025]图1为本专利技术的整体流程结构图;
[0026]图2为本专利技术的粒矩半径算法图。
具体实施方式
[0027]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0028]一种基于多粒度计算的图像图表示方法,如图1所示,包括:
[0029]S1:对图像进行高斯滤波平滑去噪处理,并将去噪后的图像转化为灰度图;
[0030]S2:采用Sobel算子计算灰度图x、y方向上的灰度值,得到整个图片的灰度值梯度Grad_map,并将最大灰度值梯度的像素点标记;
[0031]S3:在未标记的像素点中选取灰度值梯度最小的点作为中心点,根据设定的方差阈值和纯度阈值交叉更新x、y方向上的半径Rx,Ry,得到图像的一个粒矩GR=[(x,y),Rx,Ry],并将该粒矩内的所有像素点标记;
[0032]S4:在重复S3步骤直到图像的所有像素点都被标记,得到整个图像的所有粒矩;
[0033]S5:根据的粒矩的中心点、半径判断粒矩之间是否相交,根据粒矩以及粒矩间的相交情况将图像进行矩到图的可视化,得到表示的图G。
[0034]对于每一张图片,用Sobel算子计算x方向上和y方向上的梯度进行融合,最终得到整个图片的梯度Grad_map,Gx及Gy分别代表经横向及纵向边缘检测的图像灰度值,其公式如下:
[0035][0036]其中,Gx和Gy分别表示检测横向x及纵向y边缘检测的图像灰度值。
[0037]若图像中还存在点没被划分,在Grad_map中随机选取梯度值最小的一点作为中心坐标。根据设定的方差和纯度阈值交叉更新两个方向的半径,保存粒矩的信息,相交的矩之间相连也有边集信息。把粒矩表示成图G,最后根据生成的图G得到图G的特征和邻接矩阵。
[00本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于多粒度计算的图像图表示方法,其特征在于,包括:S1:对图像进行高斯滤波平滑去噪处理,并将去噪后的图像转化为灰度图;S2:采用Sobel算子计算灰度图x、y方向上的灰度值,得到整个图片的灰度值梯度Grad_map,并将最大灰度值梯度的像素点标记;S3:在未标记的像素点中选取灰度值梯度最小的点作为中心点,根据设定的方差阈值和纯度阈值交叉更新x、y方向上的半径Rx,Ry,得到图像的一个粒矩GR=[(x,y),Rx,Ry],并将该粒矩内的所有像素点标记;S4:在重复S3步骤直到图像的所有像素点都被标记,得到整个图像的所有粒矩;S5:根据的粒矩的中心点、半径判断粒矩之间是否相交,根据粒矩以及粒矩间的相交情况将图像进行矩到图的可视化,得到表示的图G。2.根据权利要求1所述的一种基于多粒度计算的图像图表示方法,其特征在于,采用Sobel算子计算灰度图x、y方向上的灰度值,表示为:其中,Gx和Gy分别表示检测横向x及纵向y边缘检测的图像灰度值。3.根据权利要求1所述的一种基于多粒度计算的图像图表示方法,其特征在于,根据设定的方差阈值和纯度阈值交叉更新x、y方向上的半径Rx,Ry,具体包括:初始化Rx和Ry为0,Rx通过横向扩增像素点的方式迭代递增半径,Ry通过上下扩增像素点的方式迭代递增半径,迭代过程Rx和Ry交替加一,每一次迭代完成后计算当前粒矩的纯度,得到当前粒矩的纯...

【专利技术属性】
技术研发人员:戴大伟夏书银杨龙兰丹凤王国胤
申请(专利权)人:重庆邮电大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1