基于区域增长法的DBSCAN密度聚类方法技术

技术编号:22642937 阅读:19 留言:0更新日期:2019-11-26 16:27
本发明专利技术公开了基于区域增长法的DBSCAN密度聚类方法,本发明专利技术根据眼底图像数据集特殊的空间特点,借鉴了数字图像处理中区域增长法的相关原理对传统DBSCAN方法进行一定的改进,区域增长法首先以眼底图像中某一点为中心,不断的归并每个中心像素点8‑邻域(与该像素点相邻的8个像素点称为8‑邻域)内与该点足够相似的像素点,以此来实现区域增长的效果。相比传统DBSCAN进行眼底血管提取,计算的时间开销有了大幅度改进。

DBSCAN density clustering method based on region growth method

The invention discloses a DBSCAN density clustering method based on the region growing method. According to the special spatial characteristics of the eyeground image data set, the invention improves the traditional DBSCAN method by referring to the relevant principles of the region growing method in the digital image processing. The region growing method firstly takes a point in the eyeground image as the center and constantly merges 8 \u2011 neighborhood of each central pixel point (and The eight adjacent pixels are called 8 \u2011 neighborhood), which are similar to this point enough to achieve the effect of region growth. Compared with traditional DBSCAN for fundus vascular extraction, the time cost of calculation has been greatly improved.

【技术实现步骤摘要】
基于区域增长法的DBSCAN密度聚类方法
本专利技术涉及利用密度聚类中的DBSCAN方法来对眼底血管进行提取,并且利用区域增长法的相关原理改进传统DBSCAN方法来实现对于图像数据集的加速计算,属于人工智能和医学图像处理领域。
技术介绍
在如今社会经济飞速发展的时代,计算机以及信息技术等方面也跟着飞速发展,由此引发的多种新型技术如雨后春笋般融入到人们的日常生活之中,其中数据挖掘(DM)技术就诞生于人们的不断研究中。它出现在20世纪90年代,并在这几十年的不断探索中,出现了各种各样的数据挖掘方法,其中,聚类分析是其中比较重要的方法之一,并且越来越受到人们的关注。聚类分析又称为群分析,是一种重要的分类方法,它是根据事物自身的特征,通过已建立的统计模型对事物进行多元分析方法的一种统计方法,其目的在于将相似的事物进行归类,这些类不是事先给定的,而是需要通过聚类分析来给以确定类型。聚类分析归根结底是由分类演变而来,然而两者却有着本质的区别,比如对于分类需要通过在训练集上训练以此来提炼一些潜在的规则,而对于聚类来讲,却是在没有训练样本的情况下直接对数据进行分析,是一种无监督的形态,由此可见聚类分析有其独特的存在价值以及研究意义,其中基于密度的聚类方法是众多聚类分析方法中的一种经典算法,相较于其他算法而言,密度聚类在距离的基础上提出了数据点自身所拥有的密度属性,进而以此来聚类,同传统聚类方法相比较,更适用于空间数据下的聚类,但是由于涉及到了任意数据点的距离计算,所以DBSCAN算法的时间复杂度往往达到了O(n^2)的级别,对于大量数据计算的时间开销往往并不理想。随着电子设备的不断更新换代,人们在日常生活中对于这些设备的依赖性越来越强,与此同时人们的平均视力水平也在逐年下降,因此而患上眼部疾病的人数正在逐年增加,据统计中国是目前盲人数目最多的国家之一,约有670万人,这样一个恐怖的数据量时刻告诫着我们要更加注重眼睛的保护,而在医学上,通过眼底图像的分析可以提前防治多种致盲疾病。眼底图像是眼科中通过眼底照相机获得的一种诊断影像,对眼底图像进行分析处理可以发现血管结构的变化,从而为糖尿病、高血压等引起的眼底病变的诊断和治疗提供辅助信息,为此对于眼底图像中的血管分割有着较为重要的现实意义。这其中就涉及到了数字图像处理中的图像分割技术,图像分割的研究多年来一直受到人们的高度重视,至今提出了各种类型的分割算法,其中聚类算法是其中重要的一种方法,图像分割技术就是把图像分成若干个特定的、具有独特性质的区域并提出感兴趣目标的技术和过程。它是由图像处理到图像分析的关键步骤,在一般情况下图像分割的准确性直接影响着后续图像分析的准确性,由此一个好的图像分割算法变得尤为重要。尤其是对于眼底血管分割这样专业领域内的应用,对于图像处理的各种要求更是极为苛刻的,为此如何高效且精确的分割血管逐渐成为人们研究的重点。
技术实现思路
在眼底血管提取的应用中,由于在实际中难以得到十分精确的分割结果作为训练集的标签加以训练,例如在眼底数据库DRIVE中有两位专家的手工分割结果,以其中一个作为对照另一个分割结果的准确率只有95%左右,由此可以看出对于标签精度要求十分高的有监督类深度学习算法并不是十分适用,而对于传统的无监督类机器学习方法,不需要训练数据,更加适合应用于眼底血管提取的场景中。在传统的无监督聚类算法中,基于密度聚类的DBSCAN方法的优点在于该方法对于噪音不敏感且可以找到任何形状的聚簇,比较适合眼底血管提取这样背景数据较为复杂的场景中,同时该方法的缺点在于时间复杂度比较高,达到了O(n^2)级别,由此带来的时间开销较大,因此本专利技术在传统DBSCAN方法的基础上,借鉴图像处理中区域增长法的相关原理对DBSCAN方法进行一定的改进,使得该方法的时间复杂度下降到O(n)级别,大幅度下降了计算的时间开销。传统DBSCAN算法的目的是寻找被低密度区域分隔的高密度区域。算法的核心思想是首先找到密度较高的点,然后将该点附近的类似的高密度点连成一片以生成各种聚簇。该算法的实现主要是通过设置两个重要的参数,即半径和密度阈值(Eps和MinPts),并根据这两个参数将眼底图像数据集中所有数据点进行划分,首先将眼底图像中每个像素的x、y坐标以及像素值作为一个三元对表示为一个三维空间中的数据点,接下来按照如下规则将这些数据点划分为下列三大类:1)核心点:对于某一数据点的Eps邻域(在三维空间下为以点为中心eps为半径的球形邻域)内含有超过MinPts数目的点。2)边缘点:不满足核心点要求,但是落在某核心点Eps邻域内的点。3)噪声点:既不是核心点也不是边缘点的点。有了上述概念,利用传统的DBSCAN算法进行眼底血管提取的流程可以描述为:①输入眼底图像②对图像进行均值滤波、对比度增强等预处理③将全部像素点按照从左到右、由上至下的顺序整理成三维数据点④顺序处理每个三元数据点,找到一个未处理的点P⑤计算点P的Eps邻域内是否包含大于MinPts个的数据点,若不满足该要求则转⑨,若满足该要求,则转⑥⑥将P标记为核心点,建立一个新簇C,转⑦。⑦将与点P连通(包含在Eps邻域内的数据点)的所有核心点与边缘点都加入到C中,转⑨。⑧标记P为噪声点,转⑨。⑨若数据集中还有未标记的数据点,则转④,否则转⑩。⑩聚类结束,输出结果。按照该流程操作就完成了基于DBSCAN的眼底血管提取,整个算法的流程图如图1所示。本专利技术根据眼底图像数据集特殊的空间特点,借鉴了数字图像处理中区域增长法的相关原理对传统DBSCAN方法进行一定的改进,区域增长法首先以眼底图像中某一点为中心,不断的归并每个中心像素点8-邻域(与该像素点相邻的8个像素点称为8-邻域)内与该点足够相似的像素点,以此来实现区域增长的效果。按照这个思想将传统DBSCAN方法中对于眼底图像中三类像素点的判定条件修改为如下:1)核心点:在眼底图像中的某个像素点8-邻域内与该像素点距离小于Eps点的数目大于最少个数MinPts的像素点。2)不满足核心点要求,但落在核心点8邻域内即属于边缘点的点。3)既不是核心点也不是边缘点的点。按照修改后的判定条件,基于区域增长法的DBSCAN眼底血管提取方法流程可以描述为:S1输入眼底图像;S2对输入眼底图像进行均值滤波、对比度增强等预处理;S3对预处理后的眼底图像按照从左到右、由上至下的顺序找到一个未处理的点P;S4计算点P的8邻域内是否包含大于MinPts个像素点与该点P像素值差小于Eps,若不满足该要求则转S8,若满足该要求,则转S5;S5将点P标记为核心点,建立一个新簇C,转S6。S6将与点P连通(包含在Eps邻域内的数据点)的所有核心点与边缘点都加入到新簇C中,转S8。S7标记点P为噪声点,转S8。S8若输入眼底图像所采集像素点的数据集中还有未标记的数据点,则转S3,否则转S9。S9本文档来自技高网
...

【技术保护点】
1.基于区域增长法的DBSCAN密度聚类方法,其特征在于:该方法包括如下步骤,/nS1输入眼底图像;/nS2对输入眼底图像进行均值滤波、对比度增强等预处理;/nS3对预处理后的眼底图像按照从左到右、由上至下的顺序找到一个未处理的点P;/nS4计算点P的8邻域内是否包含大于MinPts个像素点与该点P像素值差小于Eps,若不满足该要求则转S8,若满足该要求,则转S5;/nS5将点P标记为核心点,建立一个新簇C,转S6;/nS6将与点P连通包含在Eps邻域内的数据点的所有核心点与边缘点都加入到新簇C中,转S8;/nS7标记点P为噪声点,转S8;/nS8若输入眼底图像所采集像素点的数据集中还有未标记的数据点,则转S3,否则转S9;/nS9聚类结束,输出结果;/n按照该流程操作就完成了基于区域增长法的DBSCAN眼底血管提取方法。/n

【技术特征摘要】
1.基于区域增长法的DBSCAN密度聚类方法,其特征在于:该方法包括如下步骤,
S1输入眼底图像;
S2对输入眼底图像进行均值滤波、对比度增强等预处理;
S3对预处理后的眼底图像按照从左到右、由上至下的顺序找到一个未处理的点P;
S4计算点P的8邻域内是否包含大于MinPts个像素点与该点P像素值差小于Eps,若不满足该要求则转S8,若满足该要求,则转S5;
S5将点P标记为核心点,建立一个新簇C,转S6;
S6将与点P连通包含在Eps邻域内的数据点的所有核心点与边缘点都加入到新簇C中,转S8;
S7标记点P为噪声点,转S8;

【专利技术属性】
技术研发人员:孙燕北竹翠
申请(专利权)人:北京工业大学
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1