一种基于BFBA和ELM的乳腺X射线图像特征选择方法技术

技术编号:15640484 阅读:70 留言:0更新日期:2017-06-16 06:13
本发明专利技术一种基于BFBA和ELM的乳腺X射线图像特征选择方法,涉及图像处理技术领域,所要解决的技术问题为避免了动态规划法遇到的“指数爆炸”问题,以及解析法或蝙蝠算法容易陷入局部最优解的问题;采用的技术方案为:包括以下步骤:第一步,收集所用数据集MIAS;第二步,设置BFBA参数;第三步,蝙蝠种群初始化;第四步、根据每个蝙蝠位置编码生成相应的特征子集;第五步、更新每一个蝙蝠的搜索脉冲频率、速度和位置;第六、七步、生成均匀分布随机数rand;第八步、对所有蝙蝠的适应度值进行排序,找出当前的最优解和最优值;第九步、判断最优解是否发生了变化;第十步、判断stagnant_count是否等于stagnant_max;第十一步、重复第四步到第十步;第十二步、输出全局最优值和最优解。

【技术实现步骤摘要】
一种基于BFBA和ELM的乳腺X射线图像特征选择方法
本专利技术涉及图像处理
,尤其是涉及一种基于鸟类群体响应的蝙蝠算法(BirdFlockBatAlgorithm,BFBA)和极限学习机(ExtremeLearningMachine,ELM)的乳腺X射线图像特征选择方法。
技术介绍
乳腺疾病是女性常见的疾病之一,同时乳腺癌的多发性和危害性严重影响着女性的健康甚至生命,因此,乳腺疾病的早期诊断直接关系着女性的人身健康。尤其对于乳腺癌,现在人们还不能完全确定其病发机理。目前乳腺癌的临床诊断方法主要包括触摸式诊断、组织学诊断、细胞学诊断和影像学诊断。影像学以其诊断的方便性、科学性和相对较高的可操作性被广泛采用。乳腺X射线摄影技术是最常见的乳腺癌早期诊断技术,对于这种方法,需要从乳腺X射线图像中分析乳腺的患病情况。随着计算机技术的快速发展,对乳腺X射线图像的分析也实现了从传统人工分析到计算机辅助分析的转换,这种转换可以使乳腺癌的诊断更快速、更准确。特征是决定相似性与分类的关键。由于用计算机识别乳腺癌,故从乳腺X射线图像上提取了大量的原始特征以期提高识别率。但从提取方法上看,许多特征不是独立的,即这些特征具有冗余度,影响模式识别的速度和准确性,所以,需要对原始特征进行选择,丢掉那些模棱两可、不易判别或相关性强的特征。特征选择实质是一个组合优化问题。常规的优化算法,如解析法,只能得到局部最优而非全局最优解,且要求目标函数连续及可微;枚举法虽然克服了这些缺点,但计算效率太低。即使很著名的动态规划法,也会遇到“指数爆炸”问题,它对于中等规模和适度复杂性的问题,也常常无能为力。基于遗传算法、粒子群算法的乳腺X射线图像特征选择方法,获得了不错的分类结果。蝙蝠算法(BatAlgorithm,BA)是一种新兴的启发式群体智能算法,相比较于粒子群算法和遗传算法,BA可以实现动态控制局部搜索和全局搜索间的相互转换过程,具有发挥更大作用的潜能。然而,在BA搜索过程中,存在过早收敛的现象,由于BA个体多样性的迅速减少,为了得到局部最优的一个更准确的估计,需要更多无效的迭代。在这种情形下,很难达到勘探和开采之间的良好平衡,这使得BA容易停滞在局部最优。
技术实现思路
本专利技术克服现有技术存在的不足,所要解决的技术问题为提供一种乳腺X射线图像特征选择方法,避免了动态规划法遇到的“指数爆炸”问题,以及解析法或蝙蝠算法容易陷入局部最优解的问题。为了解决上述技术问题,本专利技术采用的技术方案为:一种基于BFBA和ELM的乳腺X射线图像特征选择方法,包括以下步骤:第一步,收集所用数据集MIAS,即theMammographicImageAnalysisSociety,提取乳腺X光图像特征,并将数据集划分为训练集和测试集,训练集用于训练极限学习机ELM,即ExtremeLearningMachine,以设计ELM分类器,测试集用于检验ELM分类器的有效性;所述提取乳腺X光图像特征采用的方法是灰度共生矩阵,提取四种统计参数:角二阶矩、熵、惯性矩、相关系数,灰度共生矩阵的方向取0°,45°,90°,135°四个方向;首先计算四个方向上的灰度共生矩阵,取像素间距离为1,其次由每个灰度共生矩阵计算四个统计参数;把每幅图像分成四块,对每块子图像提取上述16个特征作为原始样本数据,共获得64个统计特征;特征提取所得的样本数据库分成10份,选择其中90%做训练,其余10%做测试;第二步,设置BFBA参数;初始参数包括蝙蝠群体大小20≤N≤100,每个蝙蝠个体的维数D=64,脉冲音量A=0.5,脉冲率R=0.5,搜索脉冲频率范围[Qmin,Qmax],其中Qmin=0,Qmax=2,最大迭代次数iter_max=1000,停滞计数器stagnant_count=0,最大停滞次数stagnant_max=4;第三步,蝙蝠种群初始化,蝙蝠位置向量由第一步给出的64个统计特征组成,使用二进制编码标记特征组合并随机初始化蝙蝠个体位置及速度,形成样本集;蝙蝠位置编码采用二进制,原始特征有64个,即个体的长度L=64,个体的每一个基因对应相应次序的特征,即当个体中的某一个基因为“1”时,表示该基因对应的特征项被选用;反之,为“0”时,表示该特征项未被选用。使用X={x1,x2,x3……xi……xN}表示蝙蝠群体的位置,使用V={v1,v2,v3……vi……vN}表示速度,其中xi表示第i个蝙蝠个体的位置,vi表示第i个蝙蝠个体的速度,xi和vi是64维的行向量,一共有N个蝙蝠个体,20≤N≤100。基因值随机产生的公式为:式中,rand()为[0,1]区间独立同分布的随机数;第四步、根据每个蝙蝠位置编码生成相应的特征子集,使用该特征子集生成训练集和测试集,训练集用于设计ELM分类器,测试集用于测试分类器,根据测试结果计算相应蝙蝠的适应度值fiti;适应度值的计算过程如下:其中,式中,ωA式表示分类准确权值,ωF表示特征选择数权值,fj表示基因的特征值:0或1,acci表示分类准确率,cc表示正确分类数,uc表示不正确分类数;第五步、更新每一个蝙蝠的搜索脉冲频率、速度和位置;搜索脉冲频率、速度和位置通过以下公式进行更新:Qi=Qmin+(Qmax-Qmin)×β(11)vi(t)=vi(t-1)+(xi(t)-xbest)×Qi(12)xi(t)=xi(t-1)+vi(t)(13)式中:β属于[0,1],是均匀分布的随机数;Qi是蝙蝠i的搜索脉冲频率,Qi属于[Qmin,Qmax];vi(t)、vi(t-1)分别表示蝙蝠i在t和t-1时刻的速度;xi(t)、xi(t-1)分别表示蝙蝠i在t和t-1时刻的位置;xbest表示当前所有蝙蝠的最优解;第六步、生成均匀分布随机数rand,如果rand>R,R为第二步中所述的脉冲率,则对当前最优解进行随机扰动,产生一个新的解:xnew=xbest+0.001×randn(1,64);(14)其中,xnew表示新产生的新解,xbest表示当时最优解。第七步、生成均匀分布随机数rand,如果rand符合rand<A且fit(xi(t))<fit(xi(t-1)),A为第二步中所述的脉冲音量,则接受步骤六产生的新解:xi(t)=xnew(15)其中,fit(xi(t))表示求个体xi的适应度值,xnew表示第六步产生的新解;如果rand不符合上述条件,则跳过此步,进入下一步;第八步、对所有蝙蝠的适应度值进行排序,找出当前的最优解和最优值;第九步、判断最优解是否发生了变化,如果没有发生变化,则stagnant_count=stagnant_count+1,否则,stagnant_count=0其中stagnant_count为第二步中所述的停滞计数器;第十步、判断stagnant_count是否等于stagnant_max,如果相等,则所有的蝙蝠发生群体响应;即如果经过一定次数的迭代,最佳全局适应值不再发生变化,则发生鸟类群体响应的重新定位,使用公式(16)和(17)来重新更新每个蝙蝠的速度和位置,在公式(16)中,是蝙蝠经过群体响应重新定位之后的新位置,新位置通过计算它的七个最近邻近对象的位置平均值获得,的最近邻近蝙本文档来自技高网
...
一种基于BFBA和ELM的乳腺X射线图像特征选择方法

【技术保护点】
一种基于BFBA和ELM的乳腺X射线图像特征选择方法,其特征在于,包括以下步骤:第一步,收集所用数据集MIAS,即the Mammographic Image Analysis Society,提取乳腺X光图像特征,并将数据集划分为训练集和测试集,训练集用于训练极限学习机ELM,即Extreme Learning Machine,以设计ELM分类器,测试集用于检验ELM分类器的有效性;所述提取乳腺X光图像特征采用的方法是灰度共生矩阵,提取四种统计参数:角二阶矩、熵、惯性矩、相关系数,灰度共生矩阵的方向取0°,45°,90°,135°四个方向;首先计算四个方向上的灰度共生矩阵,取像素间距离为1,其次由每个灰度共生矩阵计算四个统计参数;把每幅图像分成四块,对每块子图像提取上述16个特征作为原始样本数据,共获得64个统计特征;特征提取所得的样本数据库分成10份,选择其中90%做训练,其余10%做测试;第二步,设置BFBA参数;初始参数包括蝙蝠群体大小20≤N≤100,每个蝙蝠个体的维数D=64,脉冲音量A=0.5,脉冲率R=0.5,搜索脉冲频率范围[Q

【技术特征摘要】
1.一种基于BFBA和ELM的乳腺X射线图像特征选择方法,其特征在于,包括以下步骤:第一步,收集所用数据集MIAS,即theMammographicImageAnalysisSociety,提取乳腺X光图像特征,并将数据集划分为训练集和测试集,训练集用于训练极限学习机ELM,即ExtremeLearningMachine,以设计ELM分类器,测试集用于检验ELM分类器的有效性;所述提取乳腺X光图像特征采用的方法是灰度共生矩阵,提取四种统计参数:角二阶矩、熵、惯性矩、相关系数,灰度共生矩阵的方向取0°,45°,90°,135°四个方向;首先计算四个方向上的灰度共生矩阵,取像素间距离为1,其次由每个灰度共生矩阵计算四个统计参数;把每幅图像分成四块,对每块子图像提取上述16个特征作为原始样本数据,共获得64个统计特征;特征提取所得的样本数据库分成10份,选择其中90%做训练,其余10%做测试;第二步,设置BFBA参数;初始参数包括蝙蝠群体大小20≤N≤100,每个蝙蝠个体的维数D=64,脉冲音量A=0.5,脉冲率R=0.5,搜索脉冲频率范围[Qmin,Qmax],其中Qmin=0,Qmax=2,最大迭代次数iter_max=1000,停滞计数器stagnant_count=0,最大停滞次数stagnant_max=4;第三步,蝙蝠种群初始化,蝙蝠位置向量由第一步给出的64个统计特征组成,使用二进制编码标记特征组合并随机初始化蝙蝠个体位置及速度,形成样本集;蝙蝠位置编码采用二进制,原始特征有64个,即个体的长度L=64,个体的每一个基因对应相应次序的特征,即当个体中的某一个基因为“1”时,表示该基因对应的特征项被选用;反之,为“0”时,表示该特征项未被选用。使用X={x1,x2,x3……xi……xN}表示蝙蝠群体的位置,使用V={v1,v2,v3……vi……vN}表示速度,其中xi表示第i个蝙蝠个体的位置,vi表示第i个蝙蝠个体的速度,xi和vi是64维的行向量,一共有N个蝙蝠个体,20≤N≤100。基因值随机产生的公式为:式中,rand()为[0,1]区间独立同分布的随机数;第四步、根据每个蝙蝠位置编码生成相应的特征子集,使用该特征子集生成训练集和测试集,训练集用于设计ELM分类器,测试集用于测试分类器,根据测试结果计算相应蝙蝠的适应度值fiti;适应度值的计算过程如下:其中,式中,ωA式表示分类准确权值,ωF表示特征选择数权值,fj表示基因的特征值:0或1,acci表...

【专利技术属性】
技术研发人员:韩晓红相洁
申请(专利权)人:太原理工大学
类型:发明
国别省市:山西,14

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1