当前位置: 首页 > 专利查询>福州大学专利>正文

一种基于高斯核参数选择的SVM乳腺分类方法技术

技术编号:14082387 阅读:200 留言:0更新日期:2016-11-30 19:44
本发明专利技术涉及一种基于高斯核参数选择的SVM乳腺分类方法,首先从已知病例中提取乳腺钼靶与B超图像特征,将完成特征提取的各病例数据按照已知临床诊断结果进行良恶性与临床分期标注;接着对同一患者乳腺的钼靶图像特征与B超图像特征采用级联方式进行多特征融合,得到乳腺样本的特征向量;接着将高斯核参数选择方法用于基于高斯核的二叉平衡决策树SVM多分类算法的训练过程与识别过程。本发明专利技术能够提高乳腺癌诊断的准确率和效率。

【技术实现步骤摘要】

本专利技术涉及医学图像处理
,特别是一种基于高斯核参数选择的SVM乳腺分类方法
技术介绍
乳腺癌是发生在妇女群体中最普遍的恶性肿瘤之一。近年来我国调查研究显示,乳腺癌的发生比率在逐年递增。因此提高乳腺癌的早期诊断精度变得越来越有意义。目前,乳腺癌诊断采用的主要方法是通过乳腺钼靶、B超图像等影像检查,诊断者通过钙化或肿块等影像特征来对病情进行分析。但由于乳腺组织中的腺体、血管、脂肪等软组织的密度与病灶区的密度都很接近,加上诊断者视觉疲劳等因素,使得早期乳腺癌的误诊和漏诊仍时常发生。随着医学影像技术和计算机技术的不断发展,利用计算机进行辅助诊断成为可能;比如:利用数字图像处理技术,分别提取乳腺B超、钼靶图像中病理相关的的特征,运用SVM等机器学习方法根据这些特征对乳腺肿块良恶性进行分类识别等。同一患者的乳腺钼靶与B超影像数据各自存在不足,两者间或有数据冲突,为提供更加全面有效的诊断结果,可对同一患者的乳腺钼靶与超声影像资料进行联合数据分析处理,通过乳腺钼靶与超声影像资料相互间的数据融合与互补,强化佐证,发现肉眼无法辨别的微小病灶,并提高乳腺癌诊断的准确率,减少误诊率、漏诊率。此外,基于高斯核的二叉平衡决策树SVM多分类算法适合处理数据特征丰富的数据,如乳腺图像数据。本质上,该算法是由多个二分支持向量机分类器组合构成的,每个二分支持向量机分类器对应着二叉平衡决策树的一个决策面,不同决策面对应的数据特征差异性较大,各个决策面训练时需要一个适合于该决策面的高斯核参数。因此,快速有效的高斯核参数选择算法对于二叉平衡决策树支持向量机多分类算法有着举足轻重的影响。因此,本专利技术基于上述方法,对提取的乳腺钼靶与B超影像数据特征进行融合后,构建基于二叉平衡树的SVM多分类模型,将高斯核参数选择算法用于基于高斯核的二叉平衡决策树SVM多分类算法的训练过程,从而为临床诊断提供有价值的“参考意见”,提高乳腺癌诊断的准确率和效率。
技术实现思路
有鉴于此,本专利技术的目的是提出一种基于高斯核参数选择的SVM乳腺分类方法,能够提高乳腺癌诊断的准确率和效率。本专利技术采用以下方案实现:一种基于高斯核参数选择的SVM乳腺分类方法,具体包括以下步骤:步骤S1:从已知病例中提取乳腺钼靶与B超影像数据特征;将完成特征提取的各病例数据按照已知临床诊断结果进行良恶性与临床分期标注;所述标注分为五类:良性、恶性I级、恶性II级、恶性III级、恶性IV级;步骤S2:对同一患者乳腺的钼靶图像特征与B超图像特征通过串联进行多特征融合,得到乳腺样本的特征向量;步骤S3:选取基于高斯核的二叉平衡决策树SVM作为乳腺多分类模型,针对二叉平衡决策树的各个决策面,求解合适的高斯核参数,通过二分SVM进行训练;即随机选取标注数据的80%用于基于高斯核参数选择的二叉平衡决策树SVM多分类算法的训练过程:步骤S4:用基于高斯核的二叉平衡决策树SVM进行识别;即剩余标注数据的20%用于基于高斯核参数选择的二叉平衡决策树SVM多分类算法的识别过程。进一步地,所述步骤S1具体包括以下步骤:步骤S11:给定一个中等规模以上的乳腺B超病灶区域、乳腺钼靶病灶区域图像集;所述中等规模以上表示该图像集至少含有250幅以上的乳腺B超诊断图像和乳腺钼靶诊断图像;步骤S12:将所述乳腺B超病灶区域、乳腺钼靶病灶区域图像集分为训练集和验证集;从乳腺钼靶病灶区域图像提取基于GLCM和基于灰度直方图的特征;从B超病灶区域图像提取基于GLCM、基于小波、基于小波包、基于MPEG-7的特征;将训练集的各病例数据按照已知临床诊断结果进行良恶性与临床分期标注。进一步地,所述步骤S3具体包括以下步骤:步骤S31:建立一棵二叉平衡决策树SVM:构建基于高斯核的乳腺数据二叉平衡决策树SVM,从根节点开始,先将类别均分成两部分,每个部分为中间结点或为叶子结点,再递归分解中间结点直至为叶子结点;步骤S32:针对步骤S31中所述的二叉平衡决策树SVM的各个决策面,采用高斯核参数选择方法设置合适的高斯核参数;步骤S33:通过二分SVM进行训练。进一步地,所述步骤S31具体包括以下步骤:步骤S311:分别计算步骤S1中已标注的5个类的类中心;步骤S312:找出5个类中的两个类:将恶性IV级记为c1,良性记为c2,这两个类的类中心拥有最大欧氏距离;步骤S313:将步骤S312中的这两个类分别标记为C1类簇与C2类簇;步骤S314:在剩余的3个类当中,选择与C1类簇有最小的欧氏距离的类与所述C1类簇合并成一个类,并标记为C1类簇,重新计算C1类簇的类中心;步骤S315:在剩余的2个类当中,选择与C2类簇有最小的欧氏距离的类与所述C2类簇合并成一个类,并标记为C2类簇,重新计算C2类簇的类中心;步骤S316:循环计算S314至S315,直至5个类分配结束。进一步地,所述步骤S32具体包括以下步骤:步骤S321:选择合适的P值;步骤S322:设max=P,min=0;步骤S323:若max-min≥ξ,则进入步骤S324;否则返回步骤S321;步骤S324:计算: G ( P ) = 1 2 Σ i , j a i * a j * y i y j E x p ( - P | | x i - x j | | 2 ) · | | x i - x j | | 2 ; ]]>式中,其中yi为第i个训练样本的类别,yi∈{-1,+1本文档来自技高网
...
一种基于高斯核参数选择的SVM乳腺分类方法

【技术保护点】
一种基于高斯核参数选择的SVM乳腺分类方法,其特征在于:包括以下步骤:步骤S1:从已知病例中提取乳腺钼靶与B超影像数据特征;将完成特征提取的各病例数据按照已知临床诊断结果进行良恶性与临床分期标注;所述标注分为五类:良性、恶性I级、恶性II级、恶性III级、恶性IV级;步骤S2:对同一患者乳腺的钼靶图像特征与B超图像特征通过串联进行多特征融合,得到乳腺样本的特征向量;步骤S3:选取基于高斯核的二叉平衡决策树SVM作为乳腺多分类模型,针对二叉平衡决策树的各个决策面,求解合适的高斯核参数,通过二分SVM进行训练;步骤S4:用基于高斯核的二叉平衡决策树SVM进行识别。

【技术特征摘要】
1.一种基于高斯核参数选择的SVM乳腺分类方法,其特征在于:包括以下步骤:步骤S1:从已知病例中提取乳腺钼靶与B超影像数据特征;将完成特征提取的各病例数据按照已知临床诊断结果进行良恶性与临床分期标注;所述标注分为五类:良性、恶性I级、恶性II级、恶性III级、恶性IV级;步骤S2:对同一患者乳腺的钼靶图像特征与B超图像特征通过串联进行多特征融合,得到乳腺样本的特征向量;步骤S3:选取基于高斯核的二叉平衡决策树SVM作为乳腺多分类模型,针对二叉平衡决策树的各个决策面,求解合适的高斯核参数,通过二分SVM进行训练;步骤S4:用基于高斯核的二叉平衡决策树SVM进行识别。2.根据权利要求1所述的一种基于高斯核参数选择的SVM乳腺分类方法,其特征在于:所述步骤S1具体包括以下步骤:步骤S11:给定一个中等规模以上的乳腺B超病灶区域、乳腺钼靶病灶区域图像集;所述中等规模以上表示该图像集至少含有250幅以上的乳腺B超诊断图像和乳腺钼靶诊断图像;步骤S12:将所述乳腺B超病灶区域、乳腺钼靶病灶区域图像集分为训练集和验证集;从乳腺钼靶病灶区域图像提取基于GLCM和基于灰度直方图的特征;从B超病灶区域图像提取基于GLCM、基于小波、基于小波包、基于MPEG-7的特征;将训练集的各病例数据按照已知临床诊断结果进行良恶性与临床分期标注。3.根据权利要求1所述的一种基于高斯核参数选择的SVM乳腺分类方法,其特征在于:所述步骤S3具体包括以下步骤:步骤S31:建立一棵二叉平衡决策树SVM:构建基于高斯核的乳腺数据二叉平衡决策树SVM,从根节点开始,先将类别均分成两部分,每个部分为中间结点或为叶子结点,再递归分解中间结点直至为叶子结点;步骤S32:针对步骤S31中所述的二叉平衡决策树SVM的各个决策面,采用高斯核参数选择方法设置合适的高斯核参数;步骤S33:通过二分SVM进行训练。4.根据根据权利要求3所述的一种基于高斯核参数选择的SVM乳腺分类方法,其特征在于:所述步骤S31具体包括以下步骤:步骤S311:分别计算步骤S1中已标注的5个类的类中心;步骤S312:找出5个类中的两个类:将恶性IV级记为c1,良性记为c2,这两个类的类中...

【专利技术属性】
技术研发人员:王秀余春艳林志杰陈壮威叶东毅
申请(专利权)人:福州大学
类型:发明
国别省市:福建;35

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1