基于信息融合安全半监督聚类的肺结节图像分类方法技术

技术编号:25482433 阅读:53 留言:0更新日期:2020-09-01 23:02
本发明专利技术公开一种基于信息融合安全半监督聚类的肺结节图像分类方法,首先,输入标记与未标记肺结节图像,并进行图像预处理及特征提取。然后,建立标记样本的风险度评估模型。利用集成学习的思想构建并选择多个基聚类方法,通过D‑S证据理论方法融合各基聚类方法对标记样本的划分结果,依据融合结果得到标记样本风险度。接着,构建基于图正则化的优化模型。最后,采用迭代寻优策略求解优化模型,得到聚类结果。本发明专利技术解决了标记样本的安全使用问题,提高了对肺结节分类的准确性和鲁棒性。

【技术实现步骤摘要】
基于信息融合安全半监督聚类的肺结节图像分类方法
本专利技术涉及一种对标记样本鲁棒的半监督聚类方法,尤其指一种基于DS证据理论融合加权的鲁棒半监督聚类算法,属于医学图像的数据挖掘领域。
技术介绍
世界卫生组织在2018年全球最新癌症报告中显示:肺癌在全球的发病率(210万新增患者,占各类癌症发病率的11.6%)和死亡率(180万人死亡,占各类癌症死亡率的18.4%)均为最高。肺癌在早期的表现几乎没有任何症状,导致患者被发现时大部分已经是晚期,因此,及早的发现肺癌提高生存率就显得十分重要。肺癌在早期一般以结节的形式存在,即时地发现肺结节能极大提高肺癌患者的治愈几率。对于医生而言,由于主观性及其他因素的影响,从大量的CT图像中甄选出肺结节极易造成误诊和漏诊,所以借助计算机辅助诊断(CAD)就显得极为重要。半监督学习是近年来研究的热点,半监督FCM算法作为半监督聚类算法中经典算法之一,凭借其较低的复杂度,以及在实际问题中获得比较好的应用效果,而受到广大学者的青睐。肺结节的良恶性分类对于肺癌的早期发现以及诊断具有十分重要的意义。在实际应用中,标记本文档来自技高网...

【技术保护点】
1.基于信息融合安全半监督聚类的肺结节图像分类方法,其特征在于,该方法包含以下步骤:/n步骤一:输入标记和未标记肺结节图像;/n输入数据集的标记样本子集:X

【技术特征摘要】
1.基于信息融合安全半监督聚类的肺结节图像分类方法,其特征在于,该方法包含以下步骤:
步骤一:输入标记和未标记肺结节图像;
输入数据集的标记样本子集:Xl=[x1...xl],对应的标签为yk∈{1,...,c},未标记样本子集:Xu=[xl+1...xn];
步骤二:肺结节图像预处理与特征提取;
步骤三:构造基聚类算法,对数据集进行预聚类;
采用同态聚类集成方法;将模糊C均值作为唯一聚类器,基于不同的模糊度和不同的核形成多个基聚类,聚类结果记作Π={Π1,Π2,...,ΠW′},其中Πw表示聚类集合Π中的第w个聚类成员;每一个基聚类的聚类结果都包含着样本的聚类信息,标记样本的聚类信息即为其隶属度;
步骤四:根据预聚类结果,采用内部有效性指标估计基聚类算法可信度,并选取W个基聚类作为信息融合的证据;
步骤五:利用基于D-S证据理论的模糊聚类集成方法计算得到标记样本的证据融合划分矩阵;
DS证据理论包括识别框架、基本置信度指派函数和证据合成三部分;
假设数据集标签yk∈{1,...,c},则标记样本识别框架为{类别1,...,类别c};对于标记样本xk,其基本置信度指派函数值是基聚类算法对数据集聚类的样本隶属度,通过D-S证据理论融合各基聚类的样本隶属度,得到标记样本的证据融合划分矩阵其中证据融合隶属度;
步骤六:依据融合结果,计算标记样本的风险度,并利用正弦函数将风险度转换为安全度;
在衡量先验信息风险性的过程中,不考虑证据融合划分矩阵的第(c+1)个行向量;记标记样本风险度为P=[pk]l;F=[fik]c×l表示标记样本的模糊度,当样本xk为标记样本且属于第i类时fik=1,否则等于0;
拟定将fik为1时与证据融合隶属度的差值作为标记样本xk的第一风险度值其计算公式如下:
当fik=1时,



为了进一步拉开标记样本之间的风险度,定义了第二风险度值依据隶属度最大原则,对证据融合划分矩阵去模糊化,若其结果与标记样本给定标签一致,则代表该样本是相对安全的,反之,则不安全;对于相对安全的标记样本,其第二风险度值为证据融合隶属度值与次最大隶属度值的差值;对于不安全的标记样本,其第二风险度值为最大隶属度值与的差值;其计算公式如下:<...

【专利技术属性】
技术研发人员:郭丽甘海涛夏思雨庄栋
申请(专利权)人:杭州电子科技大学
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1