当前位置: 首页 > 专利查询>浙江大学专利>正文

基于随机森林算法的肝脏平扫CT图像病变识别方法技术

技术编号:13675297 阅读:46 留言:0更新日期:2016-09-08 00:57
本发明专利技术公开了一种基于随机森林算法的肝脏平扫CT图像病变识别方法,包括以下内容:提取肝脏平扫CT图像病变区域的图像灰度纹理特征作为图像特征向量表示,然后采用随机森林算法对肝脏CT图像病变区域图像特征向量进行特征选择,选择出最有效的特征组合,然后对最有效特征数据集进行训练和学习,并对随机森林的决策树进行识别能力均衡优化,得到最终的病变识别模型。

【技术实现步骤摘要】

本专利技术涉及一种基于随机森林算法的肝脏平扫CT图像病变识别方法,特别涉及了最有效特征选择方法的引入和随机森林算法的改进。
技术介绍
随着医学成像技术的发展和成熟,医学影像在肝脏疾病诊断中的起到了重要的作用。目前,肝癌已经成为世界上致死率最高的疾病之一,因为治疗手段的缺乏以及早期肝癌病理指标不太明显,可能会造成误诊,从而错过了最佳的治疗时间。肝癌的确诊主要依赖肝脏穿刺活检技术,但该技术对患者肝脏会造成一定的损伤,加之实施难度比高、术后恢复慢,因此,目前对于肝脏疾病的诊断主要还是依赖于医学影像,如肝脏CT。
技术实现思路
本专利技术要解决的技术问题是提供一种基于随机森林算法的肝脏平扫CT图像病变识别方法。为了解决上述技术问题,本专利技术提供如下技术方案:本专利技术要实现的是肝脏平扫CT图像局部病变识别方法,具体为提取肝脏平扫CT图像病变区域的图像灰度纹理特征作为图像特征向量表示,然后采用随机森林算法对肝脏CT图像病变区域图像特征向量进行特征选择,选择出最有效的特征组合,然后对最有效特征数据集进行训练和学习,并对随机森林的决策树进行识别能力均衡优化,得到最终的病变识别模型。病变识别模型建立的框图如附图1所示,具体分为如下步骤:1)肝脏CT图像病变区域特征数据集建立对于图像灰度纹理特征,在图像处理领域有灰度直方图、灰度共生矩阵和灰度梯度共生矩阵三种特征表示方法。从医生标注的肝脏平扫CT图像中提取出医生标注的病变区域,以能覆盖病变区域的矩形框作为病变特征提取区域,对病变特征提取区域提取基于灰度直方图、灰度共生矩阵和灰度梯度共生矩阵的图像特征。a.灰度直方图特征提取灰度直方图用于表示图像的灰度分布和统计特性,基于灰度直方图的图像特征包含均值、方差、歪斜度、峰态,能量,熵等。b.灰度共生矩阵特征提取灰度共生矩阵用于描述灰度图像中相邻像素的灰度关系,基于灰度共生矩阵的图像特征包含角二阶矩、对比度、逆差矩、熵、相关等。c.灰度梯度共生矩阵特征提取灰度梯度共生矩阵刻画了图像像素点灰度值和梯度值的相互关系,描绘了图像内部像素点灰度和梯度的分布情况,而且也体现了个像素点与其邻域内像素点的空间局部信息,能很好的表达图像的纹理特征,基于灰度梯度共生矩阵的图像特征包含小梯度优势、大梯度优势、灰度分布的不均匀性、梯度分布的不均匀性、能量、灰度平均、梯度平均、灰度均方差、梯度均方差、相关度、灰度熵、梯度熵、混合熵、惯性、逆差矩等。组合上述三种类型的图像特征,并结合图像的病变类型标签作为特征向量数据集D。2)选择最有效特征在步骤1)中提取的这三类特征中,共包含26个特征值,这26个特征值并不是所有特征都能体现肝脏平扫CT图像局部病变特征的特异性,所以在选择特征时,可能因为选择了不好的特征导致得到的识别模型识别效果较差,所以有效特征的选择对于建立好的识别模型至关重要,而且可以减少算法的计算量。本专利技术采用的随机森林算法可以给出特征向量中每个特征的重要性程度,通过循环迭代剔除最不重要特征,并对剔除特征后的剩余特征建立新的随机森林模型,找出泛化误差最低的模型对应的特征组合,即为最有效的特征组合,详细迭代过程见具体实施方案。3)随机森林病变识别模型的建立和改进针对2)步骤得到的最有效特征属性组合,从原始特征数据集中筛选出最有效特征数据集。用最有效特征数据集建立随机森林模型,并对随机森林模型中的决策树进行优化和均衡,得到最终的随机森林病变识别模型。具体优化方法见具体实施方案。在生成的随机森林模型中,包含多棵决策树,在这些决策树中,有些决策树模型识别效果较好,有些决策树模型识别效果较差,因此可以剔除那些识别效果较差的决策树,但本专利技术考虑到在筛选性能较高的决策树时,由于不同种类肝脏局部病变的分类识别精度不同,在筛选决策树时,不从整体OOB估计出发,而是从单类样本识别效果的OOB估计出发,对每种类型病灶特征,选择同等数量的对单类分类性能最高的决策树,用这些决策树组成新的随机森林。以生成40棵决策树的随机森林为例,在40棵决策树中,有10棵是对正常类型肝脏特征识别OOB估计最优的决策树,有10棵是对肝血管瘤类型病变特征识别OOB估计最优的决策树,有10棵是对肝囊肿类型病变特征识别OOB估计最优的决策树,有10棵是对肝癌类型病变特征识别OOB估计最优的决策树,经过决策树选择优化和均衡以后,可以避免全局筛选决策树造成某种类型病变特征识别精度偏低的缺陷。本专利技术实现的是对肝脏平扫CT图像局部病变的自动识别,主要研究肝癌、肝血管瘤、肝囊肿等几种病变类型,病变区域与正常区域的图像差异体现在灰度变化和纹理变化上,目前图像灰度纹理特征常用的是基于灰度直方图、灰度共生矩阵和灰度梯度共生矩阵的图像特征,通过提取疑似病变感兴趣区域作为图像的特征表示,在此基础上,根据特征提取算法得到数值化特征数据,然后采用改进的随机森林分类算法对图像特征进行训练、学习和预测,识别结果能给予医生一些诊断建议,虽然辅助诊断结果不能作为诊断标准,但可以与医生个人经验结合得到更科学的诊断,从而减少诊断的错误率,这对于肝癌的早期诊断具有巨大的医学价值。本专利技术采用的随机森林算法是一种集成学习方法,与贝叶斯、神经网络、决策树、支持向量机等单分类器机器学习算法相比,不容易出现过拟合问题,单分类器模型的学习能力局限于整体数据样本,虽然能很好地学习到整个数据样本的数据特征,但不能保证较强的泛化能力,即对未知的数据样本缺乏很好的预测能力。相比之下,随机森林算法可解决这个问题,通过集成多个弱分类器,克服了单一分类器学习能力的缺陷,使用bagging技术使得每一个单决策树分类器拥有部分特征较强的学习能力,即每个单分类器具有局部特征的强学习能力,而不是整体特征的学习能力,每个单分类器负责学习部分特征,组合了多个单分类器的随机森林算法便具有更强的学习能力,因此单分类器算法可以比作一个综合能力较强的学习机器,而随机森林相当于多个专家组成的联合学习机器,在数据样本有限的情况下,随机森林算法具有明显优势,故本专利技术采用随机森林算法作为病变识别的分类学习器。本专利技术的创新点在于最有效特征选择方法的引入、决策树选择优化和决策树识别能力均衡等改进方法,改进的方法对于肝脏平扫CT图像局部病变的识别具有更好的识别准确率。附图说明下面结合附图对本专利技术的具体实施方式作进一步详细说明。图1是随机森林病变识别模型;图2是特征重要性程度排序;图3是特征选择对OOB估计的影响;图4是改进的随机森林与原始算法分类性能比较;图5是肝脏CT图像病变识别操作流程。具体实施方式为实现本专利技术的肝脏平扫CT图像局部病变识别,采用如下两个阶段进行。第一阶段:基于随机森林算法的病变识别模型建立1.肝脏平扫CT图像局部病变区域图像特征数据集建立:本专利技术采用来自杭州某医院标注的3000张肝脏平扫CT图像,大小均为512*512,包含正常、肝癌、肝血管瘤和肝囊肿等几种类型,提取能够覆盖标注的病变区域的矩形框作为感兴趣区域,这样得到3000个病变区块图像。对每个病变区域区块,计算病变区块图像的灰度直方图、灰度共生矩阵和灰度梯度共生矩阵。对于病变区块图像,灰度直方图矩阵H计算方法如下: H ( i ) = 本文档来自技高网...

【技术保护点】
基于随机森林算法的肝脏平扫CT图像病变识别方法,其特征是包括以下内容:提取肝脏平扫CT图像病变区域的图像灰度纹理特征作为图像特征向量表示,然后采用随机森林算法对肝脏CT图像病变区域图像特征向量进行特征选择,选择出最有效的特征组合,然后对最有效特征数据集进行训练和学习,并对随机森林的决策树进行识别能力均衡优化,得到最终的病变识别模型。

【技术特征摘要】
1.基于随机森林算法的肝脏平扫CT图像病变识别方法,其特征是包括以下内容:提取肝脏平扫CT图像病变区域的图像灰度纹理特征作为图像特征向量表示,然后采用随机森林算法对肝脏CT图像病变区域图像特征向量进行特征选择,选择出最有效的特征组合,然后对最有效特征数据集进行训练和学习,并对随机森林的决策树进行识别能力均衡优化,得到最终的病变识别模型。2.根据权利要求1所述的基于随机森林算法的肝脏平扫CT图像病变识别方法,其特征是:病变识别模型建立,包括如下步骤:1)、肝脏CT图像病变区域特征数据集建立:包括:a.灰度直方图特征提取;b.灰度共生矩阵特征提...

【专利技术属性】
技术研发人员:金心宇武海涛金奇樑刘帆
申请(专利权)人:浙江大学
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1