System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本申请涉及医学影像数据处理,具体涉及一种基于机器学习的浸润性肺腺癌高级别成分预测方法。
技术介绍
1、肺腺癌已成为非小细胞肺癌中最常见的亚型,肺浸润性非黏液腺癌的常见亚型包括5个组织病理亚型:贴壁状为主型腺癌、腺泡状为主型腺癌、乳头状为主型腺癌、微乳头状为主型腺癌及实体为主伴黏液分泌型腺癌。肺腺癌hgp(high grade patterns, 高级别成分)病理亚型主要包括微乳头状为主型腺癌、实体为主伴黏液分泌型腺癌以及复杂腺体模式。肺腺癌的高级别病理亚型作为主要成分存在时(>5%),具有快速转移潜力,患者预后较差且易复发。此外,近期研究发现当高级别病理亚型,作为次要成分出现时(成分<5%),也会对患者的总生存率产生显著的负面影响。因此,术前确定hgp的存在对于医生制定更积极的手术计划和其他辅助治疗具有重要意义。
2、shap是一种基于合作博弈论的算法,通过计算shapley值来量化每个特征对模型预测的贡献,为复杂的黑箱模型提供透明的解释,用于解释机器学习模型的输出。影像组学是一种结合医学影像学和机器学习的跨学科领域方法,旨在利用大规模的医学影像数据和相关的临床信息,通过图像分析和模式识别技术,发现和量化与疾病相关的影像特征,以改善疾病的早期诊断、治疗选择和预后评估等临床问题。影像组学通过提取和分析影像中的定量特征,如形态学特征、纹理特征、功能特征等,与临床结果进行关联,以提供对疾病的更准确、个体化的评估和预测。
3、现有技术中已有一些研究使用影像组学方法预测肺腺癌的hgp。然而,这些研究一般
技术实现思路
1、本申请为了解决上述技术问题,提出了如下技术方案:
2、第一方面,本申请实施例提供了一种基于机器学习的浸润性肺腺癌高级别成分预测方法,包括:
3、获取浸润性肺腺癌患者的原始ct影像数据、病灶三维感兴趣体积voi和对应的临床放射学特征;
4、将所述原始ct影像数据进行预处理并结合病灶voi提取并筛选影像组学特征;
5、通过筛选出的影像组学特征构建影像组学评分;
6、对所述临床放射学特征使用统计学分析进行特征筛选;
7、结合所述影像组学评分和筛选后的临床放射学特征,使用逻辑回归算法进行建模实现浸润性肺腺癌高级别成分的预测。
8、在一种可能的实现方式中,所述将所述原始ct影像数据进行预处理并结合病灶voi提取并筛选影像组学特征,包括:
9、对原始ct影像进行重采样,将影像在三个解剖方向上的像素间距进行设置;
10、从重采样后的ct影像和病灶voi中提取影像组学特征,所述影像组学特征中的影像类别数据包括预处理后的影像、高斯-拉普拉斯滤波图像、小波图像,特征类别数据包括形状特征、直方图特征、纹理特征、灰度游程矩阵、灰度大小区域矩阵、灰度依赖矩阵和邻域灰度差矩阵;
11、将所有数据在保持正负样本比例不变的情况下,随机划分成训练集和测试集;
12、对于训练集中数据进行z-scores标准化,公式为,其中为标准化后的特征,为该特征的平均值,为该特征的标准差;
13、利用t-test检测每个特征与病灶是否具有高级别成分之间存在显著性差异,筛选出p<0.05的放射组学特征,然后利用lasso算法来计算特征加权排序来选择训练集中的最优特征。
14、在一种可能的实现方式中,所述利用lasso算法来计算特征加权排序来选择训练集中的最优特征,包括:
15、lasso 通过在回归模型中引入正则化项,自动筛选出最优特征并对其进行加权排序,其公式为:
16、
17、其中,n是样本数;p是特征数;是第i个样本的第j个特征;是第i个样本的真实标签值;是特征j的系数;是正则化参数,控制对系数的收缩程度。
18、在一种可能的实现方式中,所述通过筛选出的影像组学特征构建影像组学评分,包括:
19、根据筛选出的影像组学特征,通过逻辑回归方法构建r-score,r-score的计算公式为:r-score =-2.0379+ 0.2249 * boxsigmaimage_glszm_sizezonenonuniformitynormalized+ 0.0396 * log_glszm_log_sigma_2_mm_3d_sizezonenonuniformi ty +1.0020 * log_glszm_log_sigma_2_mm_3d_smallareahighgraylevelemphasis+0.3679*wavelet_glcm_wavelet_hhh_clustershade+0.6478* laplaciansharpening_ glrlm_longrunhighgraylevelemphasis+0.4029*specklenoise_gldm_dependencevariance+0.3354*recursivegaussian_gldm_dependencevariance+0.1831*shotnoise_firstorder_interquartilerange-0.2873 * shotnoise_glcm_inversevariance-0.2305 *shotnoise_glcm_idn;
20、其中:boxsigmaimage_glszm_sizezonenonuniformitynormalized、log_glszm_log_sigma_2_mm_3d_sizezonenonuniformity、log_glszm_log_sigma_2_mm_ 3d_smallareahighgraylevelemphasis、wavelet_glcm_wavelet_hhh_clustershade、laplaciansharpening_glrlm_longrunhighgraylevelemphasis、specklenoise_gldm_dependencevariance、recursivegaussian_gldm_dependencevariance、shotnoise _firstorder_interquartilerange、shotnoise_glcm_inversevariance和shotnoise_glcm_idn均为在训练集数据中筛选出来的影像组学特征。
21、在一种可能的实现方式中,所述对所述临床放射学特征使用统计学分析进行特征筛选,包括:
22、对于训练集数据中的临床放射学特征放入连续变量,当满足正态分布时采用t-test,否则采用mann-whitney u test;
23、对分类变量,当其分布较为均匀时采用chi-squared test,否者采用fisher’sexact test,并保留具有显著性差异的特征。
24本文档来自技高网...
【技术保护点】
1.一种基于机器学习的浸润性肺腺癌高级别成分预测方法,其特征在于,包括:
2.根据权利要求1所述的基于机器学习的浸润性肺腺癌高级别成分预测方法,其特征在于,所述将所述原始CT影像数据进行预处理并结合病灶VOI提取并筛选影像组学特征,包括:
3.根据权利要求2所述的基于机器学习的浸润性肺腺癌高级别成分预测方法,其特征在于,所述利用LASSO算法来计算特征加权排序来选择训练集中的最优特征,包括:
4.根据权利要求1所述的基于机器学习的浸润性肺腺癌高级别成分预测方法,其特征在于,所述通过筛选出的影像组学特征构建影像组学评分,包括:
5.根据权利要求1所述的基于机器学习的浸润性肺腺癌高级别成分预测方法,其特征在于,所述对所述临床放射学特征使用统计学分析进行特征筛选,包括:
6.根据权利要求1所述的基于机器学习的浸润性肺腺癌高级别成分预测方法,其特征在于,所述结合所述影像组学评分和筛选后的临床放射学特征,使用逻辑回归算法进行建模实现浸润性肺腺癌高级别成分的预测,包括:
7.根据权利要求6所述的基于机器学习的浸润性肺腺癌
8.根据权利要求1所述的基于机器学习的浸润性肺腺癌高级别成分预测方法,其特征在于,还包括:利用SHAP算法进行特征重要性分析,解释模型的预测结果。
9.根据权利要求8所述的基于机器学习的浸润性肺腺癌高级别成分预测方法,其特征在于,所述利用SHAP算法进行特征重要性分析,解释模型的预测结果,包括:利用SHAP模型对逻辑回归模型的预测结果进行分析,通过计算特征的Shapley值解释特征对预测结果的贡献,对于每个特征,Shapley值通过计算当该特征加入到所有可能的特征组合中时,对模型预测结果的边际贡献来衡量其重要性,公式为:
...【技术特征摘要】
1.一种基于机器学习的浸润性肺腺癌高级别成分预测方法,其特征在于,包括:
2.根据权利要求1所述的基于机器学习的浸润性肺腺癌高级别成分预测方法,其特征在于,所述将所述原始ct影像数据进行预处理并结合病灶voi提取并筛选影像组学特征,包括:
3.根据权利要求2所述的基于机器学习的浸润性肺腺癌高级别成分预测方法,其特征在于,所述利用lasso算法来计算特征加权排序来选择训练集中的最优特征,包括:
4.根据权利要求1所述的基于机器学习的浸润性肺腺癌高级别成分预测方法,其特征在于,所述通过筛选出的影像组学特征构建影像组学评分,包括:
5.根据权利要求1所述的基于机器学习的浸润性肺腺癌高级别成分预测方法,其特征在于,所述对所述临床放射学特征使用统计学分析进行特征筛选,包括:
6.根据权利要求1所述的基于机器学习的浸润性肺腺癌高级别成分预测方法,...
【专利技术属性】
技术研发人员:张敏,贾守强,聂生东,陶雅丽,
申请(专利权)人:济南市人民医院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。