一种优化影像组学体素相关变异性的去除批次效应方法技术

技术编号:38921598 阅读:31 留言:0更新日期:2023-09-25 09:32
本发明专利技术公开了一种优化影像组学体素相关变异性的去除批次效应方法,其特征在于,对于不同体素的CT扫描数据利用ComBat优化方法进行优化以去除批次效应。本发明专利技术通过肺结节体模和临床数据进行不同体素相关的CT组学特征重复性及再现性研究,深入分析体素相关的肺结节CT组学特征变异性;使用重采样(升采样和降采样)和ComBat方法对CT组学特征进行优化,并于优化前后进行对比分析;最后使用临床实际数据进行验证。进行验证。进行验证。

【技术实现步骤摘要】
一种优化影像组学体素相关变异性的去除批次效应方法


[0001]本专利技术涉及一种去除批次效应可以降低影像组学体素相关变异性,从而增加影像组学模型的泛化性的方法。

技术介绍

[0002]世界卫生组织国际癌症研究机构的研究表明,肺癌是威胁人类生命最严重的恶性肿瘤之一,作为全球癌症死亡的主要原因之一,造成严重的社会和经济负担。
[0003]一)影像组学研究现状
[0004]近年来,随着影像学检查技术的发展和人们体检意识的提高,肺结节的检出率也不断提高。胸部计算机断层扫描(Computed Tomography,CT)可以及时有效地发现肺结节。虽然肺结节的CT征象有助于临床的良恶性鉴别诊断和亚型分级,但是良恶性病变或不同临床活跃程度的恶性病变CT征象存在诸多交叉,放射诊断医师对病变CT征象的分析存在主观和经验的差异,因而需要更多的客观信息来明确诊断。随着计算能力的提高、深度学习(Deep Learning,DL)算法的发展以及医学大数据的应用,人工智能(Artificial Intelligence,AI)在医学领域蓬勃发展。
[0005]影像组学(Radiomics)是通过计算机高通量提取定量特征的方法,可以从医学影像图像中提取海量不同维度的数据,通过图像获取、分割、特征提取和模型建立与验证,将医学图像的主观性、定性的数据转化为客观性、定量的数据,以便实现数据挖掘分析。目前已经有很多关于肺结节的影像组学研究,影像组学模型虽然具有较好的肺腺癌鉴别诊断和亚型分析的效能,但是不同研究构建的模型特征不同,在通用性上遇到了瓶颈。究其原因,虽然影像组学参数在疾病的筛查、诊断、治疗和预后中展现出了超越传统医疗方式的生物标志物属性,但其特征变异性(variability)大,包括重复性(repeatability)及再现性(reproducibility)差,限制了诊断效能,且模型泛化外推能力欠缺,这些都限制其在“真实世界”医疗实践中的应用。
[0006]二)影像组学体素相关变异性研究现状
[0007]近年来,越来越多的国内外学者关注影像组学特征的变异性问题。影像组学特征变异性来源可分为三类:扫描前变异、扫描中变异和扫描后变异。据此,为保证影像组学模型在“真实世界”临床应用的诊断效能和泛化能力,需要深入研究其变异性的影响因素及规律,并采用多种校正方法降低其整体变异性。为了详细研究CT扫描参数设置和重建算法对影像组学特征的影响,往往需要采用复杂的体模,但采用的体模类型不一,如CCR体模(Credence Cartridge Radiomics phantom)。另一种采用类似感兴趣区(Region of Interest,ROI)的定制模型,嵌入位于不同位置、具有不同纹理和体积的模拟组织,在真实的临床条件下测试,通过比较不同成像设置获得的图像或进行测试

重测研究。
[0008]随着技术的不断发展和AI算法能力的不断提高,CT扫描的空间分辨率也越来越小,与常规的512
×
512矩阵的CT扫描图像相比,超高分辨率CT(1024
×
1024、2048
×
2048)能更加清晰的显示病灶,从而有利于临床诊断。Hata等分别使用三种不同矩阵(512
×
512、
1024
×
1024、2048
×
2048)CT扫描体模和尸体肺,由3名医生对图像质量进行三分法评估,结果显示尽管1024
×
1024和2048
×
2048矩阵的噪声和条纹伪影较大,但是图形质量明显优于512
×
512矩阵的CT图像,另外2048矩阵扫描的CT图像质量又优于1024矩阵扫描的CT图像。由于CT扫描的分辨率有限,只能在CT图像上测量相对较大的气道中进行气道尺寸,但是小气道是慢性阻塞性肺疾病(Chronic Obstructive Pulmonary Disease,COPD)和哮喘等肺部疾病的重要病理损伤,因此Tanabe等使用三种不同矩阵(512
×
512、1024
×
1024、2048
×
2048)CT扫描管道体模,并将测量值与金标准做对比,结果显示与常规扫描相比,超高分辨率扫描可以更精确地测量细支气管的直径。
[0009]重采样方法被认为可解决体素大小不同引起的变异来源。已有研究证明重采样的同时加以巴特沃斯低通滤波的校正(Butterworth low

pass filtering)可以有效降低体素大小不同带来的变异。但重采样法一般通过升采样,即增大标准化体素的方法,如将体素增大为1
×1×
2mm3,对LDCT筛出的5

10mm的肺小结节(扫描野350mm,像素大小0.68mm)而言,意味着丢失大量的图像信息,可以预估的是降低“真实世界”临床诊断的效能可能性高。且会另生成一组图像,增加了系统存储压力。修改影像组学参数定义的方法同时需要对影像组学参数以及产生变异的来源及原理进行深入分析,鉴于现阶段影像组学参数数量庞大及其数量不断增长的趋势,此类方法还需大量研究。
[0010]由于CT扫描仪及成像参数的差异导致影像组学参数的数据分布不同,去除批次效应(Combatting Batch Effect,ComBat)模型可在不改变生物学信息的情况下,将不同成像参数设置下得到的同一影像组学参数的分布由不同拟合为相同,降低其变异度。Orlhac等比较ComBat方法补偿前后的不同设备、层厚及图像算法的影像组学参数数据分布,表明拟合后,每个纹理特征对应于不同成像参数的簇分布得到校正。Ligero等对比图像重采样、Combat、奇异值分解(Singular Value Decomposition,SVD),发现Combat法不仅可以降低组学特征变异度,而且在体模及肝转移瘤鉴别诊断中的诊断效能高于重采样和SVD。ComBat方法来源于基因组学研究中,处理目标为不同实验室、不同操作员、不同批次试剂与不同实验时间等因素带来的数据批次效应(Batch Effect)。批次效应是不必要的数据变化,会掩盖生物信号,导致后续数据分析出现偏差或者失误,因此需要ComBat优化。不同体素的CT扫描数据来源存在差异,从而产生批次效应,因此ComBat方法也适用于优化不同体素造成的组学特征变异性。

技术实现思路

[0011]本专利技术的目的是:提供一种发现降低影像组学体素相关变异性的方法。
[0012]为了达到上述目的,本专利技术的技术方案是提供了一种优化影像组学体素相关变异性的去除批次效应方法,其特征在于,对于不同体素的CT扫描数据利用ComBat优化方法进行优化以去除批次效应,并通过以下步骤确认ComBat优化方法的有效性:
[0013]步骤1、获取肺结节体模数据:
[0014]使用CT扫描仪将肺部体模仰卧位平稳放置进行扫描,根据不同的体素大小将扫描参数本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种优化影像组学体素相关变异性的去除批次效应方法,其特征在于,对于不同体素的CT扫描数据利用ComBat优化方法进行优化以去除批次效应,并通过以下步骤确认ComBat优化方法的有效性:步骤1、获取肺结节体模数据:使用CT扫描仪将肺部体模仰卧位平稳放置进行扫描,根据不同的体素大小将扫描参数分为两部分,按一个扫描参数完成扫描后将体模重新定位,重复同一个扫描参数再扫一次,获得测试

重测的肺结节体模CT数据;步骤2、获取肺结节临床数据:回顾性收集所有肺结节或占位患者,基于排除标准排除相关患者后,获得患者的CT扫描数据,CT扫描参数和肺结节体模数据一样,但不进行测试

重测扫描;步骤3、进行肺结节分割、标注:使用uAI Research Portal软件实现肺结节体模数据和肺结节临床数据上肺结节的自动分割,并对肺结节临床数据进行肺结节CT形态特征标注,该肺结节CT形态特征包括:最大径、最小径和平均径,最大径是结节最大层面的最长径,最小径是与最大径垂直的长度,平均直径是最大径和最小径的平均值;毛刺征;分叶征,弧弦距/弦长≥0.2;空洞,类圆形气体密度影,最大径>5mm;空泡,类圆形气体密度影,最大径<5mm;钙化,CT值≥150HU;瘤肺界面,如果能够勾勒出结节的轮廓则认为瘤肺界面清晰,否则认为瘤肺界面不清晰;支气管充气征;胸膜凹陷征;血管异常,包括血管集束征和血管膨大。。因为肺结节体模几乎都为球形,因此没有对肺结节体模的CT图像进行CT征象的标注和分析。步骤4、分别利用重采样优化方法以及ComBat优化方法对肺结节体模数据以及肺结节临床数据进行优化;步骤5、提取CT组学特征使用uAI Research Portal软件提取肺结节体模和临床数据的CT组学特征,包含:一阶统计特征、形状相关特征、纹理特征和高阶特征;步骤6、组学特征变异性分析提取CT组学特征之后,使用CCC为影像组学特征稳定性判断筛选标准并评价影像组学特征变异度大小;随后,在CCC筛选基础之上,采用动态范围筛选患者之间差异较大的影像组学特征,DR值的范围是0到1,越接近1表示该特征具有较大的生物学范围并具有良好的可重复性,越接近0则相反;认为CCC和DR均大于0.9的组学特征重复性高;再使用ICC来评估影像组学特征的再现性,ICC越高说明再现性越好;结合CCC、DR和ICC筛选标准,实现找出在前述不同扫描方案中表现出较高稳定性与潜在生物学标志可能性的影像组学特征子集,并使组学特征变异性可视化,对肺结节组学特征的变异性进行分层聚类分析;步骤7、进行真实临床数据验证。2.如权利要求1所述的一种优化影像组学体素相关变...

【专利技术属性】
技术研发人员:卓瑶瑶单飞张志勇王青乐詹艺沈杰范卓阳曾蒙苏
申请(专利权)人:复旦大学附属中山医院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1