预测淋巴结的癌累及的机器学习制造技术

技术编号:39035947 阅读:9 留言:0更新日期:2023-10-10 11:49
本文公开了用于确定转移癌的受试者水平风险的方法,其包括训练和/或部署模型以确定:1)个体淋巴结累及的淋巴结水平风险;以及/或者2)淋巴结累及的受试者水平风险。因此,该方法可识别具有结节病的高风险或低风险的患者,并且任选地使得能够例如经由治疗来指导癌症患者的干预。患者的干预。患者的干预。

【技术实现步骤摘要】
【国外来华专利技术】预测淋巴结的癌累及的机器学习
[0001]相关申请的交叉引用
[0002]本申请要求2020年12月1日提交的美国临时专利申请63/120,102号的权益和优先权,该临时专利申请的全部公开内容据此全文以引用方式并入以用于所有目的。

技术介绍

[0003]胸部的计算机断层扫描(CT)成像已经成为用于评估处于肺癌风险中的那些人的临床标准。这些努力集中在肺结节的检测上,肺结节可能代表疾病的最早期和最可治愈的分期。此类肺结节的检测触发了更广泛的临床评估,以确定其是否是癌性的,并且如果是癌性的,则其是否扩散到胸部中的其他结构或甚至身体的远侧区域。这样做是为了确定肺癌的分期,该分期又决定了治疗干预的计划。
[0004]肺癌分期的一个方面是确定其在胸部淋巴结中的存在或不存在(结节状态)。当前的护理标准涉及分期的方法,其中首先确定结节是良性的还是恶性的,然后进行附加测试,诸如正电子发射断层扫描(PET)和基于外科手术、内窥镜或支气管镜的淋巴结取样。组织取样程序增加了后处理的风险、费用和时间。需要新的非侵入性方法来减轻这些风险并缩短诊断和治疗之间的时间。如本文进一步详细描述的,应用于用于肺癌筛查的初始胸廓CT扫描的基于机器学习和深度学习的技术可以解决这些需要。
[0005]肺癌检测、分期和治疗计划是可能花费数周或数月的多步骤过程。除了此类临床工作的风险和费用之外,该过程所需的额外时间导致显著的患者焦虑和提高的间期转移机会。事实上,较长的诊断到治疗时间与较差的总体存活率有关。减轻这些问题的示例性方法是允许几乎同时进行癌症诊断、分期以及在支气管镜疗法的情况下允许治疗的方法。

技术实现思路

[0006]本文公开的本专利技术的实施方案基于用于在高风险人群中筛查肺癌的胸廓CT扫描的分析。在一些方面,其识别具有转移到胸部中的至少一个淋巴结(LN)并且因此需要附加测试(诸如PET扫描和淋巴结活检)的癌症高风险的患者。这允许临床提供者优先对那些最需要的人进行测试。相反,淋巴结转移风险低的疑似肺癌患者可直接进行即时治疗,诸如手术切除或组合支气管镜诊断和治疗。这将消除疾病诊断和治疗之间的时间。具体地,本文公开的本专利技术的实施方案使得能够识别具有结节病的高风险或低风险的患者,从而允许临床医生优先在高风险个体中进行附加的测试或使具有低转移风险的肺癌患者直接进行确认支气管镜活检,随后立即进行支气管镜递送治疗。
[0007]本文公开了确定受试者的转移癌的受试者水平风险的方法,该方法包括:获得从受试者捕获的一个或多个图像,该一个或多个图像包括受试者的多个淋巴结;以及通过将风险模型应用于所获得的一个或多个图像的提取的特征来预测转移癌的受试者水平风险,该风险模型被训练用于针对图像中的淋巴结预测转移癌的淋巴结(LN)水平风险,其中风险模型是至少使用从针对参考个体的淋巴结集合的转移癌的插补LN水平风险导出的标签来训练的,该淋巴结集合的插补LN水平风险是至少使用区分训练图像的癌性淋巴结和非癌性
淋巴结的插补模型来确定的。在各种实施方案中,预测转移癌的受试者水平风险还包括:基于由风险模型预测的多个淋巴结的转移癌的LN水平风险,选择该多个淋巴结中的一个或多个淋巴结;以及使用针对该一个或多个淋巴结预测的转移癌的LN水平风险来确定转移癌的受试者水平风险。
[0008]在各种实施方案中,选择该多个淋巴结中的一个或多个淋巴结包括识别具有最高概率的LN水平风险的淋巴结,并且其中确定转移癌的受试者水平风险包括将最高概率的LN水平风险指定为转移癌的受试者水平风险。在各种实施方案中,风险模型以比由插补模型预测的插补LN水平风险更大范围的概率预测转移癌的LN水平风险。在各种实施方案中,通过以下方式选择参考个体的淋巴结集合:确定中位风险值;以及将参考个体的淋巴结的插补LN水平风险与该中位风险值进行比较。在各种实施方案中,进一步通过以下方式选择参考个体的淋巴结集合:在淋巴结集合中包括具有大于中位风险值的LN水平风险的一个或多个淋巴结。在各种实施方案中,将淋巴结集合中的具有小于中位风险值的LN水平风险的一个或多个淋巴结从淋巴结集合中排除。
[0009]在各种实施方案中,中位风险值是参考个体的中位受试者内LN水平风险。在各种实施方案中,该一个或多个图像包括计算机断层扫描(CT)图像。在各种实施方案中,该一个或多个图像是从胸廓CT扫描获得的。在各种实施方案中,本文公开的方法还包括根据转移癌的预测的受试者水平风险确定癌症的分期。在各种实施方案中,本文公开的方法还包括根据转移癌的预测的受试者水平风险针对受试者选择诊断或治疗。在各种实施方案中,针对受试者选择诊断或治疗包括当转移癌的预测的受试者水平风险低于阈值风险值时,选择手术肿瘤切除或组合支气管镜或内窥镜诊断和治疗。在各种实施方案中,针对受试者选择诊断或治疗包括当转移癌的预测的受试者水平风险高于阈值风险值时,选择执行PET或PET

CT扫描或执行淋巴结活检中的一者或两者的附加诊断测试。
[0010]在各种实施方案中,使用从胸廓CT扫描获得的训练图像来训练插补模型。在各种实施方案中,从胸廓CT扫描获得的训练图像包括一个或多个淋巴结。在各种实施方案中,使用国家肺癌筛查试验(NLST)的训练图像来训练插补模型。在各种实施方案中,使用定制数据集的训练图像来训练插补模型。
[0011]在各种实施方案中,通过从训练图像中的至少一个训练图像生成两个或更多个放射组学组来训练插补模型。在各种实施方案中,两个或更多个放射组学组包括训练图像的高斯

拉普拉斯变换和训练图像的小波变换。在各种实施方案中,通过以下方式来进一步训练插补模型:从两个或更多个放射组学组中的每个放射组学组提取特征;以及至少使用所提取的特征来训练插补模型。在各种实施方案中,通过以下方式进一步训练插补模型:在放射组学组中限定感兴趣区域(ROI),该限定的感兴趣区域包括淋巴结;从放射组学组中的ROI中提取特征;以及至少使用所提取的特征来训练插补模型。在各种实施方案中,提取的特征包括一阶特征、形状特征、灰度共生矩阵1(GLCM)特征、灰度游程长度矩阵(GLRLM)特征、灰度区域大小矩阵(GLSZM)特征和邻域灰色调差分矩阵(NGTDM)特征的一个或多个特征类别。
[0012]在各种实施方案中,使用在训练图像中指示转移的存在或不存在的参考基础真值来进一步训练插补模型。在各种实施方案中,参考基础真值是从指示癌症的分期的Nstage可协变值导出的,其中“0”或“1”癌症分期指示不存在转移,并且其中“2”或“3”癌症分期指
示存在转移。在各种实施方案中,参考基础真值指示个体淋巴结是癌性的还是非癌性的。在各种实施方案中,基于肿瘤或淋巴结的特性从Nstage可协变值反向计算指示个体淋巴结是癌性的还是非癌性的参考基础真值。
[0013]在各种实施方案中,插补模型是随机森林分类器或LASSO分类器。在各种实施方案中,风险模型是随机森林分类器或LASSO分类器。在各种实施方案中,使用监督学习技术来训练风险模型。在各种实施方案中,多个淋巴结包括1本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种确定受试者的转移癌的受试者水平风险的方法,所述方法包括:获得从所述受试者捕获的包括所述受试者的多个淋巴结的一个或多个图像;以及通过将风险模型应用于所获得的一个或多个图像的提取的特征来预测转移癌的所述受试者水平风险,所述风险模型被训练用于针对图像中的淋巴结预测转移癌的淋巴结(LN)水平风险,其中所述风险模型是至少使用从针对参考个体的淋巴结集合的转移癌的插补LN水平风险导出的标签来训练的,所述淋巴结集合的所述插补LN水平风险是至少使用区分训练图像的癌性淋巴结和非癌性淋巴结的插补模型来确定的。2.根据权利要求1所述的方法,其中预测转移癌的所述受试者水平风险还包括:基于由所述风险模型预测的所述多个淋巴结的转移癌的LN水平风险,选择所述多个淋巴结中的一个或多个淋巴结;以及使用针对所述一个或多个淋巴结预测的转移癌的所述LN水平风险来确定转移癌的所述受试者水平风险。3.根据权利要求2所述的方法,其中选择所述多个淋巴结中的一个或多个淋巴结包括识别具有最高概率的LN水平风险的所述淋巴结,并且其中确定转移癌的所述受试者水平风险包括将所述最高概率的LN水平风险指定为转移癌的所述受试者水平风险。4.根据权利要求1至3中任一项所述的方法,其中所述风险模型以比由所述插补模型预测的所述插补LN水平风险更大范围的概率预测转移癌的LN水平风险。5.根据权利要求1至4中任一项所述的方法,其中通过以下步骤选择参考个体的所述淋巴结集合:确定中位风险值;以及将所述参考个体的所述淋巴结的插补LN水平风险与所述中位风险值进行比较。6.根据权利要求5所述的方法,其中进一步通过以下方式选择参考个体的所述淋巴结集合:在所述淋巴结集合中包括具有大于所述中位风险值的LN水平风险的一个或多个淋巴结。7.根据权利要求5或6所述的方法,其中将所述淋巴结集合中的具有小于所述中位风险值的LN水平风险的一个或多个淋巴结从所述淋巴结集合中排除。8.根据权利要求5至7中任一项所述的方法,其中所述中位风险值是所述参考个体的中位受试者内LN水平风险。9.根据权利要求1至8中任一项所述的方法,其中所述一个或多个图像包括计算机断层扫描(CT)图像。10.根据权利要求1至9中任一项所述的方法,其中所述一个或多个图像是从胸廓CT扫描获得的。11.根据权利要求1至10中任一项所述的方法,还包括根据转移癌的所预测的受试者水平风险来确定癌症的分期。12.根据权利要求1至11中任一项所述的方法,还包括根据转移癌的所预测的受试者水平风险针对所述受试者选择诊断或治疗。13.根据权利要求12所述的方法,其中针对所述受试者选择诊断或治疗包括当转移癌
的所预测的受试者水平风险低于阈值风险值时,选择手术肿瘤切除或组合支气管镜或内窥镜诊断和治疗。14.根据权利要求12所述的方法,其中针对所述受试者选择诊断或治疗包括当转移癌的所预测的受试者水平风险高于阈值风险值时,从执行PET或PET

CT扫描或执行淋巴结活检中的一者或两者选择附加诊断测试。15.根据权利要求12所述的方法,其中针对所述受试者选择诊断或治疗包括当转移癌的所预测的受试者水平风险低于阈值风险值时,选择PET或PET

CT扫描的附加诊断测试。16.根据权利要求1至15中任一项所述的方法,其中使用从胸廓CT扫描获得的训练图像来训练所述插补模型。17.根据权利要求16所述的方法,其中从胸廓CT扫描获得的所述训练图像包括一个或多个淋巴结。18.根据权利要求1至17中任一项所述的方法,其中使用国家肺癌筛查试验(NLST)的训练图像来训练所述插补模型。19.根据权利要求1至17中任一项所述的方法,其中使用定制数据集的训练图像来训练所述插补模型。20.根据权利要求16至19中任一项所述的方法,其中通过从所述训练图像中的至少一个训练图像生成两个或更多个放射组学组来训练所述插补模型。21.根据权利要求20所述的方法,其中所述两个或更多个放射组学组包括所述训练图像的高斯

拉普拉斯变换和所述训练图像的小波变换。22.根据权利要求20或21所述的方法,其中通过以下方式来进一步训练所述插补模型:从所述两个或更多个放射组学组中的每个放射组学组提取特征;以及至少使用所提取的特征来训练所述插补模型。23.根据权利要求20或21所述的方法,其中通过以下方式进一步训练所述插补模型:在所述放射组学组中限定感兴趣区域(ROI),所限定的感兴趣区域包括淋巴结;从所述放射组学组中的所述ROI中提取特征;以及至少使用所提取的特征来训练所述插补模型。24.根据权利要求22或23所述的方法,其中所提取的特征包括一阶特征、形状特征、灰度共生矩阵1(GLCM)特征、灰度游程长度矩阵(GLRLM)特征、灰度区域大小矩阵(GLSZM)特征和邻域灰色调差分矩阵(NGTDM)特征的一个或多个特征类别。25.根据权利要求16至24中任一项所述的方法,其中使用在训练图像中指示转移的存在或不存在的参考基础真值来进一步训练所述插补模型。26.根据权利要求25所述的方法,其中所述参考基础真值是从指示所述癌症的所述分期的Nstage可协变值导出的,其中“0”或“1”癌症分期指示不存在转移,并且其中“2”或“3”癌症分期指示存在转移。27.根据权利要求26所述的方法,其中所述参考基础真值指示个体淋巴结是癌性的还是非癌性的。28.根据权利要求27所述的方法,其中基于所述肿瘤或淋巴结的特性从所述Nstage可协变值反向计算指示个体淋巴结是癌性的还是非癌性的所述参考基础真值。29.根据权利要求1至28中任一项所述的方法,其中所述插补模型是随机森林分类器或
LASSO分类器。30.根据权利要求1至29中任一项所述的方法,其中所述风险模型是随机森林分类器或LASSO分类器。31.根据权利要求30所述的方法,其中使用监督学习技术来训练所述风险模型。32.根据权利要求1至31中任一项所述的方法,其中所述多个淋巴结包括2个、3个、4个、5个、6个、7个、8个、9个、10个、11个、12个、13个、14个、15个、16个、17个、18个、19个、20个或21个淋巴结。33.根据权利要求1至31中任一项所述的方法,其中所述多个淋巴结包括8个至20个淋巴结、10个至19个淋巴结、12个至18个淋巴结或14个至16个淋巴结。34.根据权利要求1至33中任一项所述的方法,其中所述转移癌是转移肺癌。35.根据权利要求1至34中任一项所述的方法,其中所述风险模型表现出至少AUC=78%、灵敏度=82%或特异性=60%的性能。36.一种训练权利要求1至35中任一项的所述风险模型的方法,所述方法包括:应用插补模型以针对训练图像中的多个淋巴结生成插补LN水平风险;选择淋巴结集合,其中所述集合中的所述淋巴结具有大于中位风险值的LN水平风险;使用所述淋巴结集合中的所述淋巴结的所述LN水平风险作为用于训练所述风险模型的参考基础真值,所述风险模型能够以比由所述插补模型预测的所述插补LN水平风险更大范围的概率预测LN水平风险。37.根据权利要求36所述的方法,其中通过以下方式来进一步训练所述风险模型:从一个或多个放射组学组提取特征;以及至少使用所提取的特征来训练所述风险模型。38.根据权利要求37所述的方法,其中从两个或更多个放射组学组提取特征包括:在所述一个或多个放射组学组中限定感兴趣区域(ROI),所限定的感兴趣区域包括淋巴结;从所述一个或多个放射组学组中的所述ROI中提取特征。39.根据权利要求37或38所述的方法,其中所提取的特征包括一阶特征、形状特征、灰度共生矩阵1(GLCM)特征、灰度游程长度矩阵(GLRLM)特征、灰度区域大小矩阵(GLSZM)特征和邻域灰色调差分矩阵(NGTDM)特征的一个或多个特征类别。40.一种用于确定受试者的转移癌的受试者水平风险的系统,所述系统包括:成像装置,所述成像装置被配置成捕获所述受试者的一个或多个图像;和计算装置,所述计算装置被配置成执行以下步骤:获得从所述受试者捕获的包括所述受试者的多个淋巴结的一个或多个图像;以及通过将风险模型应用于所获得的一个或多个图像的提取的特征来预测转移癌的所述受试者水平风险,所述风险模型被训练用于针对图像中的淋巴结预测转移癌的淋巴结(LN)水平风险,其中所述风险模型是至少使用从针对参考个体的淋巴结集合的转移癌的插补LN水平风险导出的标签来训练的,所述淋巴结集合的所述插补LN水平风险是至少使用区分训练图像的癌性淋巴结和非癌性淋巴结的插补模型来确定的。41.根据权利要求40所述的系统,其中预测转移癌的所述受试者水平风险还包括:基于由所述风险模型预测的所述多个淋巴结的转移癌的LN水平风险,选择所述多个淋
巴结中的一个或多个淋巴结;以及使用针对所述一个或多个淋巴结预测的转移癌的所述LN水平风险来确定转移癌的所述受试者水平风险。42.根据权利要求41所述的系统,其中选择所述多个淋巴结中的一个或多个淋巴结包括识别具有最高概率的LN水平风险的所述淋巴结,并且其中确定转移癌的所述受试者水平风险包括将所述最高概率的LN水平风险指定为转移癌的所述受试者水平风险。43.根据权利要求40至42中任一项所述的系统,其中所述风险模型以比由所述插补模型预测的所述插补LN水平风险更大范围的概率预测转移癌的LN水平风险。44.根据权利要求40至43中任一项所述的系统,其中通过以下步骤选择参考个体的所述淋巴结集合:确定中位风险值;以及将所述参考个体的所述淋巴结的插补LN水平风险与所述中位风险值进行比较。45.根据权利要求44所述的系统,其中进一步通过以下方式选择参考个体的所述淋巴结集合:在所述淋巴结集合中包括具有大于所述中位风险值的LN水平风险的一个或多个淋巴结。46.根据权利要求44或45所述的系统,其中将所述淋巴结集合中的具有小于所述中位风险值的LN水平风险的一个或多个淋巴结从所述淋巴结集合中排除。47.根据权利要求44至46中任一项所述的系统,其中所述中位风险值是所述参考个体的中位受试者内LN水平风险。48.根据权利要求40至47中任一项所述的系统,其中所述成像装置是计算机断层扫描(CT)扫描仪、磁共振成像(MRI)扫描仪、正电子发射断层扫描(PET)扫描仪、X射线扫描仪或超声成像装置中的一者。49.根据权利要求40至48中任一项所述的系统,其中所述成像装置是CT扫描仪,并且其中所述一个或多个图像包括计算机断层扫描(CT)图像。50.根据权利要求40至49中任一项所述的系统,其中所述一个或多个图像包括胸廓CT图像。51.根据权利要求40至50中任一项所述的系统,其中所述计算装置被进一步配置为执行以下步骤:根据转移癌的所预测的受试者水平风险来确定癌症的分期。52.根据权利要求40至51中任一项所述的系统,其中所述计算装置被进一步配置为执行以下步骤:根据转移癌的所预测的受试者水平风险针对所述受试者选择诊断或治疗。53.根据权利要求52所述的系统,其中针对所述受试者选择诊断或治疗包括当转移癌的所预测的受试者水平风险低于阈值风险值时,选择手术肿瘤切除或组合支气管镜或内窥镜诊断和治疗。54.根据权利要求53所述的系统,其中针对所述受试者选择诊断或治疗包括当转移癌的所预测的受试者水平风险高于阈值风险值时,选择执行PET或PET

CT扫描或执行淋巴结活检中的一者或两者的附加诊断测试。55.根据权利要求53所述的系统,其中针对所述受试者选择诊断或治疗包括当转移癌的所预测的受试者水平风险低于阈值风险值时,选择PET或PET

CT扫描的附加诊断测试。
56.根据权利要求40至54中任一项所述的系统,其中使用从胸廓CT扫描获得的训练图像来训练所述插补模型。57.根据权利要求56所述的系统,其中从胸廓CT扫描获得的所述训练图像包括一个或多个淋巴结。58.根据权利要求40至57中任一项所述的系统,其中使用国家肺癌筛查试验(NLST)的训练图像来训练所述插补模型。59.根据权利要求40至57中任一项所述的系统,其中使用定制数据集的训练图像来训练所述插补模型。60.根据权利要求56至59中任一项所述的系统,其中通过从所述训练图像中的至少一个训练图像生成两个或更多个放射组学组来训练所述插补模型。61.根据权利要求60所述的系统,其中所述两个或更多个放射组学组包括所述训练图像的高斯

拉普拉斯变换和所述训练图像的小波变换。62.根据权利要求60或61所述的系统,其中通过以下方式来进一步训练所述插补模型:从所述两个或更多个放射组学组中的每个放射组学组提取特征;以及至少使用所提取的特征来训练所述插补模型。63.根据权利要求60或61所述的系统,其中通过以下方...

【专利技术属性】
技术研发人员:G
申请(专利权)人:强生企业创新公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1