使用机器学习技术评定数字病理学图像中的特征的异质性制造技术

技术编号:37677790 阅读:23 留言:0更新日期:2023-05-26 04:43
本公开在一个实施方案中提供了一种方法,其包括:接收组织样品的数字病理学图像;以及将所述数字病理学图像细分为多个块。对于所述多个块中的每个块,所述方法包括:识别在所述块中检测到的图像特征;以及使用机器学习模型来生成与在所述块中识别的所述图像特征相对应的一个或多个标签。所述方法包括:基于生成的标签,确定针对所述组织样品的异质性度量。所述方法包括:基于所述异质性度量,生成对所述组织样品的评定。述组织样品的评定。述组织样品的评定。

【技术实现步骤摘要】
【国外来华专利技术】使用机器学习技术评定数字病理学图像中的特征的异质性
[0001]优先权
[0002]本申请根据35U.S.C.
§
119(e)要求2020年7月15日提交的美国临时专利申请号63/052297的权益,该临时专利申请以引用方式并入本文。


[0003]本公开整体涉及对数字病理学图像进行分类和评定在全切片图像中检测到的特征的异质性。
[0004]与其他非小细胞肺癌(NSCLC)相比,肺腺鳞癌的预后较差。腺癌(ADC)和鳞状细胞癌(SCC)是常见类型的NSCLC。腺鳞癌(ASC)在同一肿瘤中具有ADC和SCC两者的特征。ASC的发病率因研究而异,但估计占所有肺癌的0.4%至4%。这些癌症的诊断取决于若干因素,包括对肿瘤的充分采样、周密的审查和对组织学标准的客观解释。
[0005]某些基因突变与NSCLC或其他类型的癌症有关。具有这些突变中的一种或多种可能影响医生建议的治疗类型。因此,识别患者的这些不同基因突变可影响治疗和患者结局。通常与NSCLC相关联的基因突变包括肿瘤蛋白53(TP53)突变、Kirsten大鼠肉瘤病毒致癌基因同源物(KRAS)突变、表皮生长因子受体(EGFR)突变和间变性淋巴瘤激酶(ALK)突变。
[0006]用于识别组织学结构(histology)(例如,ADC癌症区域、SCC癌症区域等)的当前技术或方法需要由病理医师或其他经训练的专家在数字病理学图像(例如,全切片图像)中进行人工识别。人工识别费时费力,并且有时难免出现人为错误。此外,通常无法仅从数字病理学图像人工识别肿瘤突变。因此,存在对用于在关于NSCLC、其他癌症和其他病症的数字病理学图像中识别特征(包括组织学结构、突变或其他目标特征)的自动化技术或方法的期望。此外,存在对评定患有特定病症(例如,特定癌症)的患者的这些特征的异质性(这将实现对肿瘤生物学和患者对各种治疗的反应性的更好理解)的期望。

技术实现思路

[0007]在特定实施例中,一种计算机实现方法包括:接收组织样品的数字病理学图像;以及将数字病理学图像细分为多个块。组织样品的数字病理学图像可以为来自被诊断患有非小细胞肺癌(NSCLC)的患者的肿瘤样品的全切片扫描图像。在特定实施例中,数字病理学图像或全切片图像为苏木精和伊红(H&E)染色的图像。方法包括:对于每个块,识别在该块中检测到的图像特征,以及使用机器学习模型来生成与在块中识别的图像特征相对应的一个或多个标签。机器学习模型可以为深度学习神经网络。在一个实施例中,图像特征包括组织学结构,并且施加于块的一个或多个标签包括腺癌(ADC)和鳞状细胞癌(SCC)癌症区域。在另一个实施例中,图像特征指示基因突变或变体,并且施加于块的一个或多个标签包括Kirsten大鼠肉瘤病毒致癌基因同源物(KRAS)突变、表皮生长因子受体(EGFR)突变、间变性淋巴瘤激酶(ALK)突变或肿瘤蛋白53(TP53)突变。方法包括:基于生成的标签,确定针对组织样品的异质性度量。如果组织样品由具有不同标签的混合物的块表示,则该组织样品被认为是异质的。异质性度量可用于评估组织样品中的识别的图像特征和对应标签的异质性
程度。方法进一步包括:基于异质性度量,生成对组织样品的评定。可以基于该评定来作出关于受试者是否符合条件参加测试针对特定医学病症的医学治疗方面的临床试验的确定。此外,可以基于该评定针对受试者确定一个或多个治疗选项。
[0008]在特定实施例中,数字病理学图像处理系统可以输出各种可视化(诸如基于块的图像标记),指示识别的特征和对应标签的异质性程度。基于块的标记可由病理医师使用,以使识别的图像特征可视化或评估机器学习模型。此外,基于块的标记可以帮助病理医师诊断或评定受试者或审查初始评定。基于块的标记可以基于识别的图像特征而生成,并且可以描绘组织样品中的识别的图像特征的可视化,诸如以差异化颜色编码显示与识别的图像特征相对应的标签中的每一个。在一个实施例中,可以使用显著性映射技术来生成基于块的标记。在特定实施例中,基于块的标记为包括多个区域的热图。多个区域中的每个区域与强度值相关联。多个区域中的一个或多个区域进一步与数字病理学图像的块的预测标签相关联。
[0009]在特定实施例中,数字病理学图像处理系统可以训练机器学习模型(例如,深度学习神经网络)以识别图像特征并生成与在来自数字病理学图像的多个块中示出的识别的图像特征(例如,组织学结构、突变等)相对应的标签。训练机器学习模型可以包括:访问分别与多个受试者(例如,来自NSCLC患者的组织样品)相关联的多个数字病理学图像;识别多个数字病理学图像中的每一个中的肿瘤区域;将多个数字病理学图像细分为训练块集,其中该集中的每个训练块利用一个或多个特征进行分类,并利用与一个或多个特征相对应的一个或多个真实值标签进行注释;以及使用带有与块中示出的特征相对应的真实值标签的分类的块集来训练机器学习模型。真实值标签由临床医师提供。
[0010]在特定实施例中,数字病理学图像处理系统可以进一步测试机器学习模型的准确度或验证其训练,并基于验证更新该模型。测试和更新机器学习模型包括:访问特定受试者的特定数字病理学图像;将特定数字病理学图像细分为块集;对在块内检测到的第二图像特征进行识别和分类;使用经训练的机器学习模型,针对块集,生成与识别的第二图像特征相对应的预测标签集;对生成的预测标签集和与块集相关联的真实值标签进行比较;以及基于该比较,更新机器学习模型。更新机器学习模型可以包括:进一步训练机器学习模型。
[0011]使用机器学习模型或深度学习神经网络对图像特征(例如,组织学结构、基因突变等)进行分类,并在数字病理学(例如,H&E染色的)图像中生成对应标签(例如,突变类型、组织学结构亚型等),这在许多方面特别有利。一些优势可包括例如但不限于:1)减轻使用者(例如,病理医师、医生、临床专家等)人工评估数千个全切片图像和识别这些图像中的每一个中特征以供研究的负担;2)加快整体图像分类和评估过程,并且一旦模型经过充分训练,实际上就可以减少由人进行的手动分类和评估中有时可能引入的错误或错误机会;3)有助于识别以前未知的新生物标志物或特征;4)研究异质性在患者对治疗的反应中的作用;以及5)针对某些类型的分析,利用相对便宜且快速的H&E染色过程产生的图像,而非依赖昂贵且耗时的DNA测序。
[0012]本文公开的实施例仅是示例,并且本公开的范围不限于此。本文的示例可以相对于特定类型的癌症(例如,肺癌、前列腺癌等)进行描述。这些描述仅作为示例而非进行限制,因为应用于所讨论的特定癌症的技术可以应用于其他类型的癌症和/或其他病症,而无需进行显著修改或背离本公开的技术。特定实施例可以包括本文公开的实施例的部件、元
件、特征、功能、操作或步骤中的全部、一些,或者不包括任何一者。根据本专利技术的实施例特别公开在针对方法、存储介质、系统和计算机程序产品的所附权利要求中,其中在一个权利要求类别中提及的任何特征(例如,方法)可以在另一个权利要求类别(本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种计算机实现方法,其包括:接收组织样品的数字病理学图像;将所述数字病理学图像细分为多个块;对于所述多个块中的每个块:识别在所述块中检测到的图像特征;并且使用经训练的机器学习模型来生成与在所述块中识别的所述图像特征相对应的一个或多个标签;基于生成的标签,确定针对所述组织样品的异质性度量;以及基于所述异质性度量,生成对所述组织样品的评定。2.根据权利要求1所述的方法,其中所述组织样品的所述数字病理学图像为来自被诊断患有非小细胞肺癌的患者的肿瘤样品的全切片图像。3.根据权利要求1所述的方法,其中所述数字病理学图像为苏木精和伊红(H&E)染色的图像。4.根据权利要求1所述的方法,其中在所述数字病理学图像的所述多个块中检测到的图像特征对应于组织学结构。5.根据权利要求4所述的方法,其中所述生成的标签对应于腺癌和鳞状细胞癌癌症区域。6.根据权利要求1所述的方法,其中在所述数字病理学图像的所述多个块中检测到的图像特征对应于突变或基因变体。7.根据权利要求6所述的方法,其中所述生成的标签对应于Kirsten大鼠肉瘤病毒致癌基因同源物(KRAS)突变、表皮生长因子受体(EGFR)突变、间变性淋巴瘤激酶(ALK)突变或肿瘤蛋白53(TP53)突变。8.根据权利要求1所述的方法,其中所述异质性度量指示所述组织样品中的识别的图像特征和对应标签的异质性程度。9.根据权利要求1所述的方法,其进一步包括:基于所述生成的标签,生成基于块的标记;以及使用所述基于块的标记,生成图像特征的可视化或评估机器学习模型。10.根据权利要求9所述的方法,其中所述基于块的标记包括热图,所述热图包括多个区域,所述多个区域中的每个区域分别与强度值相关联,其中所述多个区域中的一个或多个区域进一步与所述数字病理学图像的所述块的预测标签相关联。11.根据权利要求9所述的方法,其中在所述组织样品中识别的所述图像特征的所述可视化包括以差异化颜色编码来显示所述生成的标签中的每一个。12.根据权利要求9所述的方法,其中所述基于块的标记是使用显著性映射技术生成的。13.根据权利要求1所述的方法,其进一步包括训练所述机器学习模型,其中训练所述机器学习模型包括:访问分别与多个受试者相关联的多个数字病理学图像;识别所述多个数字病理学图像中的每一个中的肿瘤区域;将所述多个数字病理学图像中的每一个细分为训练块集,其中所述集中的每个训练块
利用一个或多个...

【专利技术属性】
技术研发人员:C
申请(专利权)人:基因泰克公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1