【技术实现步骤摘要】
【国外来华专利技术】
本专利技术一般而言涉及机器学习和计算机视觉,并且更具体地涉及图像预处理和分类。
技术介绍
1、组织病理学图像分析(hia)是许多医学领域,尤其是肿瘤学中诊断的关键要素。胰腺导管腺癌(缩写为“pac”或“pda”)预计将在2030年成为第二大癌症死亡原因,并且其预后在过去几十年中几乎没有改善。pac是异质性非常强的肿瘤,具有显著的间质和多个组织学方面。基因组和蛋白质组研究已经证实了pac的分子异质性,并且可能是解释大多数临床试验的失败的因素之一。pac的转录组亚型已被描述为具有重大的预后和预测意义。例如,rashid等人,clinical cancer research(2020);26:82-92,描述了一种用于名为肿瘤纯度独立亚型分型(purist)的pac亚型分型的单样本分类器,该分类器基于得自rnaseq、nanostring或微阵列的基因表达数据。两种purist亚型(经典亚型和基础样亚型)与患者预后和治疗反应具有有意义的关联。在肿瘤细胞内,与以祖上皮表型为特征的经典亚型相比,基础样亚型由与早期转移和folfirinox耐药相关
...【技术保护点】
1.一种用于处理胰腺导管腺癌(PAC)样本的数字图像的计算机实现的方法,该方法包括接收得自受试者的PAC样本的数字图像,将机器学习模型应用于该数字图像,以及使用机器学习模型确定图像的PAC分类,其中机器学习模型已经通过处理多个训练图像进行了训练。
2.如权利要求1所述的计算机实现的方法,其中数字图像是整个切片图像(WSI)。
3.如权利要求1或权利要求2所述的计算机实现的方法,其中该方法还包括一个或多个图像预处理步骤。
4.如权利要求3所述的计算机实现的方法,其中图像预处理步骤包括以下一个或多个:
5.如权利要求4所述的
...【技术特征摘要】
【国外来华专利技术】
1.一种用于处理胰腺导管腺癌(pac)样本的数字图像的计算机实现的方法,该方法包括接收得自受试者的pac样本的数字图像,将机器学习模型应用于该数字图像,以及使用机器学习模型确定图像的pac分类,其中机器学习模型已经通过处理多个训练图像进行了训练。
2.如权利要求1所述的计算机实现的方法,其中数字图像是整个切片图像(wsi)。
3.如权利要求1或权利要求2所述的计算机实现的方法,其中该方法还包括一个或多个图像预处理步骤。
4.如权利要求3所述的计算机实现的方法,其中图像预处理步骤包括以下一个或多个:
5.如权利要求4所述的计算机实现的方法,其中图像预处理步骤包括(a)、(b)和(c)。
6.如权利要求1至权利要求5中的任一项所述的计算机实现的方法,其中pac分类是在切片级别进行的。
7.如权利要求4或权利要求5所述的计算机实现的方法,其中pac分类是在图块级别进行的。
8.如权利要求7所述的计算机实现的方法,其中pac分类将图块分类为包含肿瘤性区域或不包含肿瘤性区域,其中肿瘤性区域能够包括肿瘤细胞和/或肿瘤相关联的间质细胞。
9.如权利要求6所述的计算机实现的方法,其中pac分类包括表示图像中所表示的pac样本属于两个pda亚型之一的可能性的连续分数。
10.如权利要求7所述的计算机实现的方法,其中pac分类包括表示在图块中所表示的pac样本中一个或多个pda亚型特征的普遍性的一个或多个连续分数。
11.一种确定与患有胰腺导管腺癌pda的受试者的pda分类方案对应的胰腺导管腺癌(pda)亚型的计算机实现的方法,包括:
12.如权利要求11所述的计算机实现的模型,还包括:使用机器学习模型计算用于图块的子集中的每个图块的一个或多个pda分子成分分数。
13.如权利要求11所述的计算机实现的模型,其中机器学习模型被进一步训练以计算用于分类方案的每个pda亚型的分数。
14.如权利要求11所述的计算机实现的模型,其中pda分类方案是purist,并且其中pda亚型包括经典的和基础样。
15.如权利要求11所述的计算机实现的模型,其中pda分类方案是分子成分剖析,并且其中pda分子成分包括经典的、基础、间质活动和间质非活动。
16.如权利要求11所述的计算机实现的方法,其中pda分类方案是多个pda分类方案之一。
17.如权利要求11所述的计算机实现的方法,其中所述多个pda分类方案中的每个pda分类方案包括多个可能的pda亚型。
18.如权利要求11所述的计算机实现的方法,其中pda样本的组织学切片已经用染料染色。
19.如权利要求18所述的计算机实现的方法,其中染料是苏木精和曙红(h&e)。
20.如权利要求11至权利要求19中的任一项所述的计算机实现的方法,其中数字图像是整个切片图像(wsi)。
21.如权利要求11至权利要求20中的任一项所述的计算机实现的方法,其中pda样本是原发性胰腺导管腺癌或其一部分。
22.如权利要求11至权利要求20中的任一项所述的计算机实现的方法,其中pda样本是转移性胰腺导管腺癌或其一部分。
23.如权利要求22所述的计算机实现的方法,其中转移性胰腺导管腺癌或其部分得自受试者的肝脏。
24.如权利要求11所述的计算机实现的方法,其中预处理步骤还包括从图像中去除背景片段。
25.如权利要求24所述的计算机实现的方法,其中从图像中去除背景片段是使用卷积神经网络执行的。
26.如权利要求11所述的计算机实现的方法,其中图块的子集的选择是使用被训练为区分包括肿瘤区域的图块与包括正常区域的图块的肿瘤模型执行的。
27.如权利要求26所述的计算机实现的方法,其中肿瘤模型包括多层感知器。
28.如权利要求11所述的计算机实现的方法,其中特征提取是使用动量对比度或动量对比度v2执行的。
29.如权利要求11所述的方法,其中确定用于肿瘤组织片段中的每个肿瘤组织片段的pda亚型包括:
30.如权利要求29所述的方法,其中确定pda亚型包括基于对从图块的子集提取的特征的子集的分析来计算切片级别的purist分数。
31.如权利要求11所述的计算机实现的方法,其中已经使用多个训练图像训练了机器学习模型,所述多个训练图像包括得自具有pda分类方案的已知pda亚型的受试者的pda样本的组织学切片的数字图像。
32.如权利要求31所述的计算机实现的方法,其中训练图像各自包括指示已知pda亚型的全局标签。
33.如权利要求29至权利要求32中的任一项所述的计算机实现的方法,其中机器学习模型是深度多实例学习模型。
34.如权利要求29所述的计算机实现的方法,其中pda剖析方案是分子成分,并且全局标签是经典、基础、间质活动、间质非活动分子成分中的每一个的值。
35.如权利要求29至权利要求31或权利要求33中的任一项所述的计算机实现的方法,其中机器学习模型是weldon模型。
36.如权利要求30至权利要求32中的任一项所述的计算机实现的方法,其中已知的pda亚型是使用pda样本的基因表达谱来识别的。
37.如权利要求35所述的计算机实现的方法,其中基因表达谱包括rnaseq数据或nanostring数据。
38.如权利要求12所述的计算机实现的方法,还包括汇集与图块的子集中的每个图块对应的pda分子成分分数,以生成切片级别分子成分分数,其中切片级别分子成分分数指示具有最高预测分数的分子成分。
39.如权利要求12所述的计算机实现的方法,还包括将数字图像与代表与图块的子集中的每个图块对应的pda分子成分分数的信息叠加,以生成用代表pda分子成分分数的信息标记的数字图像。
40.如权利要求37所述的计算机实现的方法,其中代表每个图块的pda分子成分分数的信息包括指示具有在图块中所包含的所述一个或多个肿瘤组织片段的最高预测分数的分子成分的标签。
41.如权利要求11所述的计算机实现的方法,还包括:
42.一种pda样本的组织学切片的数字图像,其中图像内的肿瘤组织片段包括将所述一个或多个肿瘤组织片段与多个pda亚型中的一个或多个pda亚型相关联的标签...
【专利技术属性】
技术研发人员:C·塞拉德,B·施莫奇,V·奥伯特,K·奥雷利,M·拉克鲁瓦缇基,I·加尔贝里斯,D·德鲁贝,F·安德烈,J·克罗斯,
申请(专利权)人:奥金股份有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。