基于病理图像的结直肠癌生物标志物状态预测方法及设备技术

技术编号：41067101 阅读：2 留言：0更新日期：2024-04-24 11:21

本发明专利技术公开一种基于病理图像的结直肠癌生物标志物状态预测方法及设备，包括：收集大量结直肠癌患者的临床信息、病理图像以及其对应的生物标志物的分子诊断结果；将每个病理图像划分为若干图像块；提取每个图像块的影像组学特征和深度学习特征，并将其与对应患者的临床信息的临床特征融合为该患者的融合特征；将所有患者的融合特征划分为训练集和测试集；利用训练集以及收集的分子诊断结果作为标注数据，对多任务的深度学习模型进行训练；以生物标志物阳性样本的召回率超过预设值，以阴性样本的特异性最大为目标，采用测试集对多任务的深度学习模型进行阈值标定；应用训练好的模型。本发明专利技术能够大大减少病理医生的工作量，提高其工作效率。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于医学病理图像处理，具体涉及一种基于病理图像的结直肠癌生物标志物状态预测方法及设备。

技术介绍

1、结直肠癌是当今世界上第三大常见癌症，也是世界上第二大致死癌症。精准肿瘤学中，在结直肠癌的诊疗过程需要评估其相关基因生物标志物，如微卫星不稳定性（msi）和braf基因、nras/kras基因突变等。结直肠癌患者的生物标志物识别是提供各种医学指南推荐的治疗的重要步骤。

2、这些生物标志物通常通过聚合酶链反应（pcr）、测序（如braf和kras等）或免疫组化分析来测量。然而，以上诊断分析有几个缺点。

3、第一，价格昂贵：对于低收入和中等收入国家的许多患者来说，由于检测所需的高昂成本和复杂的基础设施，基因生物标志物不能常规获得。

4、第二，检测周期长：即使在拥有全民医疗保健覆盖的高收入国家，基因生物标志物可能常规可用。但由于其检测方法的复杂性，使得结直肠癌的生物标志物评估可能需要几天到数周的时间，也使得治疗方案推迟决定。

5、结直肠癌的诊断依赖于病理学家对组织切片的组织病理学评估。因此，苏木精和伊红染色的（h&e）组织切片成为适用于所有结直肠癌患者的常规检测方法。众多研究均表明，深度学习技术能够直接从数字化h&e染色的结直肠癌组织切片中预测遗传生物标志物。

6、随着人工智能的发展，基于人工智能技术的结直肠癌微卫星状态分类方法开始涌现，通过设计针对性的网络架构以及对胃癌病理图像的自主学习，使训练好的神经网络模型可以对结直肠癌微卫星状态进行分类，一定程

7、第一，标注成本巨大，需要医生手动勾画肿瘤区域，或由医生手动勾画后训练出来的分类模型帮助进行筛选。此过程也会引入病理医生主观勾画的差异，对结果造成一定影响。

8、部分方法为了避免病理医生的勾画差异，在模型中，会引入预训练好的肿瘤识别的模型来帮助判断图像块（tiles）是否是肿瘤，或是分割模型，将肿瘤区域识别出来。但对这些模型，在其训练的时候，也依然需要病理医生先手动勾画。

9、第二，大部分在训练过程中，对与同一个病理图像wsi所生成的图像块（tiles）的msi的状态，都使用了同样的权重，忽略了图像块（tiles）间的异质性，也从一定程度上影响了结果的准确性。

10、第三，特殊样本的处理，目前的方法，对于特殊样本，都没有进行相应处理。

11、第四，以检测为目标，无法实际应用到临床。虽然越来越多的深度学习模型在算法精度上，取得了越来越好的效果，但是若以检测为目标，精度上还是无法达到试剂的精度，患者漏检的风险依然很高。

12、上述问题使得深度学习算法的结果，很难达到临床应用的要求。

技术实现思路

1、为了解决上述技术问题，本专利技术提出了一种基于病理图像的结直肠癌生物标志物状态预测方法及设备。

2、为了达到上述目的，本专利技术的技术方案如下：

3、一方面，本专利技术公开一种基于病理图像的结直肠癌生物标志物状态预测方法，包括：

4、步骤s1：收集大量结直肠癌患者的临床信息、病理图像以及其对应的生物标志物的分子诊断结果；

5、步骤s2：将每个病理图像划分为若干图像块；

6、步骤s3：提取每个图像块的影像组学特征和深度学习特征，并将其与对应患者的临床信息的临床特征融合为该患者的融合特征；

7、步骤s4：将所有患者的融合特征划分为训练集和测试集；

8、步骤s5：利用训练集以及步骤s1收集的分子诊断结果作为标注数据，对多任务的深度学习模型进行训练；

9、多任务的深度学习模型包括：风险预测模型、生物标志物预测模型以及置信度预测模型；

10、风险预测模型用于根据临床特征预测患者的患病概率；

11、生物标志物预测模型用于根据影像组学特征、深度学习特征以及风险预测模型的预测结果，预测生物标志物的阳性概率；

12、置信度预测模型用于预测生物标志物预测模型的置信度；

13、步骤s6：以生物标志物阳性样本的召回率超过预设值，以阴性样本的特异性最大为目标，采用测试集对多任务的深度学习模型进行阈值标定；

14、步骤s7：将训练好的多任务的深度学习模型及标定的阈值应用在生物标志物状态的预测中。

15、在上述技术方案的基础上，还可做如下改进：

16、作为优选的方案，步骤s2包括：

17、步骤s2.1：将每个病理图像按照固定尺寸，划分为若干图像块，且每个图像块具有相同的分辨率；

18、步骤s2.2：根据筛选条件，从所有图像块中筛选出合格的图像块。

19、作为优选的方案，步骤s3包括：

20、步骤s3.1：提取患者临床信息的临床特征；

21、步骤s3.2：提取每个图像块的影像组学特征；

22、步骤s3.3：提取每个图像块的深度学习特征；

23、步骤s3.4：将单个图像块的影像组学特征和深度学习特征拼接，再将其与对应患者的临床特征进行融合，形成该患者的融合特征feature_patient；

24、feature_patient = {feature_clinical, feature_tile1, feature_tile2,..., feature_tilek}；

25、feature_tilei= [feature_omicsi, feature_dli]；

26、i=1, ..., k；

27、其中：k为图像块数量；

28、feature_clinical为患者的临床特征；

29、feature_tilei为第i个图像块的拼接特征；

30、feature_omicsi为第i个图像块的影像组学特征；

31、feature_dli为第i个图像块的深度学习特征。

32、作为优选的方案，风险预测模型的loss函数如下：

33、；

34、其中：n为样本量；

35、k表示分子状态的种类；

36、为训练集中第i个样本为种类j的概率；

37、为训练集中第i个样本预测为种类j的风险概率；

38、生物标志物预测模型的loss函数如下：

39、；

40、其中：n为样本量；

41、k表示分子状态的种类；

42、为训练集中第i个样本为种类j的概率；

43、为风险预测模型对第i个样本预测为种类j的风险概率；

44、为权重因子；

45、为训练集中第i个样本预测为种类j的概率；

46、置信度预测模型的loss函数如下：

47、；

48、；

49、其中：n为样本量；<本文档来自技高网...

【技术保护点】

1.基于病理图像的结直肠癌生物标志物状态预测方法，其特征在于，包括：

2.根据权利要求1所述的结直肠癌生物标志物状态预测方法，其特征在于，所述步骤S2包括：

3.根据权利要求1所述的结直肠癌生物标志物状态预测方法，其特征在于，所述步骤S3包括：

4.根据权利要求1所述的结直肠癌生物标志物状态预测方法，其特征在于，所述风险预测模型的loss函数如下：

5.根据权利要求1所述的结直肠癌生物标志物状态预测方法，其特征在于，所述步骤S7包括：

6.基于病理图像的结直肠癌生物标志物状态预测设备，其特征在于，包括：

7.根据权利要求6所述的结直肠癌生物标志物状态预测设备，其特征在于，所述划分模块包括：

8.根据权利要求6所述的结直肠癌生物标志物状态预测设备，其特征在于，所述特征提取模块包括：

9.根据权利要求6所述的结直肠癌生物标志物状态预测设备，其特征在于，所述风险预测模型的loss函数如下：

10.根据权利要求6所述的结直肠癌生物标志物状态预测设备，其特征在于，所述应用模块包括：</p>...

【技术特征摘要】

1.基于病理图像的结直肠癌生物标志物状态预测方法，其特征在于，包括：

2.根据权利要求1所述的结直肠癌生物标志物状态预测方法，其特征在于，所述步骤s2包括：

3.根据权利要求1所述的结直肠癌生物标志物状态预测方法，其特征在于，所述步骤s3包括：

4.根据权利要求1所述的结直肠癌生物标志物状态预测方法，其特征在于，所述风险预测模型的loss函数如下：

5.根据权利要求1所述的结直肠癌生物标志物状态预测方法，其特征在于，所述步骤s7包括：

<...

【专利技术属性】
技术研发人员：徐清华，文虎儿，
申请(专利权)人：苏州可帮基因科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人