一种前列腺癌早期筛查模型及其构建方法技术

技术编号:38442604 阅读:9 留言:0更新日期:2023-08-11 14:24
本申请涉及前列腺癌早期筛查的技术领域,具体公开了一种前列腺癌早期筛查模型及其构建方法。构建方法包括以下步骤:I、提取健康样本、前列腺癌样本和前列腺炎样本的尿液cfDNA并测序;II、根据测序结果分析,获得基因突变marker特征、CNV特征和甲基化特征,并分别计算分析得到基因突变marker特征值、CNV特征值和甲基化特征值;III、以基因突变marker特征值、CNV特征值和甲基化特征值构建随机森林模型:使用随机森林中的交叉验证的方法,计算得到样本的打分矩阵;设置特异性≥90%时,根据打分矩阵得到敏感性时的阈值。本申请的模型用于前列腺癌的早期筛查时具有敏感性、特异性高的优点。点。点。

【技术实现步骤摘要】
一种前列腺癌早期筛查模型及其构建方法


[0001]本申请涉及前列腺癌早期筛查的
,更具体地说,它涉及一种前列腺癌早期筛查模型及其构建方法。

技术介绍

[0002]前列腺癌(Prostate Cancer,PCa)是发生于前列腺上皮的恶性肿瘤,是世界第二大常见的男性恶性肿瘤,也是导致男性患者死亡的主要原因之一。
[0003]前列腺癌患者的生存时间与其临床诊断时的肿瘤分期密切相关。
[0004]前列腺癌的早期筛查是改善我国前列腺癌患者患病率和生存期的重要手段。由于前列腺癌前期的发病和进展都比较缓慢,因此,对高风险人群通过筛查手段以进行前列腺癌的早期诊断,是一项具有重大意义的工作。目前前列腺癌比较常用的早期筛查手段为前列腺特异性抗原(Prostate Specificantigen,PSA)筛查。PSA检测是前列腺癌早筛中比较常用的方法,但是其假阳性较高,尤其是前列腺炎、前列腺增生、血尿等多种情况都有可能导致PSA的升高。为了进一步诊断,通常需要对患者进行穿刺活检。穿刺本身不仅会带来一定程度的身体伤害,也存在因穿刺活检后的过度诊治带来身体伤害的问题。因而以PSA检测方法进行前列腺癌早期筛查的方式仍存在一些的争议和疑虑。
[0005]基于此,目前也有无创筛查前列腺癌的方法,其多以单一维度的标志物的检测数据进行线性模型构建,确定阈值,并根据未知样本的模型打分和阈值的比较结果预判样本是否前列腺癌症样本。但是该方法依然存在模型稳定性差、检测结果准确率和可靠性低的问题。
[0006]因此提供一种可靠的、无创的、灵敏度高的前列腺癌早期筛查模型以用于前列腺癌的早期精准筛查是十分必要的。

技术实现思路

[0007]为了改善现有方法进行前列腺癌早期筛查时存在假阳性高和具有侵入性的问题,本申请提供一种前列腺癌早期筛查模型及其构建方法。该模型用于前列腺癌早期筛查时,以无创或微创方式得到检测样本,具有侵入性低的优点;且该模型的早筛准确性高,假阳、假阴性低。
[0008]第一方面,本申请提供一种前列腺癌早期筛查模型的构建方法,采用如下的技术方案:一种前列腺癌早期筛查模型的构建方法,包括以下步骤:I、提取健康样本、前列腺癌样本和前列腺炎样本的尿液中的cfDNA并测序,获得测序结果;II、根据测序结果分析,获得基因突变marker特征、CNV特征和甲基化特征,并分别计算分析得到基因突变marker特征值、CNV特征值和甲基化特征值;III、以基因突变marker特征值、CNV特征值和甲基化特征值构建模型:使用随机森
林中的交叉验证的方法,计算得到样本的打分矩阵;设置特异性≥90%时,根据打分矩阵得到敏感性时的阈值。
[0009]早筛早诊早治是改善癌症患者预后的最有效方法之一。目前,临床上的肿瘤筛查手段(影像、肿标等)并不完全可靠,筛查方法的灵敏度有限,并且对于大多数的癌症患者来说,具有侵入性。受到这些因素的影响,科学家和临床医生将注意力转向液体活检,将其作为一种新的无创或微创筛查手段,用于前列腺癌症的早筛。本研究是基于尿液样本的一种无创早筛技术手段,通过对尿液中DNA测序分析,提取出突变(SNV和InDel)、拷贝数变异(CNV)、基因甲基化等多个特征,通过机器学习的方法来构建训练模型,以此来实现前列腺癌的早筛。通过采用上述技术方案,首先,本申请基于该模型进行前列腺癌症的早期筛查时,其基础样本是尿液样本,因此该模型能够实现非侵入性筛查前列腺癌的目的,较大程度上消除了对患者身体和心理的伤害。此外,本申请采用多维度的数据(基因突变marker特征、CNV特征和甲基化特征)结果构建前列腺癌症的早筛模型,使得该模型不易受单一维度数据的波动影响,模型稳定性高;该模型引入随机森林的机器学习方法,并使用多重交叉验证,使其稳定性更高;最终得到的前列腺癌症早筛模型具有敏感性高、特异性高以及早筛准确性高的优点。另外,该模型构建时将前列腺炎症患者的数据加入到模型训练中,可以很好地区分前列腺炎症和前列腺癌症患者,因此该模型的辨识率高,从而减少过度治疗的情况出现,并填补了市面上针对该筛选特性的前列腺癌早筛产品的空白。
[0010]可选的,所述基因突变marker特征对应1个基因突变marker特征值;所述CNV特征对应的CNV特征值,包括CNV特征区域的Z

score值和样本的CNV肿瘤分数,其中,CNV肿瘤分数是由segment区间长度及其对应的Z

score的绝对值计算得到;所述甲基化特征对应的甲基化特征值是甲基化特征基因的ΔCt值。
[0011]通过采用上述技术方案,以多维度、多特征值进行模型构建,使得模型的敏感性、特异性显著提高,模型预测结果的准确度显著提高。
[0012]进一步可选的,所述基因突变marker特征值的获取方法包括以下步骤:统计所有样本中基因突变marker的信息,并和基因突变marker组比较,如果样本中包含基因突变marker组中的任意一种基因突变,则该样本的基因突变marker特征值为1,如果样本中无基因突变marker组中的任何一种基因突变,则该样本的基因突变marker特征值为0。
[0013]进一步可选的,所述基因突变marker组中的突变基因包括:ACVR1、AKT2、ALOX12B、APC、AR、ARID1A、ARID1B、ASXL1、ASXL2、ATM、ATR、ATRX、AXIN1、AXIN2、BCL10、BCOR、BRAF、BRCA1、BRCA2、BRIP1、BTG1、CBL、CDK12、CDKN1B、CDKN2B、CEBPA、CIC、CREBBP、CTNNB1、CYLD、DAXX、DICER1、DIS3、DNMT3A、ENG、EP300、EPHA2、EPHB1、ERBB2、ERBB4、ERCC3、ERF、ETV6、FANCD2、FANCE、FAT1、FLCN、FLT4、FOXA1、FOXP1、GATA3、GNAS、GRIN2A、HLA

A、HLA

B、HLA

C、HNF1A、HRAS、IDH2、IFNGR1、INHA、INPP4B、INPPL1、INSR、JAK1、KAT6A、KDM5C、KDM6A、KIT、KMT2A、KMT2B、KMT2C、KMT2D、KRAS、LATS2、LRP1B、MAP3K1、MEN1、MGA、MSH3、MSH6、MUTYH、MYC、NBN、NCOR1、NF1、NF2、NKX2

1、NOTCH1、NOTCH2、NOTCH3、NOTCH4、NRAS、NSD1、PHOX2B、PIK3CA、PIK3R1、PIK3R2、POLE、PRDM1、PREX2、PTCH1、PTEN、PTPRS、PTPRT、RAD50、RAD51C、RB1、RBM10、RECQL4、RNF43、SDHA、SETD2、SF3B1、SH2B3、SLX4、SMAD3、SMARCA4、SPEN、SPOP、STAG2、STAT3、STAT5B、TCF7L2本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种前列腺癌早期筛查模型的构建方法,其特征在于,包括以下步骤:I、提取健康样本、前列腺癌样本和前列腺炎样本的尿液中的cfDNA并测序,获得测序结果;II、根据测序结果分析,获得基因突变marker特征、CNV特征和甲基化特征,并分别计算分析得到基因突变marker特征值、CNV特征值和甲基化特征值;III、以基因突变marker特征值、CNV特征值和甲基化特征值构建随机森林模型:使用随机森林中的交叉验证的方法,计算得到样本的打分矩阵;设置特异性≥90%时,根据打分矩阵得到敏感性时的阈值。2.根据权利要求1所述的构建方法,其特征在于,所述基因突变marker特征对应1个基因突变marker特征值;所述CNV特征对应的CNV特征值,包括CNV特征区域的Z

score值和样本的CNV肿瘤分数,其中,CNV肿瘤分数是由segment区间长度及其对应的Z

score的绝对值计算得到;所述甲基化特征对应的甲基化特征值是甲基化特征基因的ΔCt值。3.根据权利要求2所述的构建方法,其特征在于,所述基因突变marker特征值的获取方法包括以下步骤:统计所有样本中基因突变marker的信息,并和基因突变marker组比较,如果样本中包含基因突变marker组中的任意一种基因突变,则该样本的基因突变marker特征值为1,如果样本中无基因突变marker组中的任何一种基因突变,则该样本的基因突变marker特征值为0。4.根据权利要求3所述的构建方法,其特征在于,所述基因突变marker组中的突变基因包括:ACVR1、AKT2、ALOX12B、APC、AR、ARID1A、ARID1B、ASXL1、ASXL2、ATM、ATR、ATRX、AXIN1、AXIN2、BCL10、BCOR、BRAF、BRCA1、BRCA2、BRIP1、BTG1、CBL、CDK12、CDKN1B、CDKN2B、CEBPA、CIC、CREBBP、CTNNB1、CYLD、DAXX、DICER1、DIS3、DNMT3A、ENG、EP300、EPHA2、EPHB1、ERBB2、ERBB4、ERCC3、ERF、ETV6、FANCD2、FANCE、FAT1、FLCN、FLT4、FOXA1、FOXP1、GATA3、GNAS、GRIN2A、HLA

A、HLA

B、HLA

C、HNF1A、HRAS、IDH2、IFNGR1、INHA、INPP4B、INPPL1、INSR、JAK1、KAT6A、KDM5C、KDM6A、KIT、KMT2A、KMT2B、KMT2C、KMT2D、KRAS、LATS2、LRP1B、MAP3K1、MEN1、MGA、MSH3、MSH6、MUTYH、MYC、NBN、NCOR1、NF1、NF2、NKX2

1、NOTCH1、NOTCH2、NOTCH3、NOTCH4、NRAS、NSD1、PHOX2B、PIK3CA、PIK3R1、PIK3R2、POLE、PRDM1、PREX2、PTCH1、PTEN、PTPRS、PTPRT、RAD50、RAD51C、RB1、RBM10、RECQL4、RNF43、SDHA、SETD2、SF3B1、SH2B3、SLX4、SMAD3、SMARCA4、SPEN、SPOP、STAG2、STAT3、STAT5B、TCF7L2、TEK、TERT、TET1、TET2、TGFBR2、TNFRSF14、TP53、TP53BP1、TSC2、WRN、XRCC2和ZFHX3。5.根据权利要求2所述的构建方法,其特征在于,所述CNV特征区域包括chr8:23000001

24000000,chr7:54000001

55000000,chr7:55000001

56000000,chr8:126000001

127000000,chr8:106000001

107000000,chr8:127000001

128000000,chr8:4000001

5000000,chr8:91000001

92000000,chr10:85000001

86000000,chr13:83000001

84000000,chr8:93000001

【专利技术属性】
技术研发人员:楼峰陈利斌王猛曹善柏王慧娜刘磊
申请(专利权)人:天津橡鑫生物科技有限公司天津橡鑫医疗器械有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1