一种膀胱癌早期筛查模型及其构建方法、试剂盒及其使用方法技术

技术编号:33669171 阅读:50 留言:0更新日期:2022-06-02 20:52
本申请涉及膀胱癌筛查的技术领域,具体公开了一种膀胱癌早期筛查模型及其构建方法、试剂盒及其使用方法。构建方法包括以下步骤:S1、分别获得健康样本和癌症样本的gDNA测序结果、cfDNA测序结果;S2、根据cfDNA测序结果处理获得SNP/INDEL特征;以gDNA测序结果处理得到CNV特征;根据SNP/INDEL特征和CNV特征进行分类,绘制ROC曲线;S3、建立膀胱癌早期筛查模型;试剂盒基于该模型进行膀胱癌筛查。本申请的试剂盒具有准确筛查膀胱癌的优点。盒具有准确筛查膀胱癌的优点。盒具有准确筛查膀胱癌的优点。

【技术实现步骤摘要】
一种膀胱癌早期筛查模型及其构建方法、试剂盒及其使用方法


[0001]本申请涉及膀胱癌筛查的
,更具体地说,它涉及一种膀胱癌早期筛查模型及其构建方法和试剂盒。

技术介绍

[0002]膀胱癌是常见的恶性肿瘤之一,也是泌尿系统最常见的一种恶性肿瘤。目前膀胱癌监控方法依赖反复的膀胱镜检查、穿刺活检、影像学检查。膀胱镜检查被视为目前膀胱癌诊断的金标准,但这些过程耗时、费用较高,对原位癌敏感性较差,并且可能导致尿路感染、尿道损伤、膀胱损伤等并发症。穿刺活检方法由于是高侵入性的,会对组织有创伤。影像学检查则带有辐射伤害,以上这些常规检查方法都会给患者带来痛苦。
[0003]膀胱癌是泌尿系统常见的恶性肿瘤,膀胱癌发病具有多中心、易复发、易侵袭、易耐药等生物学特性。非肌层浸润性膀胱癌复发率高,需要定期膀胱灌注、复查膀胱镜;而肌层浸润性膀胱癌转移率高,在完成根治切除后,五年生存率仅在50%

60%;基于如此差的愈后表现,使得膀胱癌早筛早诊亟待实现和普及。
[0004]膀胱癌由于其发病灶的特殊性,因此在尿液中往往存在着大量来自膀胱癌组织脱落的肿瘤细胞及癌细胞凋亡破裂释放的小片段游离DNA;因此尿液是诊断膀胱癌的理想标本,而尿液无创诊断也将是研究开发的主流趋势。基于尿液无创诊断技术如脱落细胞学、荧光原位杂交(FISH)和膀胱肿瘤抗原(BTA)等存在敏感性和/或特异性不高、容易出现漏诊和误诊的问题;因此,开发高灵敏度的膀胱癌无创诊断技术可在降低患者痛苦的同时改善其诊疗现状。
[0005]当前临床对膀胱癌筛查的“金标准”为膀胱镜联合病理活检,采样痛苦且对泌尿系统形成创伤。目前也有一系列无创筛查的方法用于膀胱癌的筛查,其主要通过检测尿液沉淀细胞和尿液上清中的标志物实现。其中基于尿液沉淀细胞的筛查技术包括:通过低深度全基因测序检测基因拷贝数变异、靶向捕获测序检测基因突变、荧光原位杂交法(FISH)检测染色体拷贝数变异、DNA甲基化水平检测以及过表达标志基因mRNA表达量检测。基于尿液上清的筛查技术则主要为cfDNA点突变检测。
[0006]但是目前现有筛查膀胱癌的模型,其筛查准确性不高;而筛查模型相对应的检测分析方法,也多采用的是单一维度的线性分类方法,该类方法依旧存在灵敏度和特异性不高的问题。

技术实现思路

[0007]为了提高膀胱癌早期筛查的准确性,提高筛查的灵敏度和特异性,本申请提供一种膀胱癌早期筛查模型及其构建方法、试剂盒及其使用方法。
[0008]第一方面,本申请提供一种膀胱癌早期筛查模型的构建方法,采用如下的技术方案:
一种膀胱癌早期筛查模型的构建方法,包括以下步骤:S1、自健康样本和癌症样本的尿液沉淀样本中分别获得健康样本和癌症样本的gDNA测序结果;自健康样本和癌症样本的尿液上清样本中分别获得健康样本和癌症样本的cfDNA测序结果;S2、根据cfDNA测序结果,获得所有健康样本和癌症样本的膀胱癌相关突变marker的覆盖情况,最终获得SNP/INDEL特征;以部分健康样本的gDNA测序结果用于构建CVN事件的baseline,通过对baseline中的信息处理得到CNV特征;根据SNP/INDEL特征和CNV特征进行分类,绘制ROC曲线;S3、将SNP/INDEL特征和CNV特征进行整合,并通过支持向量机机器学习的算法建立膀胱癌早期筛查模型。
[0009]通过采用上述技术方案,由于NGS在癌症早筛领域的广泛应用,越来越多新的生物标记物被发现。目前本领域的研究主要集中在DNA甲基化、突变和拷贝数变异上,也有少数研究蛋白和RNA标志物。本模型构建方法是采用多态性位点突变联合拷贝数变异的多个基因组特征,建立训练集与测试集,通过机器学习的方法,建立癌症筛查模型,以提高癌症(早期)筛查的准确性。
[0010]可选的,步骤S2中,构建CVN事件的baseline的步骤包括:随机选择部分健康样本的尿液沉淀样本,处理没有信号以及存在大量噪音的区域,所述没有信号以及存在大量噪音的区域包括着丝粒、端粒和repeat区域;然后计算出每个bin的期望覆盖度和中值分段方差,以将这些信息用于后续检测样本的标准化。
[0011]可选的,步骤S2中,对baseline中的信息处理得到CNV特征的步骤包括:对baseline中的信息进行归一化,计算出每个bin区间的log2ratio和Z

Score,其计算公式分别为:ratio = RC
gc

bin
/mean(RC
gc

all

bin
),RC
gc

bin
代表, 每个bin区间GC校正后的read数,mean(RC
gc

all

bin
), 统计所有bin区间GC校正后的read数的均数,log2ratio, ratio取以2为底log的对数;Z

Score = (ratio

E
(ref

ratio)
)/std
(ref

ratio)
,其中E
(ref

ratio) 为 cnv baseline每个bin的期望覆盖度,std
(ref

ratio)
为cnv baseline每个bin的覆盖度标准差;将得到的每个bin的log2ratio和Z

Score使用Circular binary segmentation(CBS)方法进行call segment,得到segment的最终log2ratio和Z

Score结果;其中以cutoff_1为0.08用于segment过滤。
[0012]可选的,步骤S2中,以cutoff_2值为8700000用于CNV特征的分类。
[0013]可选的,膀胱癌相关突变marker的分布基因包括基因TERT、基因TP53、基因ERBB2、基因ERCC2、基因FGFR3、基因KDM6A、基因PIK3CA、基因ARID1A、基因ERBB3、基因GATA3、基因BRCA2、基因CREBBP、基因CTNNB1、基因ELF3和基因FH中的任意一种或多种。
[0014]可选的,分布在基因TP53上的膀胱癌相关突变marker包括chr17:7577127

7577127,chr17:7577505

7577505,chr17:7577527

7577527,chr17:7577535

7577535,chr17:7577538

7577538,chr17:7577539

7577539,chr17:7577545

757754本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种膀胱癌早期筛查模型的构建方法,其特征在于,包括以下步骤:S1、自健康样本和癌症样本的尿液沉淀样本中分别获得健康样本和癌症样本的gDNA测序结果;自健康样本和癌症样本的尿液上清样本中分别获得健康样本和癌症样本的cfDNA测序结果;S2、根据cfDNA测序结果,获得所有健康样本和癌症样本的膀胱癌相关突变marker的覆盖情况,最终获得SNP/INDEL特征;以部分健康样本的gDNA测序结果用于构建CVN事件的baseline,通过对baseline中的信息处理得到CNV特征;根据SNP/INDEL特征和CNV特征进行分类,绘制ROC曲线;S3、将SNP/INDEL特征和CNV特征进行整合,并通过支持向量机机器学习的算法建立膀胱癌早期筛查模型。2.根据权利要求1所述的构建方法,其特征在于,步骤S2中,对baseline中的信息处理得到CNV特征的步骤包括:对baseline中的信息进行归一化,计算出每个bin区间的log2ratio和Z

Score,其计算公式分别为:ratio = RC
gc

bin
/mean(RC
gc

all

bin
),RC
gc

bin
代表, 每个bin区间GC校正后的read数,mean(RC
gc

all

bin
), 统计所有bin区间GC校正后的read数的均数,log2ratio, ratio取以2为底log的对数;Z

Score = (ratio

E
(ref

ratio)
)/std
(ref

ratio)
,其中E
(ref

ratio) 为 cnv baseline每个bin的期望覆盖度,std
(ref

ratio)
为cnv baseline每个bin的覆盖度标准差;将得到的每个bin的log2ratio和Z

Score使用Circular binary segmentation(CBS)方法进行call segment,得到segment的最终log2ratio和Z

Score结果;其中以cutoff_1为0.08用于segment过滤。3.根据权利要求1所述的构建方法,其特征在于,步骤S2中,以cutoff_2值为8700000用于CNV特征的分类。4.根据权利要求1所述的构建方法,其特征在于,膀胱癌相关突变marker的分布基因包括基因TERT、基因TP53、基因ERBB2、基因ERCC2、基因FGFR3、基因KDM6A、基因PIK3CA、基因ARID1A、基因ERBB3、基因GATA3、基因BRCA2、基因CREBBP、基因CTNNB1、基因ELF3和基因FH中的任意一种或多种。5.根据权利要求4所述的构建方法,其特征在于,分布在基因TERT上的膀胱癌相关突变marker包括chr5:1295228

1295228,chr5:1295250

1295250和chr5:1295250

1295254中的任意一种或多种;分布在基因TP53上的膀胱癌相关突变marker包括chr17:7577127

7577127,chr17:7577505

7577505,chr17:7577527

7577527,chr17:7577535

7577535,chr17:7577538

7577538,chr17:7577539

7577539,chr17:7577545

7577545,chr17:7577548

7577548,chr17:7577559

7577559,chr17:7577568

7577568,chr17:7579313

7579313,chr17:7579328

7579328,chr17:7579365

7579365,chr17:7579391

7579391,chr17:7579406

7579406,chr17:7579415

7579415,chr17:7579431

7579431,chr17:7573982

7573982,
chr17:7573983

7573983chr17:7577574

7577574,chr17:7577596

7577596,chr17:7577599

7577599,chr17:7578382

7578382,chr17:7578419

7578419,chr17:7578437

7578437,chr17:7578442

7578442,chr17:7578513

7578513,chr17:7578524

7578524,chr17:7579340

7579340和chr17:7577571

7577584中的任意一种或多种;分布在基因ERBB2上的膀胱癌相关突变marker包括chr17:37873691

37873691,chr17:37879658

37879658,chr17:37880220

37880220,chr17:37880257

37880257,chr17:37880261

37880261,chr17:37880265

37880265,chr17:37880981

37880981,chr17:37881329

37881329,chr17:37883131

37883131,chr17:37883158

37883158,chr17:37883660

37883660,chr17:37884073

37884073,chr17:37863323

37863323,chr17:37864656

37864656和chr17:37864665

37864665中的任意一种或多种;分布在基因ERCC2上的膀胱癌相关突变marker包括chr19:45855817

45855817,chr19:45855824

45855824,chr19:45855835

45855835,chr19:45858086

45858086,chr19:45860556

45860556,chr19:45860733

45860733,chr19:45864859

45864881,chr19:45867571

45867571,chr19:45867584

45867584,chr19:45867687

45867687,chr19:45872189

45872189,chr19:45872213

45872213,chr19:45872219

45872219,chr19:45872362

45872362,chr19:45872380

45872380,chr19:45873425

45873425,chr19:45873455

45873455和chr19:45873456

45873456中的任意一种或多种;分布在基因FGFR3上的膀胱癌相关突变marker包括chr4:1803564

1803564,chr4:1803568

18...

【专利技术属性】
技术研发人员:楼峰王云凯周涛刘磊朱帅鹏孙宏曹善柏
申请(专利权)人:天津橡鑫生物科技有限公司天津橡鑫医疗器械有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1