一组肺癌DNA甲基化分子标志物及其在制备用于肺癌早期诊断试剂盒中的应用制造技术

技术编号:28823116 阅读:15 留言:0更新日期:2021-06-11 23:16
本发明专利技术公开了一组肺癌的DNA甲基化分子标志物及其在制备用于肺癌早期诊断试剂盒中的应用。所述标志物是20个基因CDO1,SOX17,TCF21,TRIM58,ITGA9,CYYR1,CLEC14A,SLIT2,ZNF677,IRX2,ACVRL1,OSR1,ADCY8,GALNT13,HSPB6,IRX1,ITGA5,PCDH17,TBX5和TCTEX1D1序列的甲基化。其中8个是在肺癌中新发现的甲基化指纹基因,包括ADCY8,GALNT13,HSPB6,IRX1,ITGA5,PCDH17,TBX5和TCTEX1D1。以本发明专利技术标志物为基础,构建肺癌诊断的数学模型;该模型灵敏度高,特异性好,AUC可高达0.998,诊断效果良好。本发明专利技术还公开了检测所述DNA甲基化标志物的方法。本发明专利技术公开的DNA甲基化分子标志物具有良好的诊断指标特性,可以有效用于肺癌诊断,具有较高的临床使用和推广价值。

【技术实现步骤摘要】
一组肺癌DNA甲基化分子标志物及其在制备用于肺癌早期诊断试剂盒中的应用
本专利技术涉及生物检测
,具体涉及一组肺癌的DNA甲基化分子标志物及其在制备用于肺癌诊断试剂盒中的应用。
技术介绍
肺癌是威胁人群健康和生命的最大的恶性肿瘤之一,2020年全球约有180万人死于肺癌,死亡率远超其他类型癌症,位居第一;也是我国发病率和死亡率最高的肿瘤。肺癌主要分成两类:非小细胞肺癌(NSCLC)和小细胞肺癌。NSCLC是最主要类型,占总肺癌80%以上。NSCLC主要包括两个亚型即腺癌和鳞状细胞癌。腺癌占所有肺癌类型的40%,约占NSCLC的55%左右。非小细胞肺癌增殖、侵袭速度较慢,因此更不容易被发现和诊断。大部分非小细胞肺癌患者被确诊时,都已经发展为肿瘤的中晚期,错过绝佳的治疗时间。在我国,肺癌的早期诊断率只有15%,但是这些肺癌病人5年生存率可达到50%~60%,显著高于平均水平15%。因此,在肺癌发生早期进行鉴别诊断,并开展针对性治疗是解决肺癌这一重大难题的重要途径。生物标志物是指能将机体的生理和疾病状态区分开来的生物分子,筛选到可用于疾病早期发现、早期诊断的生物标志物可大大提高患者的临床治疗效果。近年来,随着研究的深入,研究者发现DNA序列变异之外的调控机制,例如DNA甲基化调控机制,在肿瘤发生发展过程中扮演重要角色。DNA甲基化是一种重要的表观遗传学修饰,同时也是一种被广泛研究的表观遗传学标记;其作为标记物非常稳定,可通过荧光定量PCR进行非常灵敏的检测,因而有望成为继血清蛋白后新一代的分子标志物。本研究团队通过对18对非小细胞肺癌样本(肿瘤和匹配的癌旁组织)进行全基因组简化甲基化测序(RRBS)和转录组测序(RNA-seq),对两个组学的数据进行整合分析,构建了肺癌DNA差异甲基化区域图谱,挖掘异常甲基化基因,并进一步通过机器学习方法筛选出了肺癌诊断的20个DNA甲基化的基因指纹(genesignature)。利用这20个基因的DNA甲基化指纹能非常有效区分公共数据集TCGA肺腺癌和肺鳞癌中的肿瘤和正常组织,这些标志物将有望成为肺癌诊断筛查的重要手段。
技术实现思路
本专利技术的目的在于通过高通量甲基化测序数据和RNA-seq测序数据的整合分析,进一步结合机器学习方法,提供一组肺癌DNA甲基化分子标志物及其在制备用于肺癌早期诊断试剂盒中的应用。本专利技术的目的是通过以下技术方案来实现的,一组肺癌DNA甲基化分子标志物,所述标志物包括如下20个基因至少一个的甲基化:CDO1,SOX17,TCF21,TRIM58,ITGA9,CYYR1,CLEC14A,SLIT2,ZNF677,IRX2,ACVRL1,OSR1,ADCY8,GALNT13,HSPB6,IRX1,ITGA5,PCDH17,TBX5和TCTEX1D1。进一步地,所示分子标志物通过以下方法获取:(1)RRBS和RNA-seq测序文库构建及测序:首先分别分离出每个病人肺肿瘤组织及其相邻正常肺组织样品中的总DNA,用MspI对基因组进行酶切;对产生的DNA片段进行末端修复;在末端修复后的3’末端添加碱基A;将DNA片段粘性末端A上连接甲基化接头。然后,选择40-220bp大小的DNA片段;将选择的片段进行重亚硫酸盐处理,使DNA片段中非甲基化的胞嘧啶转化为胸腺嘧啶,经PCR扩增后转变为尿嘧啶;将经过转换的目的片段进行PCR扩增;分离纯化扩增产物,即得到RRBS测序文库。利用标准Illumina测序试剂进行RNA-Seq文库构建。测序文库质检合格之后上机进行双端测序,得到测序原始数据。(2)测序数据分析:对步骤(1)得到的测序原始数据进行质检。将经过质检的RRBS读段和RNA-seq读段分别用bismark和hisat2工具比对到人类参考基因组上,获得全基因组上的甲基化图谱和表达水平信息。(3)检测差异甲基化区域(DMR)和差异表达基因(DEG):对步骤(2)得到的甲基化数据进行聚类分析,然后使用metilene,利用二元分割算法,从肿瘤组织和正常组织中筛选鉴别出差异甲基化区域(DMRs),最后,采用Wilcoxon秩和检验方法对候选的DMRs进行统计检验。对于转录本数据,用DESeq、edgeR等R程序包鉴定肿瘤组织和正常组织之间的差异表达基因(DEG)。(4)挖掘肺癌候选甲基化驱动基因:首先将DMRs数据根据基因组信息注释到基因的功能区间,进行注释分类;然后提取启动子区域(TSS上游或者下游2kb区域范围)的DMR和相应转录起始位点对应DEG的表达数据进行相关性分析,选择负相关关系统计显著的基因作为异常甲基化驱动候选基因。(5)机器学习筛选肺癌诊断的DNA甲基化基因指纹:从TCGA公共数据库中下载肺腺癌(LUAD)和肺鳞癌(LUSC)患者的甲基化和表达谱数据,利用这两个数据集对步骤(4)筛选出的甲基化驱动基因的甲基化和表达之间的关联性进行独立验证,进一步筛选出可靠的甲基化驱动基因。本专利技术还提供了一种上述DNA甲基化分子标志物在制备用于肺癌早期诊断试剂盒中的应用。进一步地,以筛选出的20个基因的DNA甲基化指纹为基础,采用随机森林(RF)方法构建肺癌诊断的数学模型,使用ROC曲线及曲线下面积(AUC)来评价筛选效果。本专利技术的有益效果是:以本专利技术标记物为基础,构建肺癌诊断的数学模型;该模型灵敏度高,特异性好,AUC可高达0.998,诊断效果良好。综上所述,本专利技术公开的DNA甲基化分子标志物具有良好的诊断指标特性,可以有效用于肺癌诊断,具有较高的临床应用和推广价值。附图说明图1是本专利技术的一个实施例流程图。图2是肺癌组织与癌旁组织的甲基化图谱特征(A)肺癌组织和癌旁组织中全基因组CpG位点聚类分析图。(B)肺癌组织和癌旁组织中全基因组CpG位点主成分分析图。图3是20个基因DNA甲基化指纹的甲基化和表达图谱特征及其在鉴别TCGA中肺肿瘤组织和癌旁正常组织中的表现。(A)18对非小细胞肺癌及其癌旁组织的甲基化和mRNA表达谱;(B)TCGA肺腺癌中ROC分析;(C)TCGA肺鳞癌中ROC分析。20基因的甲基化指纹能准确区分肿瘤和正常组织。具体实施方式下面通过具体实施例子对本专利技术作进一步阐述,应该说明的是,下述说明仅是为了解释本专利技术,并不对其内容进行限定。如图1所示,本专利技术分子标志物的获取方法如下:1、测序文库构建及高通量测序:收集18个I期非小细胞肺癌样本,分别分离出每个病人肺肿瘤组织及其相邻正常肺组织样品中的总DNA,用MspI对基因组进行酶切;然后对产生的DNA片段进行末端修复;在末端修复后的3’末端添加碱基A;将DNA片段粘性末端A上连接甲基化接头;然后选择40-220bp大小的DNA片段;将选择的片段进行重亚硫酸盐处理,这样可以将DNA片段中非甲基化的胞嘧啶转化为胸腺嘧啶,经PCR扩增后转变为尿嘧啶;将经过转换的目的片段进行PCR扩增;分离纯化扩增产物,即得到RRBS测序文库。利用标准Illumina测本文档来自技高网
...

【技术保护点】
1.一组肺癌DNA甲基化分子标志物,其特征在于,所述标志物包括如下20个基因至少一个的甲基化:CDO1,SOX17,TCF21,TRIM58,ITGA9,CYYR1,CLEC14A,SLIT2,ZNF677,IRX2,ACVRL1,OSR1,ADCY8,GALNT13,HSPB6,IRX1,ITGA5,PCDH17,TBX5和TCTEX1D1。/n

【技术特征摘要】
1.一组肺癌DNA甲基化分子标志物,其特征在于,所述标志物包括如下20个基因至少一个的甲基化:CDO1,SOX17,TCF21,TRIM58,ITGA9,CYYR1,CLEC14A,SLIT2,ZNF677,IRX2,ACVRL1,OSR1,ADCY8,GALNT13,HSPB6,IRX1,ITGA5,PCDH17,TBX5和TCTEX1D1。


2.根据权利要求1所述一组肺癌DNA甲基化分子标志物,其特征在于,所述标志物通过以下方法获取:
(1)RRBS和RNA-seq测序文库构建及测序:首先分别分离出每个病人肺肿瘤组织及其相邻正常肺组织样品中的总DNA,用MspI对基因组进行酶切;对产生的DNA片段进行末端修复;在末端修复后的3’末端添加碱基A;将DNA片段粘性末端A上连接甲基化接头。然后,选择40-220bp大小的DNA片段;将选择的片段进行重亚硫酸盐处理,使DNA片段中非甲基化的胞嘧啶转化为胸腺嘧啶,经PCR扩增后转变为尿嘧啶;将经过转换的目的片段进行PCR扩增;分离纯化扩增产物,即得到RRBS测序文库。利用标准Illumina测序试剂进行RNA-Seq文库构建。测序文库质检合格之后上机进行双端测序,得到测序原始数据。
(2)测序数据分析:对步骤(1)得到的测序原始数据进行质检。将经过质检的RRBS读段和RNA-seq读段分别用bismark和hisat2工具比对到人类参考基因组上,获得全基因组上的甲基化图谱和表达水平信息。
(3)检测...

【专利技术属性】
技术研发人员:陆燕孙喜伟周莉媛刘鹏渊陈恩国
申请(专利权)人:浙江大学医学院附属妇产科医院
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1