基于NGS技术的粪便DNA结直肠肿瘤多基因预测模型制造技术

技术编号:18391518 阅读:31 留言:0更新日期:2018-07-08 16:10
本发明专利技术提出了确定结直肠肿瘤细胞的方法和系统。所述方法包括:分别获得待测样本的KRAS基因和NDRG4基因,并将所述NDRG4基因进行甲基化处理;分别对所述KRAS基因和经甲基化处理的NDRG4基因进行测序,获得KRAS基因测序结果和NDRG4基因测序结果;将所述KRAS基因测序结果中第一目标靶点位置的基因序列与第一参考序列进行第一比对,计算出KRAS基因突变率;将所述NDRG4基因测序结果中第二目标靶点位置的基因序列与第二参考序列进行第二比对,计算出NDRG4基因甲基化连锁比率;基于所述KRAS基因突变率和NDRG4基因甲基化连锁比率,确定所述待测样本是否存在结直肠肿瘤细胞。利用本发明专利技术的方法及系统能够快速、简单且特异性检测出是否为结直肠肿瘤细胞,且灵敏度高。

Multi gene prediction model of fecal DNA colorectal tumor based on NGS Technology

The invention provides a method and a system for determining colorectal tumor cells. The methods include: obtaining the KRAS gene and NDRG4 gene of the samples to be measured, methylation of the NDRG4 gene, sequencing the KRAS gene and the NDRG4 gene treated by the methylation, and obtaining the KRAS gene sequencing results and the NDRG4 gene sequencing results. The first order of the KRAS gene sequencing result is the first order of the KRAS gene. The gene sequence of the target point position was compared with the first reference sequence, and the mutation rate of KRAS gene was calculated. The gene sequence of the second target target location of the NDRG4 gene sequencing results was compared with the second reference sequence, and the methylation linkage ratio of the NDRG4 gene was calculated. Based on the mutation rate and ND of the KRAS gene, the gene mutation rate and ND were calculated. The methylation linkage ratio of RG4 gene determines whether there are colorectal cancer cells in the samples to be tested. The method and system of the invention can detect the colorectal tumor cells quickly, simply and specifically, and has high sensitivity.

【技术实现步骤摘要】
基于NGS技术的粪便DNA结直肠肿瘤多基因预测模型
本专利技术涉及分子生物
具体地,基于NGS技术的粪便DNA结直肠肿瘤多基因预测模型。更具体地,本专利技术涉及基于KRAS和NDRG4基因确定结直肠肿瘤细胞的方法和系统。
技术介绍
结直肠肿瘤(Colorectalcancer,CRC)是常见的恶性肿瘤,包括结肠肿瘤和直肠肿瘤,又称大肠肿瘤,指发生在人体下消化道结肠或直肠部位的恶性肿瘤,是威胁人类健康的主要癌症之一,在全球范围内其发病率高居男性肿瘤第3位、女性第2位。在我国,随着社会经济的发展,居民生活习惯、饮食结构变化等,我国的结直肠肿瘤发病率和死亡率持续上升。2015年中国癌症统计数据显示,我国结直肠肿瘤新发病例和死亡病例均位于第5位,分别约为37.63万和19.10万,结直肠肿瘤发病率和死亡率高于全球平均水平和发展中国家,已成为严重危害中国人健康的疾病。结直肠肿瘤通常发展缓慢,大多数结直肠肿瘤在形成之前,已经以息肉或腺瘤的形式在发病部位缓慢发展长达10余年,这种生物学特点使结直肠肿瘤适于筛查且早期结直肠肿瘤手术后5年生存率可高达90%以上,而晚期则不足10%。目前用于结直肠肿瘤筛查的方法手段主要有结肠镜检查、粪便潜血检测等,但存在灵敏度低、特异性差或患者依从性低等方面的不足。因此,寻找一个灵敏度、特异性更佳且更高效的筛查方法,对结直肠肿瘤早诊早治具有重要意义。
技术实现思路
本专利技术旨在一定程度上解决现有技术中存在的技术问题至少之一。在本专利技术的一个方面,本专利技术提出了一种确定结直肠肿瘤细胞的方法。根据本专利技术的实施例,所述方法包括:分别获得待测样本的KRAS基因和NDRG4基因,并将所述NDRG4基因进行甲基化处理;分别对所述KRAS基因和经甲基化处理的NDRG4基因进行测序,获得KRAS基因测序结果、NDRG4基因测序结果;将所述KRAS基因测序结果中第一目标靶点位置的基因序列与第一参考序列进行第一比对,计算出KRAS基因突变率;将所述NDRG4基因测序结果中第二目标靶点位置的基因序列与第二参考序列进行第二比对,计算出NDRG4基因甲基化连锁比率;基于所述KRAS基因突变率和NDRG4基因甲基化连锁比率,确定所述待测样本是否存在结直肠肿瘤细胞。专利技术人研究发现,KRAS基因目标靶点和NDRG4基因目标靶点存在相互关联,进而基于KRAS基因目标靶点的突变率和NDRG4基因目标靶点的甲基化连锁比率,采用逻辑回归算法建立检测模型,从而能够快速、简单且特异性检测出是否存在结直肠肿瘤细胞,且灵敏度高。在肿瘤研究中,KRAS基因是一个原癌基因,对肿瘤的发生、发展、增殖、转移及血管形成发挥关键作用。KRAS基因突变后其编码的蛋白会丧失功能,从而刺激细胞自发性生长、分化。研究发现KRAS基因的突变在结直肠肿瘤发生发展中起着重要作用,提示KRAS基因可能成为结直肠肿瘤的一个新的诊断靶点。在本专利技术中,将KRAS基因测序结果中的第一目标靶点位置的基因序列与第一参考序列(SEQIDNO:1)进行比对,以便获得突变率,用于后续算法判定。SEQIDNO:1所示的基因序列如下所示:AAAGAATGGTCCTGCACCAGTAATATGCATATTAAAACAAGATTTACCTCTATTGTTGGATCATATTCGTCCACAAAATGATTCTGAATTAGCTGTATCGTCAAGGCACTCTTGCCTACGCCACCAGCTCCAACTACCACAAGTTTATATTCAGTCATTTTCAGCAGGCCT目前普遍认为,DNA甲基化与癌症的发生有密切关系。癌症的甲基化异常表现为总体的甲基化水平降低与启动子区域的甲基化水平升高。例如,抑癌基因与修复基因的高甲基化会导致它们的失活,造成肿瘤抑制丧失与基因损伤增加。NDRG4为抑癌基因NDRG基因家族成员。研究发现NDRG4基因甲基化是结直肠肿瘤的重要生物学特征,因此NDRG4启动子的甲基化可作为生物标志物,用于检测结直肠肿瘤。在本专利技术中,预先将NDRG4基因进行甲基化处理,所有未发生甲基化的胞嘧啶被转化为尿嘧啶,而甲基化的胞嘧啶不变。在后续测序过程中,尿嘧啶全部转化为胸腺嘧啶。进而,通过对经甲基化处理的NDRG4基因测序结果中第二目标靶点位置的基因序列与第二参考序列(SEQIDNO:2)进行比对,统计非甲基化位点的C/T比值,以便计算出甲基化转化率。进一步地,为了减少转化率对于检测结果的影响,使用连锁甲基化位点来作为判断基因片段是否发生甲基化的统计指标,即统计每条读段中所有目标靶点是否同时发生甲基化的情况,作为连锁指标,计算发生连锁甲基化的读段占总读段的比率,得到甲基化连锁比率。SEQIDNO:2所示的基因序列如下所示:AGGTTTTTGAGTTTTTGGTTTTTTTCGATTTTAAGGGTTTTTTTTTTTCGGTTTTTAGGCGGCGACGGCGGGTAGCGCGAAGTAGTAGGCGTAGGGGCGTTGGGATGGGGATGTTTTTGTAGGTTTA根据本专利技术的实施例,上述确定结直肠肿瘤细胞的方法还可以进一步具有下列附加技术特征:根据本专利技术的实施例,基于下列标准,确定所述待测样本是否存在结直肠肿瘤细胞:KRAS基因突变率大于0.0021且NDRG4基因甲基化连锁比率大于0.00115,是所述待测样本存在结直肠肿瘤细胞的指示;KRAS基因突变率不大于0.0021或NDRG4基因甲基化连锁比率不大于0.00115,是所述待测样本不存在结直肠肿瘤细胞的指示。专利技术人采集大量样本进行测序,同时收集临床和病理信息,综合分析基因组测序结果和临床信息,利用生物统计学分析方法,获得上述算法。由此,利用本专利技术的方法能够快速、简单且特异性检测出是否存在结直肠肿瘤细胞,且灵敏度高。根据本专利技术的实施例,所述第一目标靶点选自2号外显子的第12密码子和第13密码子。专利技术人发现,结直肠肿瘤细胞与正常细胞的上述靶点存在显著差异。为此,通过检测上述靶点的突变率,能够特异性确定是否存在结直肠肿瘤细胞。根据本专利技术的实施例,所述第二目标靶点选自启动子区沿基因转录方向上游引物开始计算的第6和第14个CpG位置(NC_000016.9:58497140,58497161)。专利技术人发现,结直肠肿瘤细胞的上述靶点的甲基化程度较高,进而,通过对待测样本的NDRG4基因进行甲基化处理,所有未发生甲基化的胞嘧啶被转化为尿嘧啶,而甲基化的胞嘧啶不变。将经甲基化处理的上述靶点位置基因序列与第二参考序列进行比对,从而计算出甲基化转化率。进一步地,为了减少转化率对于检测结果的影响,使用连锁甲基化位点来作为判断基因片段是否发生甲基化的统计指标,即统计每条读段中第6,14号甲基化位点是否同时发生甲基化的情况,作为连锁指标,计算发生连锁甲基化的读段占总读段的比率,得到甲基化连锁比率。根据本专利技术的实施例,所述待测样本来源于粪便。根据本专利技术的具体实施例,所述结直肠肿瘤细胞为肠道上皮肿瘤细胞,优选人源肠道上皮肿瘤细胞。目前在结直肠肿瘤筛查中用到较多的方法是大便隐血试验和肠镜检查,大便隐血试验主要是通过检测粪便中的血液成分,主要是血红蛋白,若多次、持续的阳性反应提示消化道出血,应该进一步做肠镜检查。大便隐血试验的优点是快速、本文档来自技高网...

【技术保护点】
1.一种确定结直肠肿瘤细胞的方法,其特征在于,包括:分别获得待测样本的KRAS基因和NDRG4基因,并将所述NDRG4基因进行甲基化处理;分别对所述KRAS基因和经甲基化处理的NDRG4基因进行测序,获得KRAS基因测序结果和NDRG4基因测序结果;将所述KRAS基因测序结果中第一目标靶点位置的基因序列与第一参考序列进行第一比对,计算出KRAS基因突变率;将所述NDRG4基因测序结果中第二目标靶点位置的基因序列与第二参考序列进行第二比对,计算出NDRG4基因甲基化连锁比率;基于所述KRAS基因突变率和NDRG4基因甲基化连锁比率,确定所述待测样本是否存在结直肠肿瘤细胞。

【技术特征摘要】
1.一种确定结直肠肿瘤细胞的方法,其特征在于,包括:分别获得待测样本的KRAS基因和NDRG4基因,并将所述NDRG4基因进行甲基化处理;分别对所述KRAS基因和经甲基化处理的NDRG4基因进行测序,获得KRAS基因测序结果和NDRG4基因测序结果;将所述KRAS基因测序结果中第一目标靶点位置的基因序列与第一参考序列进行第一比对,计算出KRAS基因突变率;将所述NDRG4基因测序结果中第二目标靶点位置的基因序列与第二参考序列进行第二比对,计算出NDRG4基因甲基化连锁比率;基于所述KRAS基因突变率和NDRG4基因甲基化连锁比率,确定所述待测样本是否存在结直肠肿瘤细胞。2.根据权利要求1所述的方法,其特征在于,基于下列标准,确定所述待测样本是否存在结直肠肿瘤细胞:KRAS基因突变率大于0.0021且NDRG4基因甲基化连锁比率大于0.00115,是所述待测样本存在结直肠肿瘤细胞的指示;KRAS基因突变率不大于0.0021或NDRG4基因甲基化连锁比率不大于0.00115,是所述待测样本不存在结直肠肿瘤细胞的指示。3.根据权利要求1所述的方法,其特征在于,所述第一目标靶点选自2号外显子的第12密码子和第13密码子。4.根据权利要求1所述的方法,其特征在于,所述第二目标靶点选自启动子区沿基因转录方向上游引物开始计算的第6和第14个CpG位置。5.根据权利要求1所述的方法,其特征在于,所述待测样本来源于粪便。6.根据权利要求1所述...

【专利技术属性】
技术研发人员:毛瑞芳陈璟王云霞王君秦楠
申请(专利权)人:上海锐翌生物科技有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1