System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及结肠癌诊断标记物领域,具体涉及一种用于结肠癌早期诊断甲基化诊断标志物的筛选方法及装置。
技术介绍
1、结肠癌是最常见的恶性肿瘤之一,也是癌症死亡的第三大原因。目前结直肠癌的治疗决策主要依赖于tnm分期等病理指标,结肠癌分期标准中将ⅰ期患者界定为早期结肠癌,ⅱ/ⅲ期患定为进展期结肠癌,ⅳ期患者为晚期结肠癌。现有的结肠癌预防和治疗手段有限,虽然包括手术、化疗和生物抗体治疗在内的许多治疗方法被用于治疗这种类型的癌症,五年生存率仍然相对较差,医疗诊治过程中就诊晚、缺乏可靠的生物标志物和不精准的治疗靶点,以及结肠癌患者之间的异质性均影响了患者的预后和生活质量。
2、以往的临床研究表明,近90%早期诊断的结肠癌患者可延长5至10年的生存率,而晚期诊断时只有12%的患者能够存活,这凸显了早期诊断结肠癌的重要性。如今,已经开发了几种用于早期检测结肠癌的临床方法,包括粪便潜血检测、计算机断层扫描、结肠镜检查和分子肿瘤标志物。然而已有研究证实这些方法在结肠癌的检测中价值有限,例如,很早已经报道的粪便免疫组化的结果在癌症诊断时产生了假阴性,计算机断层扫描对t1或t2肿瘤诊断的敏感性较低。所以结肠癌的诊断需要不断扩充新的方法和技术,包括是否可以通过血液中肿瘤标志物的检测来实现。
3、最新研究表明,癌症是一种具有异质性的恶性疾病,不仅在遗传方面表现出异质性,在表观遗传方面也具有强烈的异质性,除了遗传变异以外,紊乱的、不平衡的表观遗传改变也是癌症发生发展的重要原因。dna甲基化是表观遗传学中最重要的调控机制之一,与基因
4、随着下一代测序技术的不断完善和发展,大量肿瘤样本的全基因组规模测序已经增加,包括dna甲基化。目前已有许多研究发现了结肠癌中的关键甲基化基因并探索了这些基因在结肠癌中的应用价值。大量证据表明了结肠癌患者的生存状态受环境和遗传因素两方面影响,非正常dna甲基化的发生在结肠癌的发展过程中起关键作用,非正常dna甲基化可以通过影响相关基因表达,进而导致基因产物异常,相关通路失调,最终将会影响癌症进展。
5、现有的基于dna甲基化的结肠癌分子标志物筛选方法,其获得的分子标志物在结肠癌早期诊断时准确性不足,而且产生了假阴性。因此研究将对结肠癌早期诊断重要意义。
技术实现思路
1、本专利技术是要解决现有筛选方法获得的结肠癌分子标志物在结肠癌早期诊断时准确性不足,产生假阴性的问题,提供一种用于结肠癌早期诊断甲基化诊断标志物的筛选方法及装置。
2、本专利技术用于结肠癌早期诊断甲基化诊断标志物的筛选方法,包括以下步骤:
3、步骤一、利用数据库,获取人甲基化450芯片结肠癌样本中位于启动子区的dna甲基化谱,对dna甲基化谱进行预处理,然后针对结肠癌癌症组织和癌旁组织的dna甲基化谱,采用r语言t.test()函数对两组样本进行dna甲基化差异位点筛选,获得具有显著差异表达的dna甲基化位点;将获得的差异表达的dna甲基化位点根据450芯片的注释文件对应到基因上,从而得到差异dna甲基化基因;
4、步骤二、根据ajcc分期标准,将步骤一得到的差异dna甲基化基因分为正常、前期、进展期的三组差异dna甲基化谱,然后构建新的正常、前期、进展期的三组dna甲基化谱;
5、步骤三、将新的正常、前期、进展期的三组dna甲基化谱样本分别按照7:3随机的分为训练集和测试集,然后通过t检验结合fold change值,在三组训练集与三组测试集中分别两两进行差异dna甲基化基因的识别,共求得六组dna差异甲基化基因;
6、将六组dna差异甲基化基因,按照上调基因组与下调基因组分别取交集,共获得三组上调差异dna甲基化基因与三组下调差异dna甲基化基因;然后将三组上调差异dna甲基化基因与三组下调差异dna甲基化基因分别取交集,从而获得了结肠癌正常、前期与进展期差异dna甲基化基因;
7、步骤四、将步骤三获得的结肠癌正常、前期与进展期差异dna甲基化基因按7:3分为训练集与测试集。根据训练集中每个基因在正常样本中甲基化的均值,以及在进展期样本中甲基化的均值,将训练集与测试集中的样本进行分组,认为大于正常样本均值的为第一类,在正常样本均值与进展期样本均值之间的为第二类,小于进展期样本均值的样本认为是第三类,由此得到训练集与测试集样本分组数据;
8、步骤五、使用步骤四分组后的训练集数据,利用随机森林算法建立预测模型,并通过基因的基尼指数的变化程度来进行特征贡献度衡量,按照基尼指数改变量的大小将基因排序,逐步减少投入模型训练数据中的基因,进行模型的重新构建,使用auc值刻画模型性能,通过结合模型的auc值与模型中包含的基因数确定最终诊断模型所包含的基因,从而得到了结肠癌的甲基化诊断标志物。
9、进一步的,步骤一中结肠癌样本抽样方法为:
10、在癌症组织样本中进行随机抽样,每次抽样数为癌旁组织样本的个数,抽样次数为1000次;每次抽样得到的样本进行dna甲基化差异位点筛选,差异位点的交集为最终的差异表达的dna甲基化位点。
11、进一步的,步骤一中具有显著差异表达的dna甲基化位点的条件为:
12、(1)使用benjamini-hochberg方法对p值进行校正,校正后的fdr<0.05为有显著性差异;
13、(2)两组样本间dna甲基化水平β值的均值差>0.2,被认为是样本间显著差异dna甲基化位点。
14、其中,步骤(1)中通过t检验获取p值,其中t检验过程为:对不同组的dna甲基化位点水平使用t检验进行差异甲基化位点筛选。t检验的公式为:
15、
16、
17、其中,i=1...n,是样本的每一个基因的平均值,μ为另一类样本的基因平均值,σx为样本的标准偏差。
18、进一步的,步骤二中新的正常、前期、进展期的三组dna甲基化谱的构建方法为:
19、(1)应用qdmr软件对正常、前期、进展期的三组差异dna甲基化谱分别基于香农信息熵计算每个差异dna甲基化基因的熵值h0;本文档来自技高网...
【技术保护点】
1.用于结肠癌早期诊断甲基化诊断标志物的筛选方法,其特征在于,该方法包括以下步骤:
2.根据权利要求1所述的用于结肠癌早期诊断甲基化诊断标志物的筛选方法,其特征在于,步骤一中结肠癌样本抽样方法为:
3.根据权利要求1或2所述的用于结肠癌早期诊断甲基化诊断标志物的筛选方法,其特征在于,步骤一中具有显著差异表达的DNA甲基化位点的条件为:
4.根据权利要求3所述的用于结肠癌早期诊断甲基化诊断标志物的筛选方法,其特征在于,步骤(1)中通过T检验获取P值,其中T检验过程为:对不同组的DNA甲基化位点水平使用t检验进行差异甲基化位点筛选。t检验的公式为:
5.根据权利要求1所述的用于结肠癌早期诊断甲基化诊断标志物的筛选方法,其特征在于,步骤二中新的正常、前期、进展期的三组DNA甲基化谱的构建方法为:
6.根据权利要求1所述的用于结肠癌早期诊断甲基化诊断标志物的筛选方法,其特征在于,步骤三中Fold Change值的计算公式如下:
7.根据权利要求1所述的用于结肠癌早期诊断甲基化诊断标志物的筛选方法,其特征在于,步骤五中
8.根据权利要求1所述的用于结肠癌早期诊断甲基化诊断标志物的筛选方法,其特征在于,当AUC值大于0.9而且模型中包含基因少于5个时,作为最终诊断模型的基因集。
9.一种存储介质,其特征在于,所述存储介质中存储有至少一条指令,所述至少一条指令由处理器加载并执行以实现如权利要求1至8之一所述的用于结肠癌早期诊断甲基化诊断标志物的筛选方法。
10.一种用于结肠癌早期诊断甲基化诊断标志物筛选的装置,其特征在于,所述装置包括处理器和存储器,所述存储器中存储有至少一条指令,所述至少一条指令由处理器加载并执行以实现如权利要求1至8之一所述的用于结肠癌早期诊断甲基化诊断标志物的筛选方法。
...【技术特征摘要】
1.用于结肠癌早期诊断甲基化诊断标志物的筛选方法,其特征在于,该方法包括以下步骤:
2.根据权利要求1所述的用于结肠癌早期诊断甲基化诊断标志物的筛选方法,其特征在于,步骤一中结肠癌样本抽样方法为:
3.根据权利要求1或2所述的用于结肠癌早期诊断甲基化诊断标志物的筛选方法,其特征在于,步骤一中具有显著差异表达的dna甲基化位点的条件为:
4.根据权利要求3所述的用于结肠癌早期诊断甲基化诊断标志物的筛选方法,其特征在于,步骤(1)中通过t检验获取p值,其中t检验过程为:对不同组的dna甲基化位点水平使用t检验进行差异甲基化位点筛选。t检验的公式为:
5.根据权利要求1所述的用于结肠癌早期诊断甲基化诊断标志物的筛选方法,其特征在于,步骤二中新的正常、前期、进展期的三组dna甲基化谱的构建方法为:
6.根据权利要求1所述的用于结肠癌早期诊断甲基化诊断标志物的筛选...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。