The invention discloses a dimensionality reduction analysis method for DNA methylation spectrum of gastric cancer. By analyzing and selecting methylation sites with statistical significance, the methylation sites with no significant significance are filtered, and the DNA methylation sites with statistical significance of single factor and multi-factor are retained as seed methylation sites. The consistent clustering analysis is further used to obtain stable clustering. Results The number of molecular subtypes at the time of the results, and finally several cluster-specific methylation sites can be obtained by screening dimensionality reduction. The method can effectively reduce the dimensionality of high-dimensional and miscellaneous DNA methylation spectrum data, and select key DNA methylation sites from hundreds of thousands of DNA methylation sites as biomarkers, which is of great significance for gene research and drug development of gastric cancer.
【技术实现步骤摘要】
一种关于胃癌的DNA甲基化谱的降维分析方法
本专利技术涉及生物数据分析
,具体为一种关于胃癌的DNA甲基化谱的降维分析方法。
技术介绍
胃癌是起源于胃黏膜上皮的恶性肿瘤,在我国各种恶性肿瘤中发病率居首位,胃癌发病有明显的地域性差别,在我国的西北与东部沿海地区胃癌发病率比南方地区明显为高。好发年龄在50岁以上,男女发病率之比为2:1。由于饮食结构的改变、工作压力增大以及幽门螺杆菌的感染等原因,使得胃癌呈现年轻化倾向。目前研究揭示:胃癌是一种基因病,是由多种癌基因抗癌基因共同参与、多阶段多途径协同,使胃黏膜逐步发展到癌前病变,再发展到胃癌的这样一个演变过程。正常胃黏膜到癌前变过程及癌前变至胃癌过程皆存在特征性的差异表达基因,而分子病理学将分子杂交技术与组织形态学检测相融合,随着免疫组织化学及分子生物学的发展,胃癌的病理与免疫学及分子生物学研究之间越来越密不可分,目前已探索了许多与胃癌相关的基因及其蛋白质产物,早期发现这些基因及标志物为探讨胃癌发病机理开辟了新途径,更加能够揭示肿瘤组织的生长活性在肿瘤生长、浸润和转移方面的作用,随着基因芯片实验技术的日益成熟和完善 ...
【技术保护点】
1.一种关于胃癌的DNA甲基化谱的降维分析方法,其特征在于,包括以下步骤:(1)选取数据样本,并对数据样本进行预处理;(2)将步骤(1)中得到的数据中的甲基化位点带入单变量Cox比例风险回归模型,获取数据集;(3)对步骤(2)中得到的数据集的数据进行处理,根据显著性检验方法选择p<0.05作为阈值,获取到数据集A;(4)将步骤(1)中得到的数据集中的甲基化位点以生存数据作为协变量代入多因素Cox比例风险回归模型,获取数据集;(5)对步骤(4)中得到的数据集的数据进行处理,根据显著性检验方法选择p<0.05作为阈值,获取到数据集B;(6)取数据集A和数据集B的交集 ...
【技术特征摘要】
1.一种关于胃癌的DNA甲基化谱的降维分析方法,其特征在于,包括以下步骤:(1)选取数据样本,并对数据样本进行预处理;(2)将步骤(1)中得到的数据中的甲基化位点带入单变量Cox比例风险回归模型,获取数据集;(3)对步骤(2)中得到的数据集的数据进行处理,根据显著性检验方法选择p<0.05作为阈值,获取到数据集A;(4)将步骤(1)中得到的数据集中的甲基化位点以生存数据作为协变量代入多因素Cox比例风险回归模型,获取数据集;(5)对步骤(4)中得到的数据集的数据进行处理,根据显著性检验方法选择p<0.05作为阈值,获取到数据集B;(6)取数据集A和数据集B的交集作为种子甲基化位点;(7)对步骤(6)中的种子甲基化位点的数据集进行一致性聚类分析,并获取具有稳定的聚类结果时的分子亚型数目k;(8)对分子亚型和作为种子甲基化位点构建矩阵进行计算并设定阈值对数据进行筛选,最终获取数个簇特异性的甲基化位点,实现数据降维。2.根据权...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。