【技术实现步骤摘要】
一种基于甲基化的肿瘤数据分析系统
[0001]本专利技术属于表观遗传数据分析领域,特别是涉及一种基于甲基化的肿瘤数据分析系统。
技术介绍
[0002]DNA甲基化代表着基本的表观遗传修饰,在细胞周期、细胞增殖、细胞凋亡、DNA复制、染色质结构和基因转录等生物过程中扮演着重要作用。在许多疾病中,如癌症、退行性疾病以及衰老等都表现出异常的甲基化模式影响疾病表型的变化。因此,以基因DNA甲基化水平的变化作为切入点探究疾病的分子分型或病理机制已成为表观遗传学中的研究热点。但目前针对于DNA甲基化数据的分析方法主要集中于假设检验为主的传统统计学分析方法和基于机器学习思想的特征选择算法识别差异甲基化位点或差异甲基化区域,未考虑在甲基化水平上,基因与基因之间的协同或拮抗作用。以基因表达数据作为计算基础应用机器学习算法或统计学方法构建有向基因调控关系已成为基因表达网络研究的主要趋势。而各种针对于时间序列的分析方法被广泛应用于时序基因共表达网络分析,且WGCNA算法被广泛应用于表型数据的关联分析,但WGCNA仍存在一定局限性,WGCNA算法作 ...
【技术保护点】
【技术特征摘要】
1.一种基于甲基化的肿瘤数据分析系统,其特征在于,包括:数据采集模块,用于采集肿瘤原始数据;数据处理模块,与所述数据采集模块连接,用于对所述肿瘤原始数据进行预处理,获得目标肿瘤数据;模型构建模块,与所述数据处理模块连接,用于构建甲基化加权基因调控网络,识别所述甲基化加权基因调控网络的基因模块;数据分析模块,分别与所述数据处理模块和所述模型构建模块连接,用于基于所述基因模块和所述目标肿瘤数据进行分析,获得分析结果。2.根据权利要求1所述的基于甲基化的肿瘤数据分析系统,其特征在于,所述肿瘤原始数据至少包括甲基化数据、临床样本数据。3.根据权利要求1所述的基于甲基化的肿瘤数据分析系统,其特征在于,所述数据处理模块包括第一处理单元、第二处理单元;所述第一处理单元用于清除低表达甲基化位点;所述第二处理单元用于识别差异甲基化基因。4.根据权利要求3所述的基于甲基化的肿瘤数据分析系统,其特征在于,所述第一处理单元通过针对癌组织和癌旁组织甲基化位点的β值,去除低表达甲基化位点;所述第二处理单元通过对同一甲基化位点在癌组织和癌旁组织的β值进行分析,当所述甲基化位点的β值变化达到预设阈值时,所述第二处理单元识别所述甲基化位点对应的基因为差异甲基化基因。5.根据权利要求1所述的基于甲基化的肿瘤数据分析系统,其特征在于,所述模型构建模块包括基因提取单元、特征降维单元、权重计算单元、网络构建单元;所述基因提取单元用于提取基因调控网络只包含差异甲基化基因...
【专利技术属性】
技术研发人员:付聪,宿晓云,易星丞,邱悦,赵天一,
申请(专利权)人:吉林大学第一医院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。