当前位置: 首页 > 专利查询>山东大学专利>正文

基于属性异质网络嵌入的癌症协同驱动通路识别系统技术方案

技术编号:37149693 阅读:23 留言:0更新日期:2023-04-06 22:04
本发明专利技术提供了一种基于属性异质网络嵌入的癌症协同驱动通路识别系统,整合突变数据,进行数据对齐和初步筛选;获得基因权重,优化基因通路关系;构建属性异质网络,重构通路交互网络;定义通路间的协同驱动能力判定协同驱动通路。本发明专利技术使用基于通路结构的基因权重对基因通路间的关系进行优化,重要基因可以对识别驱动通路产生更大的贡献,降低无关基因对结果的干扰;使用属性异质网络嵌入为通路水平分析提供了其他生物学分子相关的丰富遗传信息,弥补了通路水平相关生物学信息不充分/缺失的问题;定义的通路间协同驱动能力综合考虑了协同驱动通路的高覆盖性、高互斥性、突变共现和功能关联,能高效准确的识别协同驱动通路。能高效准确的识别协同驱动通路。能高效准确的识别协同驱动通路。

【技术实现步骤摘要】
基于属性异质网络嵌入的癌症协同驱动通路识别系统


[0001]本专利技术涉及人工智能数据挖掘分类及生物信息学
,特别涉及一种基于属性异质网络嵌入的癌症协同驱动通路识别系统。

技术介绍

[0002]本部分的陈述仅仅是提供了与本专利技术相关的
技术介绍
,并不必然构成现有技术。
[0003]近年来,随着高通量生物技术的发展,大型癌症基因组项目,如癌症基因组图谱(TCGA),基因组联盟(ICGC)等,产生和积累了丰富的高通量多组学癌症数据,为研究者从系统层面深入解析癌症机理提供了支撑。然而,仅依靠生物实验或者简单的统计分析方法,很难从大规模生物组学数据中准确的识别与特定癌症类别相关的驱动突变和驱动基因。因此,针对大规模疾病遗传数据,开发有效的计算方法实现精确高效的癌症驱动突变/基因集合识别,是当前癌症信息学研究的一项重大挑战。准确识别致癌遗传因子对癌症诊断,靶向药物开发以及癌症患者的精确、个性化治疗等诸多方面均有重要的理论和应用价值。早期的研究通常致力于寻找明显高频突变的基因作为驱动基因,但随着研究的深入,人们发现基因在通路内合作的驱动癌症的本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于属性异质网络嵌入的癌症协同驱动通路识别系统,其特征在于:包括:数据预处理模块,被配置为:整合拷贝数变异数据和单核苷酸多态性数据为突变数据,并在多组学属性异质数据上进行数据对齐和初步筛选,获得可用的异质数据;基因权重获取模块,被配置为:根据通路内部网络结构得到不同通路中基因的网络权重,并根据权重优化基因通路交互网络;属性异质网络嵌入模块,被配置为:根据收集到的多种生物学分子和通路对应的属性数据与关系数据构建初始的属性异质网络,通过收集的所研究癌症相关的miRNA以及优化的基因通路交互网络对初始属性异质网络进行优化,基于联合矩阵分解的嵌入框架集成异质数据,对优化后的属性异质网络进行嵌入,补充不完整的通路间关系,重构通路交互网络;协同驱动通路识别模块,被配置为:使用优化的基因通路交互网络得到对应每条通路的突变数据;依据驱动通路在突变数据上的高覆盖性和高互斥性定义单独驱动通路的驱动能力;依据重构的通路交互网络和突变共现定义通路间的协同驱动能力;结合通路的驱动能力和通路间的协同驱动能力定义综合驱动权重,在重构的通路交互网络上识别协同驱动通路。2.如权利要求1所述的基于属性异质网络嵌入的癌症协同驱动通路识别系统,其特征在于:拷贝数变异数据为:患者的拷贝数变异数据,数据为多维,每一维对应患者的一个基因位点,当发生拷贝数重复或缺失时该基因数据为1,拷贝数正常为0。3.如权利要求1所述的基于属性异质网络嵌入的癌症协同驱动通路识别系统,其特征在于:单核苷酸多态性数据为:患者的单核苷酸多态性数据,数据为多维,每一维对应患者的一个基因位点,当发生单核苷酸多态时该基因数据为1,未发生单核苷酸多态时为0。4.如权利要求1所述的基于属性异质网络嵌入的癌症协同驱动通路识别系统,其特征在于:异质数据包括:拷贝数变异数据和单核苷酸多态性数据,还包括:分为不同癌症亚型的单细胞基因表达数据,数据为多维,每一维对应不同亚型患者的一个基因位点,其值代表该基因的表达水平;基因交互网络,数据为多维,每一维对应一个基因,其值描述基因间共同参与信号传递、能量和物质代谢及细胞周期调控的相互作用强度。5.如权利要求1所述的基于属性异质网络嵌入的癌症协同驱动通路识别系统,其特征在于:整合拷贝数变异数据和单核苷酸多态性数据为突变数据,在多组学数据上进行基因对齐和初步筛选,包括:获取拷贝数变异数据和单核苷酸多态性数据,根据基因在批量样本上的突变情况整合拷贝数变异数据和单核苷酸多态性数据构建突变数据,当基因发生拷贝数变异或出现单核苷酸多态性时,对应突变数据的值为1;基于此前获得的突变数据,基于基因的突变频率和患者的实际情况数据,选择综合突变频率靠前的预设个数的基因。
6.如权利要求1所述的基于属性异质网络嵌入的癌症协同驱动通路识别系统,其特征在于:根据通路内部网络结构得到不同通路中基因的网络权重,并根据权重优化基因通路交互网络,包括:使用基因在通路内部有向图结构中的拓扑次序和度定义基因在通路上的网络权重,拓扑次序越靠前和度的值越高的基因具有更大的网络权重;根据该网络权...

【专利技术属性】
技术研发人员:王峻陈希余国先刘宁何伟
申请(专利权)人:山东大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1