基于肿瘤样本的多组学联合分析方法和系统技术方案

技术编号:34967513 阅读:46 留言:0更新日期:2022-09-17 12:48
本申请公开了基于肿瘤样本的多组学联合分析方法和系统,涉及肿瘤致病机制分析领域,根据肿瘤样本的转录组学数据构建共表达基因模块;基于肿瘤样本的基因组数据获取SCNV基因列表;对共表达基因模块中的基因和SCNV基因列表中的基因进行相关性分析,生成SCNV基因列表中基因的评分结果,进而利用GO注释和快速功能注释从SCNV基因列表中获取肿瘤的致病新发基因;基于肿瘤核心通路变化因子构建肿瘤致病新发基因调控网络;最后验证肿瘤的致病新发基因。本申请通过基因组数据和转录组数据的联合分析,挖掘了肿瘤致病驱动的候选调控因子,对由转录调控影响变化而造成的疾病进展,疾病发病机制的调控关系,揭示肿瘤的肿瘤新发基因。揭示肿瘤的肿瘤新发基因。揭示肿瘤的肿瘤新发基因。

【技术实现步骤摘要】
基于肿瘤样本的多组学联合分析方法和系统


[0001]本申请涉及肿瘤致病机制分析领域,特别涉及一种基于肿瘤样本的多组学联合分析方法和系统。

技术介绍

[0002]肿瘤的治疗一直是医学不断探索的领域,而对于肿瘤致病机制的调控关系,以及致病因子的分析是肿瘤治疗及预后的关键所在。
[0003]基于肿瘤样本基因测序数据和样本的表达量数据的联合分析,挖掘肿瘤致病驱动的候选调控因子。这类分析的本质是基于样本的基因组学数据和转录组数据的联合分析,找出基因组学不同类型的调控因子(顺式作用元件)对转录组学层面基因表达量(反式作用因子)的调控关系。基于多组学数据联合分析进行肿瘤致病驱动的候选调控因子的挖掘可以确定不同的基因组变异事件对基因转录表达层面的影响,可以为肿瘤的发病机制以及致病因子的提供新思路。

技术实现思路

[0004](一)申请目的基于此,本申请通过基因组数据和转录组数据的联合分析,挖掘了肿瘤致病驱动的候选调控因子,对由转录调控影响变化而造成的疾病进展,疾病发病机制的调控关系,揭示了新的肿瘤致病基因。本申请公开了以下技术方案。
[0005](二)技术方案本申请公开了一种基于肿瘤样本的多组学联合分析方法,其特征在于,包括:根据肿瘤样本的转录组学数据构建共表达基因模块;基于肿瘤样本的基因组数据获取SCNV基因列表;对所述共表达基因模块中的基因和所述SCNV基因列表中的基因进行相关性分析,生成SCNV基因列表中基因的评分结果;基于所述评分结果,利用GO注释和快速功能注释从所述SCNV基因列表中获取肿瘤的致病新发基因;基于肿瘤核心通路变化因子构建肿瘤致病新发基因调控网络;基于所述肿瘤致病新发基因调控网络验证所述肿瘤的致病新发基因。
[0006]在一种可能的实施方式中,所述根据肿瘤样本的转录组学数据构建共表达基因模块,包括:根据肿瘤样本的转录组学数据生成差异表达基因列表;将所述差异表达基因列表中的差异表达基因进行聚类,得到若干基因簇;基于所述基因簇的软阈值构建基因簇共表达网络;重构所述基因簇共表达网络中的基因,生成共表达基因模块。
[0007]在一种可能的实施方式中,所述肿瘤样本的转录组学数据为RNA

seq的表达量数
据。
[0008]在一种可能的实施方式中,所述RNA

seq的表达量数据为RPKM数。
[0009]在一种可能的实施方式中,所述将所述差异表达基因列表中的差异表达基因进行聚类采用的聚类方法为双向聚类法。
[0010]在一种可能的实施方式中,所述重构所述基因簇共表达网络中的基因,生成共表达基因模块,包括:利用相异度算法对所述基因簇共表达网络中的基因进行层次聚类;基于所述层次聚类结果,建立分层聚类树;将所述分层聚类树剪切成若干模块并进行模块合并,生成若干个共表达基因模块。
[0011]在一种可能的实施方式中,所述将所述分层聚类树剪切成若干模块利用动态剪切法。
[0012]在一种可能的实施方式中,所述进行模块合并具体为,将相关性系数大于0.75的模块进行合并。
[0013]在一种可能的实施方式中,所述对所述共表达基因模块中的基因和所述SCNV基因列表中的基因进行相关性分析,生成SCNV基因列表中基因的评分结果,包括:利用决策树分析法对所述共表达基因模块中的基因和所述SCNV基因列表中的基因进行相关性分析,生成SCNV基因列表中基因的初步评分结果;根据CNV的拷贝类型对SCNV扩增基因和SCNV缺失基因按照评分进行排序,生成SCNV基因列表中基因的评分结果;其中,所述评分结果包括SCNV扩增基因评分结果和SCNV缺失基因评分结果。
[0014]在一种可能的实施方式中,所述SCNV基因列表中基因的评分越高,与所述共表达模块中的基因的相关性越高。
[0015]在一种可能的实施方式中,所述基于所述评分结果,利用GO注释和快速功能注释从所述SCNV基因列表中获取肿瘤的致病新发基因,包括:利用GO注释工具选取第一致病新发基因;将进行标注的所述第一致病新发基因输入ICMDB数据库进行快速功能注释,获取肿瘤的致病新发基因。
[0016]在一种可能的实施方式中,还包括:结合临床样本的预后及生存数据,对所述肿瘤的致病新发基因进行验证。
[0017]作为本申请的第二方面,本申请还公开了一种基于肿瘤样本的多组学联合分析系统,包括:基因构建模块,用于根据肿瘤样本的转录组学数据构建共表达基因模块;列表获取模块,用于基于肿瘤样本的基因组数据获取SCNV基因列表;评分模块,用于对所述共表达基因模块中的基因和所述SCNV基因列表中的基因进行相关性分析,生成SCNV基因列表中基因的评分结果;新发基因获取模块,用于基于所述评分结果,利用GO注释和快速功能注释从所述SCNV基因列表中获取肿瘤的致病新发基因;网络构建模块,用于基于肿瘤核心通路变化因子构建肿瘤致病新发基因调控网
络;验证模块,用于基于所述肿瘤致病新发基因调控网络验证所述肿瘤的致病新发基因。
[0018]在一种可能的实施方式中,所述基因构建模块,包括:差异列表生成子模块,用于根据肿瘤样本的转录组学数据生成差异表达基因列表;聚类子模块,用于将所述差异表达基因列表中的差异表达基因进行聚类,得到若干基因簇;网络构建子模块,用于基于所述基因簇的软阈值构建基因簇共表达网络;基因构建子模块,用于重构所述基因簇共表达网络中的基因,生成共表达基因模块。
[0019]在一种可能的实施方式中,所述肿瘤样本的转录组学数据为 RNA

seq的表达量数据。
[0020]在一种可能的实施方式中,所述RNA

seq的表达量数据为RPKM数。
[0021]在一种可能的实施方式中,所述将所述差异表达基因列表中的差异表达基因进行聚类采用的聚类方法为双向聚类法。
[0022]在一种可能的实施方式中,所述基因构建子模块,包括:聚类单元,用于利用相异度算法对所述基因簇共表达网络中的基因进行层次聚类;聚类树建立单元,用于基于所述层次聚类结果,建立分层聚类树;基因构建单元,用于将所述分层聚类树剪切成若干模块并进行模块合并,生成若干个共表达基因模块。
[0023]在一种可能的实施方式中,所述将所述分层聚类树剪切成若干模块利用动态剪切法。
[0024]在一种可能的实施方式中,所述进行模块合并具体为,将相关性系数大于0.75的模块进行合并。
[0025]在一种可能的实施方式中,所述评分模块,包括:初步评分子模块,用于利用决策树分析法对所述共表达基因模块中的基因和所述SCNV基因列表中的基因进行相关性分析,生成SCNV基因列表中基因的初步评分结果;评分子模块,用于根据CNV的拷贝类型对SCNV扩增基因和SCNV缺失基因按照评分进行排序,生成SCNV基因列表中基因的评分结果;其中,所述评分结果包括SCNV扩增基因评分结果和SCNV缺失基因评分结果。
[0026]在一种可能的实施方式中,所述SCNV基因本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.基于肿瘤样本的多组学联合分析方法,其特征在于,包括:根据肿瘤样本的转录组学数据构建共表达基因模块;基于肿瘤样本的基因组数据获取SCNV基因列表;对所述共表达基因模块中的基因和所述SCNV基因列表中的基因进行相关性分析,生成SCNV基因列表中基因的评分结果;基于所述评分结果,利用GO注释和快速功能注释从所述SCNV基因列表中获取肿瘤的致病新发基因;基于肿瘤核心通路变化因子构建肿瘤致病新发基因调控网络;基于所述肿瘤致病新发基因调控网络验证所述肿瘤的致病新发基因。2.如权利要求1所述的基于肿瘤样本的多组学联合分析方法,其特征在于,所述根据肿瘤样本的转录组学数据构建共表达基因模块,包括:根据肿瘤样本的转录组学数据生成差异表达基因列表;将所述差异表达基因列表中的差异表达基因进行聚类,得到若干基因簇;基于所述基因簇的软阈值构建基因簇共表达网络;重构所述基因簇共表达网络中的基因,生成共表达基因模块。3.如权利要求2所述的基于肿瘤样本的多组学联合分析方法,其特征在于,所述肿瘤样本的转录组学数据为RNA

seq的表达量数据。4.如权利要求3所述的基于肿瘤样本的多组学联合分析方法,其特征在于,所述RNA

seq的表达量数据为RPKM数。5.如权利要求2所述的基于肿瘤样本的多组学联合分析方法,其特征在于,所述将所述差异表达基因列表中的差异表达基因进行聚类采用的聚类方法为双向聚类法。6.如权利要求2所述的基于肿瘤样本的多组学联合分析方法,其特征在于,所述重构所述基因簇共表达网络中的基因,生成共表达基因模块,包括:利用相异度算法对所述基因簇共表达网络中的基因进行层次聚类;基于所述层次聚类结果,建立分层聚类树;将所述分层聚类树剪切成若干模块并进行模块合并,生成若干个共表达基因模块。7.如权利要求6所述的基于肿瘤样本的多组学联合分析方法,其特征在于,所述将所述分层聚类树剪切成若干模块利用动态剪切法。8.如权利要求6所述的基于肿瘤样本的多组学联合分析方法,其特征在于,所述进行模块合并具体为,将相关性系数大于0.75的模块进行合并。9.如权利要求1所述的基于肿瘤样本的多组学联合分析方法,其特征在于,所述对所述共表达基因模块中的基因和所述SCNV基因列表中的基因进行相关性分析,生成SCNV基因列表中基因的评分结果,包括:利用决策树分析法对所述共表达基因模块中的基因和所述SCNV基因列表中的基因进行相关性分析,生成SCNV基因列表中基因的初步评分结果;根据CNV的拷贝类型对SCNV扩增基因和SCNV缺失基因按照评分进行排序,生成SCNV基因列表中基因的评分结果;其中,所述评分结果包括SCNV扩增基因评分结果和SCNV缺失基因评分结果。10.如权利要求1所述的基于肿瘤样本的多组学联合分析方法,其特征在于,所述SCNV
基因列表中基因的评分越高,与所述共表达模块中的基因的相关性越高。11.如权利要求1所述的基于肿瘤样本的多组学联合分析方法,其特征在于,所述基于所述评分结果,利用GO注释和快速功能注释从所述SCNV基因列表中获取肿瘤的致病新发基因,包括:利用GO注释工具选取第一致病新发基因;将进行标注的所述第一致病新发基因输入ICMDB数据库进行快速功能注释,获取肿瘤的致病新发基因。12.如权利要求1所述的基于肿瘤样本的多组学联合分析方法,其特征在于,还包括:结合临床样本的预后及生存数据,对所述肿瘤的致病新发基因进行验证。13.基于肿瘤样本的多组学联合分析系统,其特征在于,包括:基因构建模块,用...

【专利技术属性】
技术研发人员:安琪儿赵再戌闵浩巍郭栋梁
申请(专利权)人:神州医疗科技股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1