一种用于评价化合物对基因通路活化作用的方法及装置制造方法及图纸

技术编号:21202699 阅读:22 留言:0更新日期:2019-05-25 02:03
本申请公开了一种用于评价化合物对基因通路活化作用的方法,包括:获取对照组的转录组数据和化合物研究组的转录组数据;根据对照组的转录组数据和化合物研究组的转录组数据,确定转录差异表达倍数数据;对相关基因做聚类处理,将共表达的基因聚类到同一组,获得多个基因共表达单元;获取基因通路,根据基因在基因通路中所起的促进作用、抑制作用、磷酸化作用和去磷酸化作用,相应地为基因通路中的各个基因分配其对应的权重系数,进而确定基因通路拓扑系数矩阵;根据转录差异表达倍数、基因共表达单元以及基因通路拓扑系数矩阵,确定用于评价化合物对于基因通路的活化作用的打分结果。

A Method and Device for Evaluating the Activation of Gene Pathway by Compounds

This application discloses a method for evaluating the activation of gene pathway by compounds, including: obtaining transcriptome data of control group and transcriptome data of compound research group; determining differential transcription expression multiple data based on transcriptome data of control group and transcriptome data of compound research group; clustering related genes and clustering co-expressed genes into the same group. In one group, multiple gene co-expression units are obtained; gene pathways are acquired, and the corresponding weight coefficients are allocated to each gene in the gene pathway according to the promotion, inhibition, phosphorylation and dephosphorylation of genes in the gene pathway, and then the topological coefficients matrix of gene pathways is determined; and gene co-expression units are determined according to transcriptional differential expression multiples. And the topological coefficient matrix of gene pathway is used to determine the scoring results for evaluating the activation of gene pathway by compounds.

【技术实现步骤摘要】
一种用于评价化合物对基因通路活化作用的方法及装置
本申请涉及生物信息
,尤其涉及一种用于评价化合物对基因通路活化作用的方法及装置。
技术介绍
在过去的几十年中,随着基因工程的出现,许多研究和资金被投入到基因组学和基于基因的个性化医学中。随着深度学习和机器学习算法的广泛应用,对大规模转录组数据进行有效地运用,在对传统的疾病分类、个性化医学和预后模型等方面均产生了很大程度的优化。然而,这些经典的临床应用目前仍受限于若干公认的挑战和限制,首先,转录组数据分析中最相关的挑战之一是基因网络相互作用的固有复杂性,这仍然是从转录组数据构建综合预测模型的重大障碍;此外,实验平台的高度多样性、难以理解所获得的值以及来自各种类型设备的数据的不一致性,也可能导致对潜在生物过程的错误解释。尽管存在这些挑战,各种转录组数据分析算法仍在学术和商业中迅猛发展,部分算法目前已尝试应用于临床,尤其是用于预测患者对各种癌症治疗的反应,这些方法具体通过识别不同样本组之间差异表达的基因,预测各种癌症治疗的反应,上述方法虽然可以对研究过程中潜在的遗传生物标记和表达特征模式进行识别,但是很难捕获因在信号网络水平上基因之间的动态相互作用而产生的样本间的细微差别。2016年开发的IPANDA方法结合了基因通路,在很大程度上降低生物学的数据维度,但是其对基因在基因通路上所起的作用评估不够精准。
技术实现思路
本申请实施例提供了一种用于评价化合物对基因通路活化作用的方法,能够在降低生物学数据维度的同时,精准地评价化合物对于基因通路的活化作用。有鉴于此,本申请第一方面提供了一种用于评价化合物对基因通路活化作用的方法,所述方法包括:获取对照组的转录组数据和化合物研究组的转录组数据;根据所述对照组的转录组数据和所述化合物研究组的转录组数据,获得转录差异表达倍数数据;对相关基因做聚类处理,将共表达的基因聚类到同一组,获得多个基因共表达单元;获取基因通路,根据基因在所述基因通路中所起的作用,为所述基因通路中的各个基因分配权重系数,获得基因通路拓扑系数矩阵;所述基因在基因通路中所起的作用包括:促进作用、抑制作用、磷酸化作用和去磷酸化作用;根据所述转录差异表达倍数数据、所述基因共表达单元以及所述基因通路拓扑系数矩阵,确定化合物在每条基因通路上的打分结果;所述打分结果用于评价该化合物对于所述基因通路的活化作用。可选的,所述根据基因在基因通路中所起的作用,为基因通路中的各个基因分配权重系数,包括:将对基因通路起促进作用的基因对应的权重系数设置为+1;将对基因通路起抑制作用的基因对应的权重系数设置为-1;将对基因通路起磷酸化作用的基因对应的权重系数设置为+2;将对基因通路其去磷酸化作用的基因对应的权重系数设置为-2。可选的,所述获得基因通路拓扑系数矩阵,包括:根据各个基因各自对应的权重系数,利用R包KEGGgraph和RBGL计算基因在每条基因通路上的拓扑系数。可选的,所述对基因做聚类处理,将共表达的基因聚类到同一组,获得多个基因共表达单元,包括:对共表达的基因进行第一次聚类处理,以及对所述第一次聚类结果进行第二次聚类处理,获得基因共表达单元。可选的,所述对基因做聚类处理,将共表达的基因聚类到同一组,获得多个基因共表达单元,包括:采用基于密度的聚类方法和/或层次聚类方法。可选的,所述基于密度的聚类方法包括:DBSCAN、OPTICS;所述层次聚类方法包括:BIRCH。本申请第二方面提供了一种用于评价化合物对基因通路活化作用的装置,所述装置包括:转录组数据获取模块,用于获取对照组的转录组数据和化合物研究组的转录组数据;转录差异表达倍数数据获取模块,用于根据所述对照组的转录组数据和所述化合物研究组的转录组数据,获得转录差异表达倍数数据;基因共表达单元获取模块,用于对相关基因做聚类处理,将共表达的基因聚类到同一组,获得多个基因共表达单元;基因通路拓扑系数矩阵获取模块,用于获取基因通路,根据基因在所述基因通路中所起的作用,为所述基因通路中的各个基因分配权重系数,获得基因通路拓扑系数矩阵;所述基因在基因通路中所起的作用包括:促进作用、抑制作用、磷酸化作用和去磷酸化作用;打分模块,用于根据所述转录差异表达倍数数据、所述基因共表达单元以及所述基因通路拓扑系数矩阵,确定化合物在每条基因通路上的打分结果;所述打分结果用于评价该化合物对于所述基因通路的活化作用。可选的,所述基因通路拓扑系数矩阵获取模块,具体用于:将对基因通路起促进作用的基因对应的权重系数设置为+1;将对基因通路起抑制作用的基因对应的权重系数设置为-1;将对基因通路起磷酸化作用的基因对应的权重系数设置为+2;将对基因通路其去磷酸化作用的基因对应的权重系数设置为-2。可选的,所述基因通路拓扑系数矩阵获取模块,具体用于:根据各个基因各自对应的权重系数,利用R包KEGGgraph和RBGL计算基因在每条基因通路上的拓扑系数。可选的,所述基因共表达单元获取模块,具体用于:对共表达的基因进行第一次聚类处理,以及对所述第一次聚类结果进行第二次聚类处理,获得基因共表达单元。可选的,所述基因共表达单元获取模块,具体用于:采用基于密度的聚类方法和/或层次聚类方法。可选的,所述基于密度的聚类方法包括:DBSCAN、OPTICS;所述层次聚类方法包括:BIRCH。本申请第三方面提供了一种用于评价化合物对基因通路活化作用的设备,所述设备包括处理器以及存储器:所述存储器用于存储程序代码,并将所述程序代码传输给所述处理器;所述处理器用于根据所述程序代码中的指令,执行如上述第一方面所述的用于评价化合物对基因通路活化作用的方法的步骤。本申请第四方面提供了一种计算机可读存储介质,所述计算机可读存储介质用于存储程序代码,所述程序代码用于执行上述第一方面所述的用于评价化合物对基因通路活化作用的方法。从以上技术方案可以看出,本申请实施例具有以下优点:本申请实施例提供了一种用于评价化合物对基因通路活化作用的方法,在该方法中,先获取对照组的转录组数据和化合物研究组的转录组数据;然后,根据对照组的转录组数据和化合物研究组的转录组数据,确定转录差异表达倍数数据;对相关基因做聚类处理,将共表达的基因聚类到同一组,获得多个基因共表达单元;获取基因通路,根据基因在基因通路中所起的促进作用、抑制作用、磷酸化作用和去磷酸化作用,相应地为基因通路中的各个基因分配其对应的权重系数,进而确定基因通路拓扑系数矩阵;最终,根据转录差异表达倍数、基因共表达单元以及基因通路拓扑系数矩阵,采用IPANDA方法确定化合物在每条基因通路上的打分结果,该打分结果能够评价化合物对于基因通路的活化作用。在确定基因通路拓扑系数矩阵的过程中,综合考虑基因的促进作用、抑制作用、磷酸化作用和去磷酸化作用,保证准确评估各个基因在基因通路上所起的作用,进而保证后续基于该基因通路拓扑系数矩阵确定出的打分结果,能够更准确地表征化合物对于基因通路起到的活化作用。附图说明为了更清楚地说明本申请实施例或现有技术中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本申请的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得本文档来自技高网...

【技术保护点】
1.一种用于评价化合物对基因通路活化作用的方法,其特征在于,所述方法包括:获取对照组的转录组数据和化合物研究组的转录组数据;根据所述对照组的转录组数据和所述化合物研究组的转录组数据,获得转录差异表达倍数数据;对相关基因做聚类处理,将共表达的基因聚类到同一组,获得多个基因共表达单元;获取基因通路,根据基因在所述基因通路中所起的作用,为所述基因通路中的各个基因分配权重系数,获得基因通路拓扑系数矩阵;所述基因在基因通路中所起的作用包括:促进作用、抑制作用、磷酸化作用和去磷酸化作用;根据所述转录差异表达倍数数据、所述基因共表达单元以及所述基因通路拓扑系数矩阵,确定化合物在每条基因通路上的打分结果;所述打分结果用于评价该化合物对于所述基因通路的活化作用。

【技术特征摘要】
1.一种用于评价化合物对基因通路活化作用的方法,其特征在于,所述方法包括:获取对照组的转录组数据和化合物研究组的转录组数据;根据所述对照组的转录组数据和所述化合物研究组的转录组数据,获得转录差异表达倍数数据;对相关基因做聚类处理,将共表达的基因聚类到同一组,获得多个基因共表达单元;获取基因通路,根据基因在所述基因通路中所起的作用,为所述基因通路中的各个基因分配权重系数,获得基因通路拓扑系数矩阵;所述基因在基因通路中所起的作用包括:促进作用、抑制作用、磷酸化作用和去磷酸化作用;根据所述转录差异表达倍数数据、所述基因共表达单元以及所述基因通路拓扑系数矩阵,确定化合物在每条基因通路上的打分结果;所述打分结果用于评价该化合物对于所述基因通路的活化作用。2.根据权利要求1所述的方法,其特征在于,所述根据基因在基因通路中所起的作用,为基因通路中的各个基因分配权重系数,包括:将对基因通路起促进作用的基因对应的权重系数设置为+1;将对基因通路起抑制作用的基因对应的权重系数设置为-1;将对基因通路起磷酸化作用的基因对应的权重系数设置为+2;将对基因通路其去磷酸化作用的基因对应的权重系数设置为-2。3.根据权利要求1或2所述的方法,其特征在于,所述获得基因通路拓扑系数矩阵,包括:根据各个基因各自对应的权重系数,利用R包KEGGgraph和RBGL计算基因在每条基因通路上的拓扑系数。4.根据权利要求1所述的方法,其特征在于,所述对基因做聚类处理,将共表达的基因聚类到同一组,获得多个基因共表达单元,包括:对共表达的基因进行第一次聚类处理,以及对所述第一次聚类结果进行第二次聚类处理,获得基因共表达单元。5.根据权利要求1所述的方法,其特征在于,所述对基因做聚类处理,将共表达的基因聚类到同一组,获得多个基因共表达单元,包括:采用基于密度的聚类方法和/或层次聚类方法。6.根据权利要求5所述的方法,其特征在于,所述基于密度...

【专利技术属性】
技术研发人员:戴蝉李瑛颖管峥
申请(专利权)人:北京深度制耀科技有限公司
类型:发明
国别省市:北京,11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1