基于基因蛋白活性的小分子抗肿瘤效果鉴定方法及系统技术方案

技术编号:34868189 阅读:17 留言:0更新日期:2022-09-08 08:13
本发明专利技术公开了基于基因蛋白活性的小分子抗肿瘤效果鉴定方法及系统。方法包括:基于肿瘤细胞的基因表达数据,获取关键节点基因和从属基因,关键节点基因与多个从属基因存在相关关系,从属基因用于反映关键节点基因的蛋白活性;计算关键节点基因在小分子干扰前后的蛋白活性,获得对应小分子干扰前的蛋白活性的关键节点基因的蛋白活性静态图谱和小分子干扰后的蛋白活性的关键节点基因的蛋白活性变化图谱;比较变化图谱和静态图谱,基于Fisher精确性检验和多重检验校正确定小分子是否可以逆转肿瘤细胞的生理状态,并判断小分子对静态图谱的逆转效果及小分子的抗肿瘤效果,提高了推断小分子抗肿瘤效果的准确性与敏感性。断小分子抗肿瘤效果的准确性与敏感性。断小分子抗肿瘤效果的准确性与敏感性。

【技术实现步骤摘要】
基于基因蛋白活性的小分子抗肿瘤效果鉴定方法及系统


[0001]本专利技术涉及药物抗肿瘤效果鉴定
,尤其涉及一种基于基因蛋白活性的小分子抗肿瘤效果鉴定方法及系统。

技术介绍

[0002]小分子药物作用在肿瘤细胞上,会通过阻滞信号转导或细胞代谢等基因通路的方式来抑制肿瘤细胞的生长与增殖,从而发挥抗肿瘤的效果。小分子对肿瘤细胞的影响是系统性的,会引起基因表达图谱的逆转。因此,将小分子干扰下肿瘤细胞系基因表达的变化图谱与通过单细胞转录组测序描绘的肿瘤细胞基因表达静态图谱进行比较,可以筛选出具有一定抗肿瘤效果的小分子。具体来讲,如果在小分子干扰下引起的基因表达变化图谱与肿瘤细胞的基因表达静态图谱特征相反,那么说明该小分子可以逆转肿瘤细胞的生理状态,从而发挥抗肿瘤的效果。
[0003]目前,通过算法对基因表达的变化图谱和静态图谱进行比较,筛选具有抗肿瘤效果的小分子的具体方法包括:从LINCSL1000数据集资源(网址如下:https://lincsproject.org/LINCS/tools/workflows/find

the

best

place

to

obtain

the

lincs

l1000

data)中抽取信息,构建在小分子干扰下肿瘤细胞系基因表达的变化图谱;与通过单细胞转录组测序描绘的肿瘤细胞基因表达静态图谱进行比较;如果卡方检验结果显示变化图谱中前600个上调基因与静态图谱中前600个低表达基因的重叠较大,且变化图谱中前600个下调基因与静态图谱中前600个高表达基因的重叠较大,可以推断该小分子可以逆转肿瘤细胞基因表达的静态图谱,显示其具有一定的抗肿瘤效果。
[0004]然而,该算法具有两点缺陷:其一,该算法通过对基因表达图谱的比较来判断小分子是否可以逆转肿瘤细胞的生理状态,从而推断其抗肿瘤效果,但是基因表达图谱不够稳定,常常混有噪音,尤其是对单细胞转录组测序数据而言,而且基因表达的高低往往不能准确代表更直接反映肿瘤细胞的生理状态的相应基因蛋白活性的高低,进而影响推断的准确性;其二,该算法采用卡方检验来判断基因集合之间的重叠,但是卡方检验并非精确性检验,而且需要的观察频数较大(任意观察频数>5),因此限制了推断的敏感性。

技术实现思路

[0005]为了解决现有技术中存在的问题,本专利技术提供了如下技术方案,一种基于基因蛋白活性的小分子抗肿瘤效果鉴定方法及系统,基于基因表达数据,为肿瘤细胞生理调控关键节点基因计算蛋白活性,然后对关键节点基因蛋白活性的变化图谱和静态图谱进行比较,通过Fisher精确性检验(费希尔精确性检验,也称“四格表的确切概率法”)以及多重检验校正来判断小分子是否可以逆转肿瘤细胞的生理状态,推断其抗肿瘤效果,从而提高推断小分子抗肿瘤效果的准确性与敏感性。
[0006]本专利技术一方面提供了一种基于基因蛋白活性的小分子抗肿瘤效果鉴定方法,包括:
S1,基于肿瘤细胞的基因表达数据,获取关键节点基因和从属基因,所述关键节点基因与多个从属基因存在相关关系,所述从属基因用于反映所述关键节点基因的蛋白活性;S2,计算所述关键节点基因在小分子干扰前后的蛋白活性,获得对应小分子干扰前的所述蛋白活性的所述关键节点基因的蛋白活性静态图谱和小分子干扰后的所述蛋白活性的所述关键节点基因的蛋白活性变化图谱;S3,比较所述变化图谱和静态图谱,基于Fisher精确性检验和多重检验校正确定所述小分子是否可以逆转肿瘤细胞的生理状态,并判断小分子对所述静态图谱的逆转效果以及所述小分子的抗肿瘤效果。
[0007]优选的,所述方法还包括:S4,基于所述Fisher精确性检验定量计算所述小分子的抗肿瘤量化效果。
[0008]优选的,所述数S1,基于肿瘤细胞的基因表达数据,获取关键节点基因和从属基因包括:S11,基于肿瘤细胞的基因表达数据建立癌种特异的基因互作网络;S12,基于所述基因互作网络获取关键节点基因和从属基因。
[0009]优选的,所述S11包括:对任意两个基因表达数据,计算Spearman等级相关系数并进行统计检验和/或FDR校正;根据所述统计检验过滤Spearman等级相关系数绝对值小于第一阈值和/或所述FDR校正后所述FDR大于第二阈值的基因对关系;筛选至少与N个从属基因存在相关关系的基因作为关键节点基因,将每个关键节点基因与其从属基因之间的Spearman等级相关系数,作为该从属基因对关键节点基因的蛋白活性的贡献权重。
[0010]优选的,所述第一阈值为0.1,第二阈值为0.05,所述N为30。
[0011]优选的,所述S2计算所述关键节点基因在小分子干扰前后的蛋白活性包括:S21,基于所述基因互作网络以及单细胞基因表达矩阵计算每个细胞的所述关键节点基因的蛋白活性;S22,基于所述基因互作网络以及小分子干扰下肿瘤细胞系基因表达矩阵计算每种小分子干扰下肿瘤细胞的所述关键节点基因的蛋白活性。
[0012]优选的,所述S21包括:基于所述基因互作网络以及单细胞基因表达矩阵获得每个细胞的基因表达值,对每个细胞的基因表达值进行第一归一化处理获得归一化处理后的基因表达值,所述第一归一化处理为将每个细胞的所述基因表达值减去基因在所有细胞中的平均基因表达值后获得的差值除以基因在所有细胞中的基因表达值的标准差;在每个细胞中,对所述归一化处理后的基因表达值进行排序,并基于标准正态分布,计算出相对于每个排序位置的分位数,作为该基因的表达分位数,所述表达分位数包括关键节点基因表达分位数和从属基因表达分位数;针对每一个关键节点基因,将所有所述从属基因表达分位数和所述贡献权重乘积之和作为所述关键节点基因的蛋白活性;
对所有基因及所述归一化处理后的基因表达值进行M1次洗牌处理(shuffling),为关键节点基因计算M1次假蛋白活性,形成零假设分布,并基于置换检验和FDR校正确定上述计算得到的关键节点基因蛋白活性在统计上是否显著。
[0013]优选的,所述S22包括:基于所述基因互作网络以及小分子干扰下肿瘤细胞系基因表达矩阵获得每种小分子干扰下每个肿瘤细胞系的基因表达值,对每种小分子干扰下每个肿瘤细胞系的基因表达值进行第二归一化处理获得归一化处理后的小分子干扰下肿瘤细胞系的基因表达值,所述第二归一化处理为将每种小分子干扰下每个肿瘤细胞系的基因表达值减去基因在未经小分子干扰的肿瘤细胞系中的平均基因表达值后获得的差值除以基因在未经小分子干扰的肿瘤细胞系中的基因表达值的标准差;在每个肿瘤细胞系中,对所述归一化处理后的小分子干扰下肿瘤细胞系的基因表达值进行排序,并基于标准正态分布,计算出相对于每个排序位置的分位数,作为该小分子干扰下肿瘤细胞系基因的表达分位数,所述表达分位数包括小分子干扰下关键节点基因表达分位数和小分子干扰下从属基因表达分位数;针对每一个小分子干扰下关键节点基因,将所有小分子干扰本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于基因蛋白活性的小分子抗肿瘤效果鉴定方法,其特征在于,包括:S1,基于肿瘤细胞的基因表达数据,获取关键节点基因和从属基因,所述关键节点基因与多个从属基因存在相关关系,所述从属基因用于反映所述关键节点基因的蛋白活性;S2,计算所述关键节点基因在小分子干扰前后的蛋白活性,获得对应小分子干扰前的所述蛋白活性的所述关键节点基因的蛋白活性静态图谱和小分子干扰后的所述蛋白活性的所述关键节点基因的蛋白活性变化图谱;S3,比较所述变化图谱和静态图谱,基于Fisher精确性检验和多重检验校正确定所述小分子是否可以逆转肿瘤细胞的生理状态,并判断小分子对所述静态图谱的逆转效果以及所述小分子的抗肿瘤效果。2.根据权利要求1所述的一种基于基因蛋白活性的小分子抗肿瘤效果鉴定方法,其特征在于,所述方法还包括:S4,基于所述Fisher精确性检验定量计算所述小分子的抗肿瘤量化效果。3.根据权利要求2所述的一种基于基因蛋白活性的小分子抗肿瘤效果鉴定方法,其特征在于,所述S1,基于肿瘤细胞的基因表达数据,获取关键节点基因和从属基因包括:S11,基于肿瘤细胞的基因表达数据建立癌种特异的基因互作网络;S12,基于所述基因互作网络获取关键节点基因和从属基因。4.根据权利要求3所述的一种基于基因蛋白活性的小分子抗肿瘤效果鉴定方法,其特征在于,所述S11包括:对任意两个基因表达数据,计算Spearman等级相关系数并进行统计检验和/或FDR校正;根据所述统计检验过滤Spearman等级相关系数绝对值小于第一阈值和/或所述FDR校正后所述FDR大于第二阈值的基因对关系;筛选至少与N个从属基因存在相关关系的基因作为关键节点基因,将每个关键节点基因与其从属基因之间的Spearman等级相关系数,作为该从属基因对关键节点基因的蛋白活性的贡献权重。5.根据权利要求4所述的一种基于基因蛋白活性的小分子抗肿瘤效果鉴定方法,其特征在于,所述第一阈值为0.1,第二阈值为0.05,所述N为30。6.根据权利要求4所述的一种基于基因蛋白活性的小分子抗肿瘤效果鉴定方法,其特征在于,所述计算所述关键节点基因在小分子干扰前后的蛋白活性,包括:S21,基于所述基因互作网络以及单细胞基因表达矩阵计算每个细胞的所述关键节点基因的蛋白活性;S22,基于所述基因互作网络以及小分子干扰下肿瘤细胞系基因表达矩阵计算每种小分子干扰下肿瘤细胞的所述关键节点基因的蛋白活性。7.根据权利要求6所述的一种基于基因蛋白活性的小分子抗肿瘤效果鉴定方法,其特征在于,所述S21包括:基于所述基因互作网络以及单细胞基因表达矩阵获得每个细胞的基因表达值,对每个细胞的基因表达值进行第一归一化处理获得归一化处理后的基因表达值,所述第一归一化处理为将每个细胞的所述基因表达值减去基因在所有细胞中的平均基因表达值后获得的差值除以基因在所有细胞中的基因表达值的标准差;
在每个细胞中,对所述归一化处理后的基因表达值进行排序,并基于标准正态分布,计算出相对于每个排序位置的分位数,作为该基因的表达分位数,所述表达分位数包括关键节点基因表达分位数和从属基因表达分位数;针对每一个关键节点基因,将所有所述从属基因表达分位数和所述贡献权重乘积之和作为所述关键节点基因的蛋白活性;对所有基因及所述归一化处理后的基因表达值进行M1次洗牌处理,为关键节点基因计算M1次假蛋白活性,形成零假设分布,并基于置换检验和FDR校正确定上述计算得到的关键节点基因蛋白活性在统计上是否显著。8.根据权利要求7所述的一种基于基因蛋白活性的小分子抗肿瘤效果鉴定方法,其特征在于,所述S22包括:基于所述基因互作网络以及小分子干扰下肿瘤细胞系基因表达矩阵获得每种小分子干扰下每个肿瘤细胞系的基因表达值,对每种小分子干扰下每个肿瘤细胞系的基因表达值进行第二归一化处理获得归一化处理后的小分子干扰下肿瘤细胞系的基因表达值,所述第二归一化处理为将每种小分子干扰下每个肿瘤细胞系的基因表达值减去基因在未经小分子干扰的肿瘤细胞系中的平均基因表达值后获得的差值除以基因在未经小分子干扰的肿瘤细胞系中的基因表达值的标准差;在每个肿瘤细胞系中,对所述归一化处理后的小分子干扰下肿瘤细胞系的基因表达值进行排序,并基于标准正态分布,计算出相对于每个排序位置的分...

【专利技术属性】
技术研发人员:季序我彭鑫鑫赵义李哲
申请(专利权)人:普瑞基准生物医药苏州有限公司北京普康瑞仁医学检验所有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1