【技术实现步骤摘要】
基于可变剪接差异的基因分析方法、系统、装置及介质
本专利技术涉及生物基因
,尤其是一种基于可变剪接差异的基因分析方法、系统、装置及介质。
技术介绍
可变剪接是一种广泛存在于生物体中造成蛋白质多样性的重要机制,它对细胞的增殖、分化、发育、凋亡等一系列重要的生物过程的精细调控具有非常重要的作用。近年来,人们发现可变剪接与包括肿瘤在内的多种复杂疾病的产生存在密切的联系,一些疾病的发生往往伴随着剪接异构体的紊乱表达。现有的对基因可变剪接与疾病关系的分析和研究,一般是研究基因剪接模式上的差异,通过各种方法去识别、检测可变剪接位点。这种方法仅仅从一个剪接异构体或一种剪接类型的差异出发,无法从整体上认识可变剪接紊乱对疾病的影响;从单个基因或单个异构体层次来考虑基因的差异,工作量十分庞大,且无法做到快速精准地分析、定位与疾病相关的基因和异构体。目前,还未有技术方案能够有效解决上述技术问题。
技术实现思路
本专利技术的目的在于至少一定程度上解决现有技术中存在的技术问题之一。为此,本专利技术实施例的一个 ...
【技术保护点】
1.基于可变剪接差异的基因分析方法,其特征在于,包括以下步骤:/n从样本集中获取基因数据,所述样本集包括癌症样本和正常样本;/n基于所述基因数据,分别获取单个基因各个异构体在癌症和正常状态下的表达量;/n通过散度分别对基因每个异构体在癌症和正常状态下的表达差异进行分析,得到基因的散度值;/n对各个基因的散度值进行排序,并输出散度值大于预设散度阈值的基因数据。/n
【技术特征摘要】
1.基于可变剪接差异的基因分析方法,其特征在于,包括以下步骤:
从样本集中获取基因数据,所述样本集包括癌症样本和正常样本;
基于所述基因数据,分别获取单个基因各个异构体在癌症和正常状态下的表达量;
通过散度分别对基因每个异构体在癌症和正常状态下的表达差异进行分析,得到基因的散度值;
对各个基因的散度值进行排序,并输出散度值大于预设散度阈值的基因数据。
2.根据权利要求1所述的基于可变剪接差异的基因分析方法,其特征在于:所述从样本集中获取基因数据这一步骤,其具体包括:
获取基因的异构体数据信息,剔除只含单个异构体的基因;
通过TPM衡量基因各个异构体的表达丰度,并基于预设的表达丰度阈值对基因的异构体进行筛选。
3.根据权利要求1所述的基于可变剪接差异的基因分析方法,其特征在于:所述通过散度分别对基因每个异构体在癌症和正常状态下的表达差异进行分析这一步骤,其具体包括:
分别获取基因所有异构体在癌症和正常状态下的表达总量;
基于所述表达总量,依次计算基因每个异构体在癌症和正常状态下的表达量占比;
根据基因每个异构体在癌症和正常状态下的表达量占比,通过KL散度对基因在癌症和正常状态下的表达差异进行分析。
4.根据权利要求1-2中任一项所述的基于可变剪接差异的基因分析方法,其特征在于:所述通过散度分别对基因每个异构体在癌症和正常状态下的表达差异进行分析这一步骤,其具体包括:
分别获取基因所有异构体在癌症和正常状态下的表达总量;
基于所述表达总量,依次计算基因每个异构体在癌症和正常状态下的表达量占比;
根据基因每个异构体在癌症和正常状态下的表达量占比,通过JS散度对基因在癌症和正常状态下的表达差异进行分析。
5.根据权利要求3所述的基于可变剪接差异的基因分析方法,其特征在于,所述通过KL散度对基因在癌症和正常状态下的表达差异进行分析这一步骤,其具体为:
通过公式获取基因在癌症和正常状态下的表达差异的KL散度值;
其中,i为基因x的异构体编号,k为基因x的异构...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。