System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种基因差异化表达分析方法及系统技术方案_技高网

一种基因差异化表达分析方法及系统技术方案

技术编号:41223829 阅读:3 留言:0更新日期:2024-05-09 23:42
本发明专利技术涉及数据处理领域,揭露了一种基因差异化表达分析方法、系统、电子设备及存储介质,其中,所述方法包括:获取实验样本对应的预设分析基因集中每个分析基因的实验基因表达数量及对照样本对应的预设分析基因集中每个分析基因的对照基因表达数量,计算每个基因在实验样本和对照样本间的表达差异倍数、表达差异大小、表达差异显著性,得到差异倍数特征值、差异大小特征值及差异显著性系数,基于所述差异倍数特征值、所述差异大小特征值及所述差异显著性系数,对所述分析基因集中的分析基因进行表达差异分析,得到分析结果。本发明专利技术主要目的在于提高了基因差异化表达分析的准确性。

【技术实现步骤摘要】

本专利技术涉及一种基因差异化表达分析方法及系统,属于数据处理领域。


技术介绍

1、基因差异表达分析是指将实验组和对照组的所有基因表达情况依次进行对比分析,筛选出具有显著表达变化的基因集,即差异表达基因集。基因差异表达分析是转录组测序(rna-seq)数据分析中至关重要的一步,通过基因差异表达分析可以探究实验组相较于对照组在rna水平上的差异,进而为解析相应分子机制提供基础。

2、目前基因差异表达分析方法通常使用差异倍数(fold change,fc)和p-value两个指标,衡量基因的差异表达(fc是基因在一组样本中表达值的均值除以其在另外一组样本中表达值的均值(实验组/对照组)。p-value用来衡量两组数据之间的差异是否具有统计学意义上的显著性,通常当p-value<0.05时,两组数据之间的差异被认为具有显著性),分析的维度单一且差异倍数易受极端值影响,影响基因差异表达分析结果的准确性。


技术实现思路

1、本专利技术提供一种基因差异化表达分析方法、系统、电子设备及存储介质,其主要目的在于提高了基因差异化表达分析的准确性。

2、为实现上述目的,本专利技术提供的一种基因差异化表达分析方法,包括:

3、获取实验样本集中每个实验样本对应预设的分析基因集中每个分析基因的实验基因表达数量及对照样本集中每个对照样本对应所述分析基因集中每个分析基因的对照基因表达数量;

4、将所述分析基因的所有实验基因表达数量的中位数,确定为所述分析基因的实验表达特征值,并将所述分析基因的所有对照基因表达数量的中位数,确定为所述分析基因的对照表达特征值;

5、基于所述分析基因的实验表达特征值及对照表达特征值进行计算,以衡量所述分析基因在实验样本和对照样本间的表达数量差异,得到所述分析基因的差异大小特征值;

6、基于所述分析基因的所有实验基因表达数量及所有对照基因表达数量进行计算,以衡量所述分析基因的表达差异倍数,得到所述分析基因的差异倍数特征值;

7、基于所述分析基因的所有实验基因表达数量及所有对照基因表达数量进行计算,以分析所述分析基因在实验样本和对照样本间的表达差异显著性,得到所述分析基因的差异显著性系数;

8、基于所述差异倍数特征值、所述差异大小特征值及所述差异显著性系数,对所述分析基因集中的分析基因进行表达差异分析,得到分析结果。

9、可选地,所述基于所述分析基因的实验表达特征值及对照表达特征值进行计算,以衡量所述分析基因在实验样本和对照样本间的表达数量差异,得到所述分析基因的差异大小特征值,包括:

10、计算所述分析基因的实验表达特征值及对照表达特征值的差值,得到所述分析基因的差异大小特征值。

11、可选地,所述基于所述分析基因的所有实验基因表达数量及所有对照基因表达数量进行计算,以衡量所述分析基因的表达差异倍数,得到所述分析基因的差异倍数特征值,包括:

12、计算所述分析基因的所有实验基因表达数量的平均值,得到所述分析基因的实验表达平均值;

13、计算所述分析基因的所有对照基因表达数量的平均值,得到所述分析基因的对照表达平均值;

14、基于所述分析基因的实验表达平均值与对照表达平均值进行倍数比较,得到所述分析基因的表达倍数特征值。

15、可选地,所述基于所述分析基因的实验表达平均值与对照表达平均值进行倍数比较,得到所述分析基因的表达倍数特征值,包括:

16、fi=log2(m实验组/m对照组)

17、其中,i为分析基因集中分析基因的序号,fi为序号为i的分析基因的表达倍数特征值,m实验组为序号为i的分析基因的实验表达平均值,m对照组为序号为i的分析基因的对照表达平均值。

18、可选地,所述基于所述分析基因的所有实验基因表达数量及所有对照基因表达数量进行计算,以分析所述分析基因在实验样本和对照样本间的表达差异显著性,得到所述分析基因的差异显著性系数,包括:

19、计算所述分析基因的所有实验基因表达数量的标准差,得到所述分析基因的实验表达标准差;

20、计算所述分析基因的所有对照基因表达数量的标准差,得到所述分析基因的对照表达标准差;

21、计算所述分析基因的实验表达平均值与对照表达平均值的差值,得到所述分析基因的表达平均值差值;

22、基于所述分析基因的表达平均值差值、实验表达标准差及对照表达标准差,进行计算,得到所述分析基因的统计特征值;

23、基于所述统计特征值计算所述分析基因的p-value值,得到所述分析基因的差异显著性系数。

24、可选地,所述基于所述分析基因的表达平均值差值、实验表达标准差及对照表达标准差,进行计算,得到所述分析基因的统计特征值,包括:

25、

26、其中,i为分析基因集中分析基因的序号,ti为序号为i的分析基因的统计特征值,x为序号为i的分析基因的表达平均值差值,s1为序号为i的分析基因的实验表达标准差,s2为序号为i的分析基因的对照表达标准差,n1为实验样本的数量,n2为对照样本的数量。

27、可选地,所述基于所述差异倍数特征值、所述差异大小特征值及所述差异显著性系数,对所述分析基因集中的分析基因进行表达差异分析,得到分析结果,包括:

28、筛选所述分析基因集中差异显著性系数小于或等于显著性系数阈值的分析基因,得到初始异常基因;

29、将所有所述初始异常基因中差异倍数特征值大于上限特征值阈值的分析基因,确定为差异表达上调基因;

30、将所有所述初始异常基因中差异倍数特征值小于上限特征值阈值的分析基因,确定为差异表达下调基因;

31、将所述差异表达上调基因中差异大小特征值大于预设差异大小特征阈值的分析基因,确定为目标差异表达上调基因;

32、将所述差异表达下调基因中差异大小特征值小于预设差异大小特征阈值的分析基因,确定为目标差异表达下调基因;

33、将所有所述目标差异表达上调基因及所有所述目标差异表达下调基因确定为异常基因;

34、汇总所有所述异常基因得到所述分析结果。

35、可选地,所述基于所述差异倍数特征值、所述差异大小特征值及所述差异显著性系数,对所述分析基因集中的分析基因进行表达差异分析,得到分析结果,包括:

36、筛选所述分析基因集中差异显著性系数小于或等于显著性系数阈值的分析基因,得到初始异常基因;

37、将所有所述初始异常基因中差异倍数特征值大于上限特征值阈值的分析基因,确定为差异表达上调基因;

38、将所有所述初始异常基因中差异倍数特征值小于上限特征值阈值的分析基因,确定为差异表达下调基因;

39、将所述分析基因的差异倍数特征值及差异大小特征值,作为所述分析基因的坐标值,构建所述分析基因的坐标;

40、基于所述坐标构建所述本文档来自技高网...

【技术保护点】

1.一种基因差异化表达分析方法,其特征在于,所述方法包括:

2.如权利要求1所述的基因差异化表达分析方法,其特征在于,所述基于所述分析基因的实验表达特征值及对照表达特征值进行计算,以衡量所述分析基因在实验样本和对照样本间的表达数量差异,得到所述分析基因的差异大小特征值,包括:

3.如权利要求1所述的基因差异化表达分析方法,其特征在于,所述基于所述分析基因的所有实验基因表达数量及所有对照基因表达数量进行计算,以衡量所述分析基因的表达差异倍数,得到所述分析基因的差异倍数特征值,包括:

4.如权利要求3所述的基因差异化表达分析方法,其特征在于,所述基于所述分析基因的实验表达平均值与对照表达平均值进行倍数比较,得到所述分析基因的表达倍数特征值,包括:

5.如权利要求3所述的基因差异化表达分析方法,其特征在于,所述基于所述分析基因的所有实验基因表达数量及所有对照基因表达数量进行计算,以分析所述分析基因在实验样本和对照样本间的表达差异显著性,得到所述分析基因的差异显著性系数,包括:

6.如权利要求5所述的基因差异化表达分析方法,其特征在于,所述基于所述分析基因的表达平均值差值、实验表达标准差及对照表达标准差,进行计算,得到所述分析基因的统计特征值,包括:

7.如权利要求1所述的基因差异化表达分析方法,其特征在于,所述基于所述差异倍数特征值、所述差异大小特征值及所述差异显著性系数,对所述分析基因集中的分析基因进行表达差异分析,得到分析结果,包括:

8.如权利要求1至7中任意一项所述的基因差异化表达分析方法,其特征在于,所述基于所述差异倍数特征值、所述差异大小特征值及所述差异显著性系数,对所述分析基因集中的分析基因进行表达差异分析,得到分析结果,包括:

9.如权利要求8所述的基因差异化表达分析方法,其特征在于,所述基于所述差异倍数特征值、所述差异大小特征值及所述差异显著性系数,对所述分析基因集中的分析基因进行表达差异分析,得到分析结果之后,所述方法还包括:将所述分析结果发送至表达差异分析人员的预设终端设备。

10.一种基因差异化表达分析系统,其特征在于,所述系统包括:

...

【技术特征摘要】

1.一种基因差异化表达分析方法,其特征在于,所述方法包括:

2.如权利要求1所述的基因差异化表达分析方法,其特征在于,所述基于所述分析基因的实验表达特征值及对照表达特征值进行计算,以衡量所述分析基因在实验样本和对照样本间的表达数量差异,得到所述分析基因的差异大小特征值,包括:

3.如权利要求1所述的基因差异化表达分析方法,其特征在于,所述基于所述分析基因的所有实验基因表达数量及所有对照基因表达数量进行计算,以衡量所述分析基因的表达差异倍数,得到所述分析基因的差异倍数特征值,包括:

4.如权利要求3所述的基因差异化表达分析方法,其特征在于,所述基于所述分析基因的实验表达平均值与对照表达平均值进行倍数比较,得到所述分析基因的表达倍数特征值,包括:

5.如权利要求3所述的基因差异化表达分析方法,其特征在于,所述基于所述分析基因的所有实验基因表达数量及所有对照基因表达数量进行计算,以分析所述分析基因在实验样本和对照样本间的表达差异显著性,得到所述分析基因的差异显著性系数,包括:

6...

【专利技术属性】
技术研发人员:孙蔓蔓余艳刘红豆苏洁琼唐春燕袁悉奥
申请(专利权)人:长沙金域医学检验实验室有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1