The invention discloses a method for analyzing the significance, which is used to obtain the p value and the P (k) value by using the Fisher exact test and the chi square test, respectively, and the FDR value of pathway is determined by the multiple comparison test. In the case of small samples, the t test or F test was used to screen the differential genes, and the t test was used to identify the difference between the two types of differential genes. In order to reduce the difference caused by the invention of small sample screening errors of the two groups were compared using T test random variance model, the calculation between genes significant level and error rate, so as to obtain the differential gene, this method has the features of high accuracy, suitable for popularization and application.
【技术实现步骤摘要】
本专利技术属于基因
,涉及一种显著性分析方法,具体地说,涉及一种Pathway的显著性分析方法。
技术介绍
KEGG(KyotoEncyclopediaofGenesandGenomes)全称是京都基因与基因组大百科全书,是系统分析基因(及其编码产物)间关系、基因功能、基因组信息的数据库,它有助于研究者把基因及表达信息作为一个整体网络进行研究。基因组信息存储在GENES数据库里,包括完整和部分测序的基因组序列;更高级的功能信息存储在PATHWAY数据库里,包括图解的细胞生化过程如代谢、膜转运、信号传递、细胞周期,还包括同系保守的子通路等信息。KEGG提供的整合代谢途径(pathway)查询十分出色,包括碳水化合物、核苷、氨基酸等的代谢及有机物的生物降解,不仅提供了所有可能的代谢途径,而且对催化各步反应的酶进行了全面的注解。KEGG是进行生物体内代谢分析、代谢网络研究的强有力工具。目前KEGGPathway分为8个类别,分别为总体网络、代谢过程、遗传信息传递、环境信息传递、胞内生物过程、生物体系统、人类疾病及药物研发八大类。Pathway分析所用到的数据库包括KEGG、Biocarta等数据库,但不仅限于这些数据库。基于KEGG数据库,对差异基因利用Fisher精确检验和卡方检验,把目标基因参与的Pathway进行显著性分析,按照Pvalue<0.05进行筛选,得到显著性的Pathway。在研究两组样本差异时,我们把差异基因作为研究对象,进行进一步的研究,由于芯片检测过程中,每组仅有3张芯片,属于小样本数据(小于30),容易造成较高的误差。目前,现有 ...
【技术保护点】
一种显著性分析方法,其特征在于,包括以下步骤:步骤1:分别利用fisher精确检验和χ2检验,分别得到p值和p(k)值,通过多重比较检验,确定pathway的FDR;最后得出显著性pathway,完成pathway‑Analysis;ENRICHMENT计算公式为:Re=nf/nNf/N,(Re=ENRICHMENT)]]>nf:表示差异基因在pathway中的数目;Nf:表示差异基因的数目;n:表示pathway中含有基因的总数目;N:表示芯片上检测出来基因的总数目;p1:表示差异基因落在pathway中的概率;p2:表示差非异基因不落在pathway中的概率;假设:H0:p1=p2,H1:p1≠p2;步骤2:在小样本的情况下,通常使用随机方差模型的t检验或F检验进行差异基因筛选;对于两种类型的差异基因,采用t检验来鉴别差异性;首先设为各类型中样本的平均值,为其方差,样本量分别为n1,n2,检测的统计量为:其中t服从自由度为n1+n2‑2的t分布;随机方差模型在于估计t检验中的方差选择反伽玛分布作为此方差的方差模型;首先,选择的线性模型为:yij=x′iβj+εij;其中,yij为来 ...
【技术特征摘要】
1.一种显著性分析方法,其特征在于,包括以下步骤:步骤1:分别利用fisher精确检验和χ2检验,分别得到p值和p(k)值,通过多重比较检验,确定pathway的FDR;最后得出显著性pathway,完成pathway-Analysis;ENRICHMENT计算公式为:Re=nf/nNf/N,(Re=ENRICHMENT)]]>nf:表示差异基因在pathway中的数目;Nf:表示差异基因的数目;n:表示pathway中含有基因的总数目;N:表示芯片上检测出来基因的总数目;p1:表示差异基因落在pathway中的概率;p2:表示差非异基因不落在pathway中的概率;假设:H0:p1=p2,H1:p1≠p2;步骤2:在小样本的情况下,通常使用随机方差模型的t检验或F检验进行差异基因筛选;对于两种类型的差异基因,采用t检验来鉴别差异性;首先设为各类型中样本的平均值,为其方差,样本量分别为n1,n2,检测的统计量为:其中t服从自由度为n1+n2-2的t分布;随机方差模型在于估计t检验中的方差选择反伽玛分布作为此方差的方差模型;首先,选择的线性模型为:yij=x′iβj+εij;其中,yij为来自i样本的基因j的标准化表达值,xi为标志不同类型特性的向量,...
【专利技术属性】
技术研发人员:贺建忠,刘坤,陈宏伟,王永,常卫华,白万胜,郭心怀,
申请(专利权)人:塔里木大学,
类型:发明
国别省市:新疆;65
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。