一种基于GEMMA的GWAS分析方法及装置制造方法及图纸

技术编号:15039294 阅读:2373 留言:0更新日期:2017-04-05 13:06
本发明专利技术涉及一种基于GEMMA的GWAS分析方法及装置,其特征在于包括:将vcf文件一次性转换为GEMMA所需的bim、fam、bed文件;将所得bim,bed,fam文件通过GEMMA进行关联分析;对关联分析后的结果分别进行制作曼哈顿图、QQ图和SNP注释文件,完成GWAS分析。本发明专利技术将vcf文件和表型文件作为输入,一次性生成GWAS分析结果,大大提高了分析效率,使GWAS分析更加快捷,简单。使基于GEMMA的GWAS流程一体化,能灵活的分三个模块进行操作,也可一次性输入参数以执行整个流程,分析参数的调整十分灵活。

【技术实现步骤摘要】

本专利技术涉及一种全基因组关联分析方法及装置,特别是关于一种基于GEMMA(转基因生物分析系统)的GWAS分析方法及装置。
技术介绍
GEMMA(转基因生物分析系统)进行GWAS(Genome-wideassociationstudy,全基因组关联分析)分析,需将vcf文件进行多步的格式转换以生成GEMMA所需的输入文件,而GEMMA分析过程又分为多步,且不能生成曼哈顿、QQ图和关联位点的注释文件。全基因组关联分析是通过计算不同生物个体的基因组中的单核苷酸多样性(SNP)位点,并将这些分子标记信息与生物个体的性状进行相关性分析,最终定位影响性状的变异基因的一种方法。全基因组关联分析会比较具有不同特征的动植物的基因组,这些特征包括动植物的感病与不感病,或者连续性状如株高,体重,果实大小等。通过SNP芯片或重测序手段得到DNA信息,并从中提取数以十万计的基因突变位点(通常为SNP位点)。当一种类型的变异在某种动植物身上具有更大的频率时,则认为该变异与目标性状有关。此外,对于人的疾病性状也可用GWAS进行研究。作为全基因组关联分析(GWAS)的有效手段,GEMMA可根据群体SNP位点信息进行性状的基因组定位。关联分析可选用单变量线性混合模型(LMM),多变量线性混合模型(mvLMM),贝叶斯稀疏线性混合模型(BSLMM)等多种模型,以满足不同分析需求。GEMMA进行GWAS的主要步骤如下:1)使用相关软件对包含SNP位点信息的vcf文件处理,将SNP位点缺失基因型部分进行推断,得到新的vcf文件;2)将步骤1)中所得vcf文件进行maf阈值过滤或哈温平衡过滤;3)将步骤2)中所得vcf文件通过vcftools转换为plink所需的ped文件;4)使用plink软件将ped文件转换为GEMMA所需的bim,fam,bed文件;5)使用脚本将fam文件加入表型信息;6)将bim,fam,bed文件作为输入,使用GEMMA进行群体结构的计算,得出群体结构矩阵;7)根据bim,fam,bed和群体结构矩阵文件,使用GEMMA进行关联分析,最终得到关联分析结果文件。使用GEMMA进行GWAS分析步骤较多,这对于那些对生物分析软件不甚熟悉但又对GWAS分析感兴趣的科学家及企业来说,整个流程的使用较为困难;而且GEMMA的分析结果不包含曼哈顿图和QQ图,以及SNP位点的注释信息。
技术实现思路
针对上述问题,本专利技术的目的是提供一种基于GEMMA的GWAS分析方法及装置,其分析快捷、简单,并有效提高了分析效率。为实现上述目的,本专利技术采取以下技术方案:一种基于GEMMA的GWAS分析方法,其特征在于包括以下步骤:1)将vcf文件一次性转换为GEMMA所需的bim、fam、bed文件;2)将所得bim,bed,fam文件通过GEMMA进行关联分析;3)对关联分析后的结果分别进行制作曼哈顿图、QQ图和SNP注释文件,完成GWAS分析。进一步,所述步骤1)中,转换过程如下:1.1)采用现有方法将vcf文件进行SNP缺失基因型推断;1.2)将推断处理后的vcf文件进行maf或哈温平衡过滤;1.3)将经步骤1.2)处理后的文件经vcftools转换为ped格式文件;1.4)将ped格式文件通过plink软件转换为bim,bed,fam文件;1.5)在所得fam文件中添加表型信息得到新的fam文件。进一步,所述步骤2)中,关联分析步骤如下:2.1)将所得bim,bed,fam文件作为输入,通过GEMMA计算得到亲缘关系矩阵文件;2.2)将bim,bed,fam文件以及亲缘关系矩阵文件作为输入,并选取LMM、mvLMM和BSLMM中的一种模型,通过GEMMA进行性状关联分析。一种基于GEMMA的GWAS分析装置,其特征在于:该装置包括转换模块、关联分析模块和关联分析结果处理模块;所述转换模块用于将vcf文件一次性转换为GEMMA所需的bim、fam、bed文件;所述关联分析模块用于将所得bim,bed,fam文件通过GEMMA进行关联分析;所述关联分析结果处理模块用于对关联分析后的结果分别进行制作曼哈顿图、QQ图和SNP注释文件。进一步,所述转换模块、关联分析模块和关联分析结果处理模块能单独使用。进一步,所述转换模块、关联分析模块和关联分析结果处理模块能全部一次性使用。本专利技术由于采取以上技术方案,其具有以下优点:1、本专利技术将vcf文件和表型文件作为输入,一次性生成GWAS分析结果,大大提高了分析效率,使GWAS分析更加快捷,简单。2、本专利技术使基于GEMMA的GWAS流程一体化,能灵活的分三个模块进行操作,也可一次性输入参数以执行整个流程,分析参数的调整十分灵活。3、本专利技术针对GWAS分析可省去繁琐的分析步骤,使用者仅需进行简单操作即可实现GWAS分析,而无须对处理过程中所涉及的软件进行学习,并能得到曼哈顿图,QQ图及SNP注释信息。附图说明图1是本专利技术将vcf文件一次性转换为bim、fam、bed文件的流程示意图;图2是本专利技术的关联分析流程示意图;图3是本专利技术制作曼哈顿图、QQ图和SNP注释文件流程示意图。具体实施方式本专利技术针对GWAS分析步骤较为繁琐的问题,将整个流程一体化,参数的输入仅需一步,并对关联分析结果进行曼哈顿,QQ作图以及对相关SNP位点进行注释分析。该专利技术包含3个模块,即可一次性得出结果,也可分步执行命令,更为灵活。下面结合附图和实施例对本专利技术进行详细的描述。本专利技术提供一种基于GEMMA的GWAS分析方法,其包括以下步骤:1)将vcf文件一次性转换为GEMMA所需的bim、fam、bed文件,三种文件中分别包含基因型、表型和SNP位点信息;如图1所示,具体转换过程如下:1.1)采用现有方法将vcf文件进行SNP缺失基因型推断;1.2)将推断处理后的vcf文件进行maf或哈温平衡过滤;1.3)将经步骤1.2)处理后的文件经vcftools(vcf文件处理工具)转换为ped格式文件;1.4)将ped格式文件通过plink软件转换为bim,bed,fam文件;1.5)在所得fam文件中添加表型信息得到新的fam文件。2)将所得bim,bed,fam文件通过GEMMA进行关联分析;如图2所示,关联分析具体步骤如下:2.1)将所得bim,bed,fam文件作为输入,通过GEMMA计算得到亲缘关系矩阵文件;2.2)将bim,bed,fam文件以及亲缘关系矩阵文件作为输入,并选取LMM、mvLMM和BSLMM中的一种模型,通过GEMMA进行性状关联分析;3)如图3所示,对关联分析后的结果分别进行制作曼哈顿图、QQ图和SNP注释文件,完成GWAS分析,通过QQ图对所选取模型进行评估。上述步骤3)中,根据性状关联结果进行曼哈顿作图,其中作图时的P-value阈值根据SNP数量进行Bonferoni矫正。上述步骤3)中,根据超过阈值的SNP位点信息,确定性状相关基因并对SNP位点进行注释。本专利技术还提供一种基于GEMMA的GWAS分析装置,该装置包括转换模块、关联分析模块和关联分析结果处理模块。其中:转换模块用于将vcf文件一次性转换为GEMMA所需的bim、fam、bed文件;关联分析模块用于将所得bim,bed,fam文件通过GEM本文档来自技高网
...

【技术保护点】
一种基于GEMMA的GWAS分析方法,其特征在于包括以下步骤:1)将vcf文件一次性转换为GEMMA所需的bim、fam、bed文件;2)将所得bim,bed,fam文件通过GEMMA进行关联分析;3)对关联分析后的结果分别进行制作曼哈顿图、QQ图和SNP注释文件,完成GWAS分析。

【技术特征摘要】
1.一种基于GEMMA的GWAS分析方法,其特征在于包括以下步骤:1)将vcf文件一次性转换为GEMMA所需的bim、fam、bed文件;2)将所得bim,bed,fam文件通过GEMMA进行关联分析;3)对关联分析后的结果分别进行制作曼哈顿图、QQ图和SNP注释文件,完成GWAS分析。2.如权利要求1所述的一种基于GEMMA的GWAS分析方法,其特征在于:所述步骤1)中,转换过程如下:1.1)采用现有方法将vcf文件进行SNP缺失基因型推断;1.2)将推断处理后的vcf文件进行maf或哈温平衡过滤;1.3)将经步骤1.2)处理后的文件经vcftools转换为ped格式文件;1.4)将ped格式文件通过plink软件转换为bim,bed,fam文件;1.5)在所得fam文件中添加表型信息得到新的fam文件。3.如权利要求1所述的一种基于GEMMA的GWAS分析方法,其特征在于:所述步骤2)中,关联分析步骤如下:2.1)将所得bim,be...

【专利技术属性】
技术研发人员:谢华于洋徐摇光
申请(专利权)人:北京市农林科学院
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1