一种转录组参考的关联分析方法及其应用技术

技术编号:17902698 阅读:41 留言:0更新日期:2018-05-10 13:09
本发明专利技术涉及一种转录组参考的关联分析方法,包括:1).建立一个参考群体并将所述参考群体的所有个体的转录组序列测通得到参考转录本;2).对预测群体进行高通量RNA测序,并将所得到的测序数据与所述参考转录本进行比对拼接,得到群体转录组测序结果;3).由所述群体转录组测序结果中分析得到群体SNP的数据,利用所述群体SNP与感兴趣的性状进行关联分析,确定目标基因所在区域;再利用目标区域的基因表达变异与性状进行关联,得到目标性状的候选基因。与GWAS相比,转录组测序便宜、快速且不受基因组复杂性所限制。该技术理论上可以实现在所有物种中开展性状关联分析,无论该物种有无参考基因组、基因组是否很复杂。

A transcriptome reference association analysis method and its application

The present invention relates to a method of association analysis for the reference of a transcriptional group, including: 1). A reference group is established and the transcriptional sequence of all the individuals of the reference group is detected to get a reference transcript; 2) the high flux RNA sequencing of the predicted population is carried out and the obtained sequence data are compared with the reference transcript. Then, the results of the group transcriptome sequencing were obtained; 3) the data of the group SNP were analyzed by the sequence of the group transcriptome, and the correlation analysis between the group SNP and the interested characters was used to determine the region of the target gene, and the gene expression in the target region was used to relate the traits to the traits, and the target traits were obtained. Candidate genes. Compared with GWAS, transcriptome sequencing is cheap and fast, and is not limited by genomic complexity. The technology can theoretically carry out trait association analysis in all species, regardless of whether the species has a reference genome or whether the genome is very complicated.

【技术实现步骤摘要】
一种转录组参考的关联分析方法及其应用
本专利技术涉及生物
,具体而言,涉及一种转录组参考的关联分析方法及其应用。
技术介绍
随着测序技术的发展以及高密度单核苷酸多态性(singlenucleotideploymorphism,SNP)芯片的普及,全基因组关联分析(Genome-wideassociationstudy,GWAS)已经日益成为了人类疾病研究及动物育种的一个有力工具。GWAS是基于连锁不平衡原理,通过在自然群体中分析基因组中数以万计的SNP标记与目标性状的关联性,以实现目标性状基因的定位。随着对GWAS的深入研究,它还逐渐暴露出了以下一些缺陷,具体有:第一、为了实现全基因组SNP标记的识别,需要开展样本的重测序,并与参考基因组比对。但是目前仅有少数物种完成了全基因组测序,具备开展GWAS所需要的参考基因组。因而,GWAS方法的一个主要缺点是该技术的应用依赖相应物种的参考基因组。最近的基于简化基因组的GWAS方法虽然不依赖物种的参考基因组,但是因为遗传标记附近的基因信息未知,难以检测到目标性状候选基因,在生物学研究中意义不大。第二、GWAS技术只能将目标基因确定在一个基因组区域,难以直接确定目标性状候选基因。第三、为了避免基因定位时的统计误差,GWAS分析通常需要较大的群体样本。第四、GWAS技术难以确定目标性状候选基因间的相互关系。有鉴于此,特提出本专利技术。
技术实现思路
本专利技术的目的在于提供一种转录组参考的关联分析方法(transcriptome-referencedassociationstudy,TRAS),以解决上述问题。本专利技术涉及一种转录组参考的关联分析方法,包括:1).建立一个参考群体并将所述参考群体的所有个体的转录组序列测通得到参考转录本;2).对预测群体进行高通量RNA测序,并将所得到的测序数据与所述参考转录本进行比对拼接,得到群体转录组测序结果;3).由所述群体转录组测序结果中分析得到群体SNP的数据,利用所述群体SNP与感兴趣的性状进行关联分析,确定目标基因所在区域;再利用目标区域的基因表达变异与性状进行关联,得到目标性状的候选基因。与基因组分析不一样,转录组测序便宜、快速且不受基因组复杂性所限制。本专利技术中利用相应研究物种的全长转录组作为参考序列,取代基因组开展研究群体的SNP识别和基因表达定量。因此,该技术理论上可以实现在所有物种中开展性状关联分析,不管该物种有无参考基因组,基因组是不是很复杂均不影响该技术的实施。具体实施方式本专利技术涉及一种转录组参考的关联分析方法,包括:1).建立一个参考群体并将所述参考群体的所有个体的转录组序列测通得到参考转录本;2).对预测群体进行高通量RNA测序,并将所得到的测序数据与所述参考转录本进行比对拼接,得到群体转录组测序结果;3).由所述群体转录组测序结果中分析得到群体SNP的数据,利用所述群体SNP与感兴趣的性状进行关联分析,确定目标基因所在区域;再利用目标区域的基因表达变异与性状进行关联,得到目标性状的候选基因。本专利技术中TRAS技术分两步进行,首先它和GWAS技术一样,利用SNP与性状进行关联分析,确定目标基因所在的区域。之后,TRAS再利用目标区域的基因表达与性状进行关联,进而确定目标性状候选基因。优选的,如上所述的转录组参考的关联分析方法,所述方法还包括:确定候选基因的eQTL,再于所述eQTL中找是否含有其余的目标性状候选基因。eQTL(Expressionquantitativetraitloci)将来自分离群体的各基因型的表达数据作为一个数量性状,利用传统的QTL分析方法进行分析。本专利技术中,为了确定候选基因间的互作关系,TRAS技术利用候选基因(命名为A基因)的表达量为表型数据,与群体中的SNP开展关联分析,从而确定这些候选基因的eQTL。之后,再在这些eQTL中找是否含目标性状候选基因,如果有(命名为B基因)。因为B基因既是目标性状候选基因,又是另外一个目标性状候选基因的eQTL,进而可以确定A基因和B基因在目标性状调控方面具有互作关系。优选的,如上所述的转录组参考的关联分析方法,所述基因表达变异包括基因序列变异和基因表达量的变异。GWAS只利用一个参数(群体中的序列变异—SNP)与性状进行关联分析,因此为了减少导致误差,分析需要尽可能大的群体样本。而TRAS技术不仅在群体中开展SNP与性状的关联分析,也开展群体中的基因表达变异与性状的关联分析,具有序列变异和基因表达变异两个参数,因此分析群体样本大小可以不必像GWAS那么大。优选的,如上所述的转录组参考的关联分析方法,在步骤1)中,得到所述参考转录本后还包括:对所述参考转录本进行功能注释。优选的,如上所述的转录组参考的关联分析方法,在步骤1)中,所述参考群体中的品种数目≥1个。在本专利技术中,参考群体的作用在于对群体转录组的数据处理作为参考,因此从成本考虑,参考群体的数量不宜设置过多。优选的,如上所述的转录组参考的关联分析方法,在步骤1)中,所述转录组序列测通的方法为单分子实时测序。优选的,如上所述的转录组参考的关联分析方法,在步骤3)中,利用所述群体SNP与感兴趣的性状进行关联分析之前,先对所述群体转录组测序结果进行共表达分析,将在群体中显示共表达的转录本分配到一个模块,并分析所述模块与感兴趣的性状的相关性,识别与所述感兴趣的性状相关的共表达模块。优选的,如上所述的转录组参考的关联分析方法,在步骤3)中,利用所述群体SNP与感兴趣的性状进行关联分析时,所用的关联分析模型为一般线性模型或混合线性模型。优选的,如上所述的转录组参考的关联分析方法,在步骤3)中,利用所述群体SNP与感兴趣的性状进行关联分析时,所述SNP的质量分数≥40,覆盖深度≥2,次要等位基因频率≥0.05,缺失基因型频率≤0.5。如上所述的方法在主效基因的筛查和鉴定、以及基因功能的关联性分析中的应用。下面将结合实施例对本专利技术的实施方案进行详细描述,但是本领域技术人员将会理解,下列实施例仅用于说明本专利技术,而不应视为限制本专利技术的范围。实施例中未注明具体条件者,按照常规条件或制造商建议的条件进行。所用试剂或仪器未注明生产厂商者,均为可以通过市购获得的常规产品。全基因组关联分析(Genome-wideassociationstudy;GWAS)是一种鉴定复杂性状基因的有力工具,但其应用受限于研究物种参考基因组序列的需求。本专利技术提出一种方法,即转录组参考的关联分析技术(transcriptome-referencedassociationstudy,TRAS),其使用由单分子实时测序产生的转录组作为参考序列来评估基因序列和基因表达的种群变异。当两个评分都与性状相关时,候选基因被鉴定,并且它们的潜在相互作用通过表达数量性状基因座分析来确定。在下面的实施例中,通过应用这种方法描述102个地方品种的大蒜鳞茎性状特点,我们确定了23候选转录本,其中大部分显示广泛的相互作用。13个转录本是lncRNAs,其他则是主要涉及碳水化合物代谢和蛋白质降解的蛋白质。TRAS作为独立于参考基因组的关联研究的有效工具,将关联研究的适用性扩展到广泛的物种。实施例一、方法1.植物材料,实验设计和表型测量我们收集了92个中国地方品种和本文档来自技高网...

【技术保护点】
一种转录组参考的关联分析方法,其特征在于,包括:1).建立一个参考群体并将所述参考群体的所有个体的转录组序列测通得到参考转录本;2).对预测群体进行高通量RNA测序,并将所得到的测序数据与所述参考转录本进行比对拼接,得到群体转录组测序结果;3).由所述群体转录组测序结果中分析得到群体SNP的数据,利用所述群体SNP与感兴趣的性状进行关联分析,确定目标基因所在区域;再利用目标区域的基因表达变异与性状进行关联,得到目标性状的候选基因。

【技术特征摘要】
1.一种转录组参考的关联分析方法,其特征在于,包括:1).建立一个参考群体并将所述参考群体的所有个体的转录组序列测通得到参考转录本;2).对预测群体进行高通量RNA测序,并将所得到的测序数据与所述参考转录本进行比对拼接,得到群体转录组测序结果;3).由所述群体转录组测序结果中分析得到群体SNP的数据,利用所述群体SNP与感兴趣的性状进行关联分析,确定目标基因所在区域;再利用目标区域的基因表达变异与性状进行关联,得到目标性状的候选基因。2.根据权利要求1所述的转录组参考的关联分析方法,其特征在于,所述方法还包括:确定候选基因的eQTL,再于所述eQTL中找是否含有其余的目标性状候选基因。3.根据权利要求1所述的转录组参考的关联分析方法,其特征在于,所述基因表达变异包括基因序列变异和基因表达量的变异。4.根据权利要求1所述的转录组参考的关联分析方法,其特征在于,在步骤1)中,得到所述参考转录本后还包括:对所述参考转录本进行功能注释。5.根据权利要求1或4所述的转录组参考的关联分析方法,其特征在于,在步骤1)中,...

【专利技术属性】
技术研发人员:刘头明李富朱四元
申请(专利权)人:中国农业科学院麻类研究所
类型:发明
国别省市:湖南,43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1