一种基于转录组的准确高效的真核生物基因鉴定方法技术

技术编号:19357831 阅读:47 留言:0更新日期:2018-11-07 20:26
本发明专利技术公开了一种基于转录组的准确高效的真核生物基因鉴定方法,包括如下工艺步骤:拟鉴定基因表达预测;拟鉴定基因高表达样品的采集和RNA提取与反转录;转录组测序;转录组数据分析与存储;转录组数据的调取;基因鉴定引物的设计与基因鉴定。具体是通过近缘物种的研究报告分析,测定待鉴定基因表达丰富样本的转录组,再在转录组中筛选待鉴定基因的目的序列,并以此为基础进行基因的鉴定克隆,得到准确的基因序列。本技术手段适用于大多数真核生物的功能基因鉴定,十分准确,满足了研究过程功能基因鉴定的研究需求。本发明专利技术设计合理,使用简单,成本相对较低,适合推广使用。

An accurate and efficient method for identifying eukaryotic genes based on transcriptome

The invention discloses an accurate and efficient eukaryotic gene identification method based on transcriptome, which comprises the following technological steps: to identify gene expression prediction; to collect samples with high expression of genes to be identified and to extract and reverse transcription RNA; to sequence transcriptomes; to analyze and store transcriptome data; to extract gene expression data; Identification of primer design and gene identification. Specifically, through the analysis of research reports of related species, the transcriptome of the samples with abundant gene expression to be identified was determined, and then the target sequence of the genes to be identified was screened in the transcriptome. On this basis, the identification and cloning of the genes were carried out, and the accurate gene sequence was obtained. This technique is suitable for functional gene identification in most eukaryotic organisms, and it is very accurate and meets the research needs of functional gene identification in the research process. The invention is reasonable in design, simple in use and relatively low in cost, and suitable for popularization and application.

【技术实现步骤摘要】
一种基于转录组的准确高效的真核生物基因鉴定方法
本专利技术涉及生物
,尤其是涉及一种基于转录组的准确高效的真核生物基因鉴定方法。
技术介绍
自人类基因组测序完成以来,越来越多的生物的基因组测序完成。基于基因组鉴定生物基因相对容易。然而,完成基因组测序的物种所占比例极小,大部分的物种都需要通过同源克隆的方式鉴定物种本身的基因。同源克隆对于近缘物种中已鉴定得到对应基因的情况下,效果较好。然而,在鉴定物种间一致性低的基因以及一些进化地位特殊的物种的基因时,同源克隆往往无法达到令人满意的效果。这是往往需要分析基因的保守位点,设计兼并引物,可能同时需要几对,甚至十几对的引物才能获得目的基因。大大增加了鉴定的经济成本和时间成本。转录组是继基因组学后另一大组学研究热点。由于转录组测序技术的发展,以及转录组测序和数据分析相对基因组简单,转录组测序成本远远低于基因组测序。转录组测序理论上能够获得某个样本中全部表达的基因的序列。因此,一次转录测序构建的数据库可为成千山万个基因的鉴定提供基础数据库。转录组测序的成本平摊到每一个基因的鉴定上低至几毛钱至几元钱,这远远低于多次引物的设计合成成本。
技术实现思路
本专利技术提供一种基于转录组的准确高效的真核生物基因鉴定方法,可以有效解决上述
技术介绍
中的问题。本专利技术的技术方案概述如下:一种基于转录组的准确高效的真核生物基因鉴定方法,包括如下工艺步骤:第1步,拟鉴定基因表达预测:首先利用基因的基本信息,以及其在其他物种中的研究结果预测待鉴定基因本身的表达的情况,确定待鉴定基因高表达的时空信息;第2步,拟鉴定基因高表达样品的采集和RNA提取与反转录:待鉴定基因高表达样品的要求为,待鉴定基因的表达量高,样品容易采集且RNA容易提取,根据此要求,利用真核生物特有的PolyA富集RNA,片段化RNA后反转录得到所需的cDNA文库;第3步,转录组测序:使用高通量测序平台对cDNA文库进行测序;第4步,转录组数据分析与存储:对cDNA文库的转录组数据质控、拼接,并进行功能注释,注释结果保存于EXCEL;第5步,转录组数据的调取:利用EXCEL的搜索功能,以待鉴定基因为关键词进行搜索,将需要鉴定的基因名在功能注释的EXCEL中搜索定位其在转录组中的位置,调出对应的转录组序列,若找到多个序列,则进行序列比对,筛选正确的序列用于引物设计;第6步,基因鉴定引物的设计与基因鉴定:根据筛选到的序列对序列进行整理分析,预测其CDS并设计序列特异性引物,进行基因鉴定。优选的是,所述第1步中具体可使用相关的查询数据库,如THEHUMANPROTEINATLAS(https://www.proteinatlas.org),此外,一些特殊的物种可参考其近缘物种的研究报告。优选的是,所述第2步中的RNA提取过程中利用OligoT富集包含PolyA的全部RNA,并使用但不限于agilent2200检测RNA和cDNA文库质量。优选的是,所述第3步中的高通量测序平台包括但不限于HiSeq-2500、Hiseq-2000、罗氏454和Iontorrent。优选的是,所述第4步中的质控包括错误率的分布、Reads的组成、cleandata数据;拼接使用Trinity中三个独立的模块进行,即茧(Inchworm)、蛹(Chrysalis)、蝶(Butterfly);基因功能注释则使用七大数据库进行,包括Nr,Nt,Pfam,KOG/COG,Swiss-prot,KEGG,GO;所述第4步中的注释结果包括但不限于拼接转录本信息、Corset转录本层次聚类信息,以及功能注释结果。优选的是,所述第5步中的EXCEL的搜索功能定位是使用Ultraedit软件的搜索功能定位所需要的序列,所述第5步中序列比对采用MEGA进行,并使用NCBI的Blast功能进行验证。优选的是,所述第6步中的序列整理的格式为.fasta格式,序列的整理分析使用MEGA软件;引物设计使用但不限于premierprimer、Oligo、VectorNTISuit、Dnasis、Omiga和Dnastar;根据引物是否添加酶切位点及PCR酶的特性选用适当的克隆载体完成基因鉴定。优选的是,执行引物的PCR,胶回收PCR产物,克隆到适宜的载体中,对克隆菌液进行测序,测序结果用DNAstar软件包分析,拼接,分析结果在NCBI中比对确定鉴定基因的准确性,完成基因鉴定,其克隆的载体使用但不限于PMD19-T、PMD18-T。与现有技术相比,本专利技术的有益效果是:该种基于转录组的准确高效的真核生物基因鉴定方法,技术设计完整紧凑,具体是通过近缘物种的研究报告分析,测定待鉴定基因表达丰富样本的转录组,再在转录组中筛选待鉴定基因的目的序列,并以此为基础进行基因的鉴定克隆,得到准确的基因序列。本技术手段适用于大多数真核生物的功能基因鉴定,十分准确,满足了研究过程功能基因鉴定的研究需求。本专利技术设计合理,使用简单,成本相对较低,适合推广使用。具体实施方式下面将对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例,基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。实施例一种基于转录组的准确高效的真核生物基因鉴定方法,包括如下工艺步骤:第1步,拟鉴定基因表达预测:使用THEHUMANPROTEINATLAS数据库搜索Leptin的组织表达情况,发现其在软组织和脂肪组织中表达量高,根据查询结果推测leptin在达氏鲟脂肪组织中高表达,然而只有50cm以上的达氏鲟才能比较容易采集到脂肪组织,而实验室样本的达氏鲟约为20cm,考虑到肝脏中含有大量的脂肪细胞,推测肝脏中也表达leptin,因此采集达氏鲟肝脏作为转录组测序样品;第2步,拟鉴定基因高表达样品的采集和RNA提取与反转录:在二级生物安全柜中快速解剖达氏鲟取出肝脏,于液氮中速冻后,提取RNA,琼脂糖凝胶电泳分析RNA降解程度以及是否有污染;Nanodrop检测RNA的纯度(OD260/280比值);Qubit对RNA浓度进行精确定量;Agilent2200精确检测RNA的完整性,用带有Oligo(dT)的磁珠富集真核生物mRNA;随后加入fragmentationbuffer将mRNA打断成短片段,以mRNA为模板,用六碱基随机引物(randomhexamers)合成一链cDNA,并加上A尾和测序接头;Agilent2200对文库的insertsize进行检测;第3步,转录组测序:库检合格后,把不同文库按照有效浓度及目标下机数据量的需求pooling后进行IlluminaHiSeq测序;第4步,转录组数据分析与存储:转录组质控包括错误率的分布、Reads的组成和cleandata数据;Trinity拼接后的文件保存为FATA格式,并进行Corset层次聚类,层次聚类结果保存为FASTA格式,使用七大数据库进行基因功能注释,包括Nr,Nt,Pfam,KOG/COG,Swiss-prot,KEGG,GO,并将功能注释结果储存于EXCEL表格中;第5步,转录组数据的调取:以leptin作为搜索关键词在EXCEL表格中进行本文档来自技高网...

【技术保护点】
1.一种基于转录组的准确高效的真核生物基因鉴定方法,其特征在于,包括如下工艺步骤:第1步,拟鉴定基因表达预测:首先利用基因的基本信息,以及其在其他物种中的研究结果预测待鉴定基因本身的表达的情况,确定待鉴定基因高表达的时空信息;第2步,拟鉴定基因高表达样品的采集和RNA提取与反转录:待鉴定基因高表达样品的要求为,待鉴定基因的表达量高,样品容易采集且RNA容易提取,根据此要求,利用真核生物特有的Poly A富集RNA,片段化RNA后反转录得到所需的cDNA文库;第3步,转录组测序:使用高通量测序平台对cDNA文库进行测序;第4步,转录组数据分析与存储:对cDNA文库的转录组数据质控、拼接,并进行功能注释,注释结果保存于EXCEL;第5步,转录组数据的调取:利用EXCEL的搜索功能,以待鉴定基因为关键词进行搜索,将需要鉴定的基因名在功能注释的EXCEL中搜索定位其在转录组中的位置,调出对应的转录组序列,若找到多个序列,则进行序列比对,筛选正确的序列用于引物设计;第6步,基因鉴定引物的设计与基因鉴定:根据筛选到的序列对序列进行整理分析,预测其CDS并设计序列特异性引物,进行基因鉴定。

【技术特征摘要】
1.一种基于转录组的准确高效的真核生物基因鉴定方法,其特征在于,包括如下工艺步骤:第1步,拟鉴定基因表达预测:首先利用基因的基本信息,以及其在其他物种中的研究结果预测待鉴定基因本身的表达的情况,确定待鉴定基因高表达的时空信息;第2步,拟鉴定基因高表达样品的采集和RNA提取与反转录:待鉴定基因高表达样品的要求为,待鉴定基因的表达量高,样品容易采集且RNA容易提取,根据此要求,利用真核生物特有的PolyA富集RNA,片段化RNA后反转录得到所需的cDNA文库;第3步,转录组测序:使用高通量测序平台对cDNA文库进行测序;第4步,转录组数据分析与存储:对cDNA文库的转录组数据质控、拼接,并进行功能注释,注释结果保存于EXCEL;第5步,转录组数据的调取:利用EXCEL的搜索功能,以待鉴定基因为关键词进行搜索,将需要鉴定的基因名在功能注释的EXCEL中搜索定位其在转录组中的位置,调出对应的转录组序列,若找到多个序列,则进行序列比对,筛选正确的序列用于引物设计;第6步,基因鉴定引物的设计与基因鉴定:根据筛选到的序列对序列进行整理分析,预测其CDS并设计序列特异性引物,进行基因鉴定。2.根据权利要求1所述的一种基于转录组的准确高效的真核生物基因鉴定方法,其特征在于,所述第1步中具体可使用相关的查询数据库,如THEHUMANPROTEINATLAS(https://www.proteinatlas.org),此外,一些特殊的物种可参考其近缘物种的研究报告。3.根据权利要求1所述的一种基于转录组的准确高效的真核生物基因鉴定方法,其特征在于,所述第2步中的RNA提取过程中利用OligoT富集包含PolyA的全部RNA,并使用但不限于agilent2200检测RNA和cDNA文库质量。4.根据权利要求1所述的一种基于转录组的准确高效的真核生物基因鉴定方法,其...

【专利技术属性】
技术研发人员:李志琼汪斌陈虎齐锦雯陈德芳唐妮王书瑶田正志吴源冰王美徐少奇
申请(专利权)人:四川农业大学
类型:发明
国别省市:四川,51

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1