一种通用寡核苷酸序列库的构建及应用制造技术

技术编号:6535049 阅读:344 留言:0更新日期:2012-04-11 18:40
本发明专利技术公开了一种通用寡核苷酸序列库的构建及应用。传统遗传信息分析通常采用“一对一”的模式,如一条探针分析一个基因。这种模式的缺点和局限在于:缺乏通用性,成本高昂;从高度复杂的基因库直接到单一基因,无法对基因库进行分组分析;需要知道至少16个碱基的序列。本发明专利技术通过生物信息学的手段对多个已测序的物种进行序列分析,构建通用寡核苷酸序列库,克服传统“一对一”模式的局限。本发明专利技术的通用寡核苷酸序列库可应用于如下领域:作为分析探针用于实时荧光PCR;作为捕获探针用于DNA矩阵列、DNA固态芯片、基于磁珠或其它基质的液体芯片;作为通用引物启动一组带有该引物序列的RNA的反转录或DNA的复制。

【技术实现步骤摘要】

本专利技术属于生物
,通过生物信息学的手段和优化算法对多个物种的遗传信息进行挖掘,得到由少数高频寡核苷酸序列组成的通用序列库。具体涉及一种可对多物种进行集成化实验设计的通用寡核苷酸序列库的构建方法及其应用领域。
技术介绍
基于核酸序列的遗传信息分析是生物学的重要内容和技术手段。核酸序列分析的实验技术利用碱基互补配对的高度精确性,实现对某一特定目标DNA序列的检测。传统遗传信息分析通常使用“一对一”的模式,如一条探针分析一个基因。这种“一对一”的模式,虽然有专一性高的特点,但其缺点和局限也很明显第一,缺乏通用性,导致成本高昂。例如,实时定量PCR(qPCR)实验中,对所选探针专一性和通用性的平衡始终是一个挑战。常用的由淬灭基团和荧光报导基团组成的双标记寡核苷酸荧光探针,也称为水解探针 (hydrolysis probes)或TaqMan探针,设计为与目标序列上、下游引物间的序列配对,虽然具有较高的专一性,但这种“一对一”的模式没有灵活性和通用性,成本高昂。一旦目的序列或设计的引物改变,原先合成的探针便无用处。而本专利技术通过选择通用库中的探针,配合专一性的引物进行qPCR实验,即保证了对目标序列的专一性,又使探针具有通用性。第二,“一对一”的模式直接从高度复杂的基因库到单一基因,无法对基因库进行分组分析。目前利用专一捕获探针进行靶序列捕获的基因捕获技术,虽然保证了对单一序列的特异性捕获,但无法对某一组功能基因进行分组分析,可重复利用性低,也导致了成本高昂。在本专利技术中,通过设计通用捕获探针的多种组合,可得到多种靶序列的分离、提纯;通过设计一系列这样的捕获探针组合,可实现对高度复杂的遗传信息的定向分离、筛选。第三,“一对一”模式要求使用较长的探针或引物,通常需要知道至少16个碱基的序列,因而不适用序列不明的基因。而本专利技术的通用寡核苷酸序列库只需要8-12个碱基的序列,作为通用引物可启动一组带有该引物序列的RNA的反转录或DNA的复制。随着 LNA (Locked Nucleic Acid)和 ZNA (Zip Nucleic Acids)等核苷酸修饰技术的出现,大幅度提高了短探针的解链温度,使得用8-12个碱基的短序列设计引物和各种探针成为可能。本专利技术通过建立通用寡核苷酸序列库,采用“一对多”的策略对传统遗传信息分析中“一对一”的模式进行补充和优化,可极大程度的降低遗传信息分析成本,并实现对遗传信息的分组分析。
技术实现思路
本专利技术涉及一种通用寡核苷酸序列库的构建方法及其应用,这里的寡核苷酸序列是一类可作为实验探针、引物的,经过分子修饰的8-12个碱基短序列。本专利技术通过生物信息学的手段,对多种模式生物和已测序物种的转录组、全基因组序列等信息进行挖掘;通过设计优化算法,对高频分布的寡核苷酸序列进行评价、筛选,最终得到由少量寡核苷酸组成的通用序列库。本专利技术涉及对16个物种转录组、基因组中的高频8-12个碱基短序列的优化建库, 包括七种模式生物人、黑猩猩、小鼠、大鼠、果蝇、线虫、拟南芥;和已测序的九个物种称猴、牛、狗、马、原鸡、斑马鱼、海鞘、水稻和葡萄。并通过整合各个物种的通用序列库,得到对绝大多数物种适用的通用寡核苷酸序列库。一种构建通用寡核苷酸序列库的方法如图1所示,对所有可能的该长度的寡核苷酸序列,去掉出现连续四位相同碱基的序列;每条序列的GC含量在30% -70%之间。对这样的备选序列,我们分别在物种的转录组、基因组等目标序列集中对其出现频率和分布情况进行分析,选取出现频率最高的一部分序列组成高频备用寡核苷酸序列库。所选择的序列应不低于备选序列总数的0. 1%,不高于备选序列总数的15%。后设计贪婪算法对备选高频序列在目标序列集中的分布情况进行分析,得到对目标序列集最优化的通用探针组合,即构成该目标序列集的通用寡核苷酸序列库。由于图1的备选高频寡核苷酸序列库中存在大量的相似序列,它们大部分交叉重叠或仅相差1-2个碱基,这样的寡核苷酸序列往往互相伴随且均高频出现;此外,某些高频寡核苷酸序列在目标序列集的分布较集中,且盲区较多。对构建一个优化的通用序列库,显然仅仅统计目标序列集中寡核苷酸序列的出现频率是远远不够的。需要我们考察每条寡核苷酸序列及各种序列组合在目标序列集中的分布情况,利用一定数目的寡核苷酸序列对目标序列集中序列获得最大覆盖率的同时,保证寡核苷酸序列分布的均勻性和一定的分布密度,尽量少出现分布的盲区,这样得到的一组寡核苷酸序列才可作为优化的通用库。基于上述考虑,本专利技术设计贪婪算法,对每条寡核苷酸序列及各种序列组合在目标序列集中的分布情况进行评价、打分。如图2所示,函数S(Pi)表示探针Pi对某序列集的分布函数;S(Pl,p2,…,pk)表示探针组Pl,p2,…,Pk在该序列集的联合分布函数。对于包含η个探针的备选高频探针集(库)R= {Pl, P2,…,Pj,我们有贪婪递进算法=S1 = max {S (Pi)}, Pi e R ;Sk = max (Sk^1 U S (Pi)},Pi G R 且 Pi 不在 Si^1 中。其中&表示高频探针库R中包含k个探针的最佳联合分布组合。通过设计合理的打分函数可使&达到对目标序列集理想的覆盖率和分布情况。本专利技术通过对具有代表性的16个物种转录组、基因组的一次优化建库,即可通过通用库中少量寡核苷酸序列的选择和组合,对绝大多数物种的遗传信息进行实验设计、分组分析。寡核苷酸序列在用作分析探针、捕获探针时,可通过LNA (Locked Nucleic Acid)、 ZNA(Zip Nucleic Acids)等核苷酸修饰技术提高其解链温度。这种新颖的“一对多”设计理念真正意义上实现了探针的一次合成、多种使用,与传统的“一对一”分析相比大大的降低了成本、提高了实验效率,在不失对目的序列专一性的前提下达到了极佳的通用效果,具体可应用于如下领域一、可对多个物种进行qPCR的通用探针设计。一般仅需要由70个左右的8bp、或140个左右的9bp的通用探针库,就可以对单个物种几乎所有的转录本进行定量分析或SNP分型。通过在qPCR实验中引入专一性的引物,配合选择通用库中的检测探针, 可同时保证对目标序列的专一性和探针设计的通用性,达到“以不变应万变”的理想效果。二、可作为捕获探针用于DNA矩阵列,DNA固态芯片,或基于磁珠(磁性微小球)或其它基质的液体芯片。通过设计有限的通用捕获探针的多种排列组合,得到多种靶序列的分离和提纯;也可设计对一组功能相关基因的通用捕获探针,实现对高度复杂的基因库的定向分离、筛选。三、作为通用引物启动一组带有该引物序列的RNA的反转录或DNA的复制。如可对未测序物种的基因组样本进行通用引物的设计通过对与待检物种亲缘关系较近的已测序物种基因组信息的挖掘,构建其基因组的通用寡核苷酸引物库,利用通用引物库中少量 8-12个碱基的短引物,即可对待检基因组的PCR实验进行优化设计,得到比随机引物PCR更为理想的实验结果。附图说明图1为构建通用寡核苷酸序列库的流程图。图2为通过贪婪算法筛选通用探针库的示意图。图3为通过捕获探针的组合对核酸序列文库分组分析的示意图。具体实施例方式实施例1 构建多物种转录组的通用寡核苷酸探针库如图1、图2所本文档来自技高网
...

【技术保护点】
1.一种构建通用寡核苷酸序列库的方法,其特征在于:对于可作为探针、引物的一类寡核苷酸序列,在目标序列集的中统计它们的出现频率,得到高频备用寡核苷酸序列库。后通过贪婪算法对高频序列库中的每条序列及不同的序列组合进行分布分析,利用最少的寡核苷酸序列达到对目标序列集最大的覆盖率,并保证探针分布的均匀性和分布密度,这样的一组寡核苷酸序列即构成通用序列库。

【技术特征摘要】
1.一种构建通用寡核苷酸序列库的方法,其特征在于对于可作为探针、引物的一类寡核苷酸序列,在目标序列集的中统计它们的出现频率,得到高频备用寡核苷酸序列库。后通过贪婪算法对高频序列库中的每条序列及不同的序列组合进行分布分析,利用最少的寡核苷酸序列达到对目标序列集最大的覆盖率,并保证探针分布的均勻性和分布密度,这样的一组寡核苷酸序列即构成通用序列库。2.如权利要求1所述的构建通用寡核苷酸序列库的方法,其特征在于寡核苷酸序列中不出现连续四位相同的碱基,序列的GC含量应在30 % -70 %之间。3.如权利要求1所述的构建通用寡核苷酸序列库的方法,其特征在于所选的寡核苷酸序列长度应在8-12个碱基。4.如权利要求1所述的构建通用寡核苷酸序列库的方法,其特征在于待分析的目标序列集可以是任何物种的转录组、基因组或任何一组核苷酸序列。5.如权利要求1所述的构建通用寡核苷酸序列库的方法,其特征在于将...

【专利技术属性】
技术研发人员:雷向东魏崟泷
申请(专利权)人:常州楚天生物科技有限公司
类型:发明
国别省市:32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1