一种生物芯片的带有复合标签序列的探针及生物芯片制造技术

技术编号:29243245 阅读:19 留言:0更新日期:2021-07-13 17:08
本发明专利技术提供了一种生物芯片的带有复合标签序列的探针及生物芯片,所述复合标签序列包括至少2段标签序列,每段标签序列的长度为8‑45mer,每段标签序列均符合预设原则。使用本申请的技术方案生成的标签序列的特异性更高,与目标基因组的相似度更低;并且,本申请的技术方案中的探针带有复合标签序列,每一段标签序列分别同时与其互补解码序列发生杂交反应,因此在一次解码实验中获得的信息量增大,解码相同数量的探针所需的解码实验次数减少,从而极大地提高了在生产环节中确定生物芯片的解码文件时的解码效率。

【技术实现步骤摘要】
一种生物芯片的带有复合标签序列的探针及生物芯片
本专利技术涉及生物
,尤其涉及一种生物芯片的带有复合标签序列的探针及生物芯片。
技术介绍
生物芯片(例如基因芯片或蛋白质芯片)包括微珠和与微珠连接的探针分子,探针分子上靠近微珠的一段为标签序列,标签序列具有特异性并且用于与带有荧光基团的解码序列杂交。连接有寡核苷酸链探针分子(下文简称“探针”)的微珠装载到芯片上后,由于装载过程具有随机性,需采取某种方法来获取芯片上每个位置与探针种类的对应信息,这一过程即为解码。例如,基因芯片的DNA标签序列用于与带有荧光基团的解码序列杂交。具体地,对于寡核苷酸链探针来说,可利用碱基互补配对原理,使生物芯片的探针的标签序列与其互补序列——称为解码序列——进行杂交反应,由于解码序列上带有荧光基团,每一个位置就带上了相应的荧光信号,通过荧光扫描设备得到每一个位置的荧光信号,再把荧光信号转换成对应的探针种类,就可以知道芯片孔位与完成基因芯片的解码,解码后的基因芯片即可用于后续的基因检测。解码原理同样适用于其他种类的生物探针,也适用于得到其他种类的生物芯片上探针与空间位置的对应信息,比如对于蛋白质探针,可使其适配体带上荧光信号,再与其特异性结合,同样可以使其所在的空间位置带上荧光信号,并且该荧光信号可以转化为对应的探针种类。因此,标签序列对于生物芯片制备过程中的解码具有重要作用。已知现有技术中的标签序列与解码序列的杂交方式一般为单段杂交——即一种探针对应一种标签序列。此外,现有技术中也有人提出多段标签序列依次杂交的杂交方式,即一种探针有多段标签序列,第一次解码实验与第一段标签序列杂交,第二次解码实验与第二段标签序列杂交,以此类推,但是此杂交方式仅仅停留在想法层面,暂未在实践中实现。但是,当探针种类较多而荧光基团种类有限时,一步杂交反应所获得的信息不足以解码所有探针。比如使用2种荧光基团解码8种探针,一步杂交反应能使芯片上各个位置带上2种不同的颜色(荧光信号),从而将所有位置划分为两类,这显然不足以分辨出全部8种探针。因为杂交反应具有可逆性,需要反复杂交洗脱,进行多步解码实验才能完成解码。此外,现有技术中生物芯片的探针上的标签序列存在特异性差、生成操作繁琐且耗时长的缺陷。
技术实现思路
为了克服现有技术中因为一步解码步骤中获得的信息量较少,因此解码效率低的技术缺陷,本专利技术的第一个方面提供一种生物芯片的带有复合标签序列的探针,所述复合标签序列包括至少2段标签序列,每段标签序列的长度为8-45mer,每段标签序列均符合以下预设原则:连续的相同碱基不超过8个,GC含量为30%~60%,发夹结构长度不超过8个碱基,自互补片段不超过16个碱基,并且所述复合标签序列与目标基因组不相似。“不相似”是指使用BLAST在目标基因组中找不到与该标签序列E值小于0.05的匹配结果。示例地,所述目标基因组为人类基因组或小鼠基因组等。进一步地,所述标签序列的数量为2-5段。进一步地,所述标签序列由至少2条依次首尾拼接的唯一子序列组成,并且所述唯一子序列和所述标签序列均符合预设原则,所述标签序列的生成方法包括:步骤S1:设定所述唯一子序列的长度为n、所述标签序列的长度为m,m和n分别为构成所述唯一子序列的基本单元的数量,m和n均为正整数且m﹥n,按照预设原则生成所有的长度为n的唯一子序列,即得所述唯一子序列集合;步骤S2:从所述唯一子序列的集合中随机抽取第一唯一子序列,然后再随机抽取第二唯一子序列,将所述第二唯一子序列拼接到所述第一唯一子序列以得到拼接序列,检查所述拼接序列是否符合所述预设原则;以及步骤S3:若符合,则继续逐一随机抽取后续唯一子序列并逐一拼接以得到长度不断增加的新的拼接序列,并逐一检查新的拼接序列是否符合所述预设原则以及新的拼接序列的长度是否达到m,当所述新的拼接序列符合所述预设原则且其长度为m时,则将其保存以作为一条所述标签序列。可选地,m是n的整数倍。可选地,m不是n的整数倍,比如m=8,n=3,那么就拼接到长度为9时停止,剪掉最后1个单位,再检查剩下的长度为8的序列是否符合预设原则,若符合就存下来作为一条标签序列。2≤m/n≤5。示例地,唯一子序列的长度n为7,DNA标签序列的长度m为21。优选地,所述DNA标签序列的核苷酸序列如SEQIDNO.1~8所示。SEQIDNO.1:GCGACCGCTTGTTATTTATTA;SEQIDNO.2:TAGGGGAACTATGAGATAAAA;SEQIDNO.3:CTGCCCCTGTGAAAATAATAA;SEQIDNO.4:GTTCATACCCTTAGCATAAAA;SEQIDNO.5:CAGTAGAGCATACAGGTAAAA;SEQIDNO.6:TCCCGAGAGATAGACATTTAT;SEQIDNO.7:GCTGTAGGTATGGTAAGTTTA;SEQIDNO.8:GGCGTCTAATGCTACTTTTAT。进一步地,步骤S2进一步包括步骤:若不符合,则从所述拼接序列中删除所述第二唯一子序列,然后从所述唯一子序列集合中随机抽取另一唯一子序列以作为新的第二唯一子序列,直到所述拼接序列符合所述预设原则为止。进一步地,步骤S3进一步包括步骤:将与所述标签序列中的所有的长度为n的子序列相同和互补的唯一子序列从所述唯一子序列集合中删除以使它们不再参与后续的抽取和拼接。此处“所有的长度为n的子序列”是指在标签序列中的所有的长度为n的子序列,并不限于组成该标签序列的若干条唯一子序列,还包括标签序列中的其他的长度为n的子序列,换句话说,此处并不限定“长度为n的子序列”的起始位置和终点位置,在唯一子序列集合中,只要是与上述长度为n的子序列相同或互补的唯一子序列,均需要从唯一子序列集合中被删除。进一步地,所述标签序列的生成方法进一步包括:步骤S4:重复步骤S2至S3,直到将所述唯一子序列的集合用尽或者生成的所述标签序列的数量达到要求,以得到所述标签序列的集合。使用这种方法生成的标签序列的集合可以满足要求:其中任一标签序列的任一长度为n的唯一子序列及其互补序列在标签序列的集合中只出现过一次,因此在生成尽可能多的标签序列的同时,最大程度地保证了标签序列的特异性。进一步地,在预设原则中,连续的相同碱基不超过3个,发夹结构长度不超过3个碱基,自互补片段不超过6个碱基。优选地,所述预设原则进一步包括:相互之间互补片段不能超过5个碱基;不可重复的序列长度不超过5个碱基;避免发夹结构;解链温度(Tm)不低于40℃。进一步地,所述生物芯片为基因芯片或蛋白质芯片。进一步地,所述基因芯片中的构成所述唯一子序列的基本单元为带有不同碱基的脱氧核苷酸,所述蛋白质芯片中的构成所述唯一子序列的基本单元为氨基酸。应用一:基因芯片。采用标签序列+探针的设计,标签序列与探针一一对应。识别标签序列,即可识别出探针的种类。应用二:蛋白质芯片。如将蛋白质探针耦连在微球上,同时在微球上耦连上标签本文档来自技高网
...

【技术保护点】
1.一种生物芯片的带有复合标签序列的探针,其特征在于,所述复合标签序列包括至少2段标签序列,每段标签序列的长度为8-45mer,每段标签序列均符合以下预设原则:连续的相同碱基不超过8个,GC含量为30%~60%,发夹结构长度不超过8个碱基,自互补片段不超过16个碱基,并且所述复合标签序列与目标基因组不相似。/n

【技术特征摘要】
1.一种生物芯片的带有复合标签序列的探针,其特征在于,所述复合标签序列包括至少2段标签序列,每段标签序列的长度为8-45mer,每段标签序列均符合以下预设原则:连续的相同碱基不超过8个,GC含量为30%~60%,发夹结构长度不超过8个碱基,自互补片段不超过16个碱基,并且所述复合标签序列与目标基因组不相似。


2.如权利要求1所述的生物芯片的带有复合标签序列的探针,其特征在于,所述标签序列的数量为2-5段。


3.如权利要求1所述的生物芯片的带有复合标签序列的探针,其特征在于,所述标签序列由至少2条依次首尾拼接的唯一子序列组成,并且所述唯一子序列和所述标签序列均符合预设原则,所述标签序列的生成方法包括:
步骤S1:设定所述唯一子序列的长度为n、所述标签序列的长度为m,m和n分别为构成所述唯一子序列的基本单元的数量,m和n均为正整数且m﹥n,按照预设原则生成所有的长度为n的唯一子序列,即得所述唯一子序列集合;
步骤S2:从所述唯一子序列的集合中随机抽取第一唯一子序列,然后再随机抽取第二唯一子序列,将所述第二唯一子序列拼接到所述第一唯一子序列以得到拼接序列,检查所述拼接序列是否符合所述预设原则;以及
步骤S3:若符合,则继续逐一随机抽取后续唯一子序列并逐一拼接以得到长度不断增加的新的拼接序列,并逐一检查新的拼接序列是否符合所述预设原则以及新的拼接序列的长度是否达到m,当所述新的拼接序列符合所述预设原则且其长度为m时,则将其保存以作为一条所述标签序列。


4.如权利要求3所述的生物芯片的带有复合标签序列的探针,其特征在于,步骤S2进一步包括步骤:若不符合,则从所述拼接序列中删除所述第二唯一子序列,...

【专利技术属性】
技术研发人员:李智许心意刘超钧
申请(专利权)人:苏州拉索生物芯片科技有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1