可变区序列文库构建方法、测序方法及其试剂盒技术

技术编号:20498872 阅读:34 留言:0更新日期:2019-03-03 02:26
本发明专利技术属于生物技术领域,尤其涉及可变区序列文库构建方法、测序方法及其试剂盒。本发明专利技术公开了一种可变区序列文库的构建方法,包括以下步骤:步骤一、获得含有编码可变区的DNA样本;步骤二、以所述DNA样本作为模板,通过第一引物群扩增编码所述可变区的DNA序列,获得第一扩增产物库;步骤三、以所述第一扩增产物库作为模板,通过第二引物群和第一接头的引物扩增编码所述可变区的DNA序列,获得可变区序列组合产物。本发明专利技术用于解决目前构建TCR或者BCR的可变区序列文库技术存在的扩增效率低、扩增存在偏倚性以及容易丢失可变区序列文库序列信息的技术缺陷。

Construction, Sequencing and Kit of Variable Region Sequence Library

The invention belongs to the field of biotechnology, in particular to a variable region sequence library construction method, a sequencing method and a kit. The invention discloses a method for constructing a variable region sequence library, which includes the following steps: first, obtaining DNA samples containing coding variable regions; second, using the DNA samples as templates, amplifying the DNA sequences encoding the variable regions through the first primer group to obtain the first amplified product library; third, using the first amplified product library as templates, and adopting the second primer group to obtain the first amplified product library. The DNA sequence encoding the variable region is amplified by primers of the cluster and the first junction, and the variable region sequence combination product is obtained. The invention is used to solve the technical defects of the current technology of constructing TCR or BCR variable region sequence libraries, such as low amplification efficiency, bias in amplification and easy loss of sequence information of variable region sequence libraries.

【技术实现步骤摘要】
【国外来华专利技术】可变区序列文库构建方法、测序方法及其试剂盒
本专利技术属于生物
,尤其涉及可变区序列文库构建方法、测序方法及其试剂盒。本申请要求2018年5月30日提交的PCT(国际申请号为PCT/CN2018/088989)的权益,在此将上述申请的全部内容引用并入本文。
技术介绍
“免疫”是人体极其重要的自卫功能,依靠自身的免疫力,能抵御种类庞大的各种疾病,几乎人体内所有的疾病都与免疫息息相关。人体微环境内负责保卫机体的免疫细胞主要有T细胞、B细胞、巨噬细胞、树突细胞等,这些专职免疫细胞具有独特的结构和功能,并含有独特的免疫细胞亚群和功能分子。T细胞和B细胞是人体主要的淋巴细胞,分别负责细胞免疫和体液免疫,深入了解T细胞和B细胞的组成有助于对疾病的理解、预防与治疗。T细胞受体(TCR)和B细胞受体(BCR)是由多条肽链组成,具有抗原结合特异性,每条肽链的互补决定区(又称超变区)的氨基酸组成和排列顺序呈现高度多样性,构成容量巨大的TCR库和BCR库,研究表明亚型越多,越能有效抵抗细菌、病毒等病原体侵袭,亚型越少越容易感染疾病。另外年龄、环境、疾病诱发因素以及用药等也影响着免疫细胞的多样性。由此,免疫组库测序(ImmuneRepertoiresequencing,简称为IR-SEQ)技术应运而生:它是以多重PCR或5′RACE技术目的扩增CDR区,在结合高通量测序,从DNA或者RNA水平专门研究TCR和BCR的互补决定区的免疫多样性,用于深入挖掘免疫组库与疾病的关联。目前从DNA水平进行TCR、BCR互补决定区的免疫多样性检测,主要是利用组成TCR、BCR的CDR区的V基因以及J基因片段进行引物的设计,进行CDR区的扩增,然后这部分扩增产物进行加接头,在二代测序进行TCR和BCR多样性的检测。另外一部分研究是从RNA水平进行TCR、BCR互补决定区的免疫多样性检测,主要是利用TCR、BCR的CDR区的末端C区进行逆转录反应,延伸至CDR区的V区端,然后进行产物的扩增,并进行二代测序,分析TCR、BCR多样性。然而,现有的TCR和BCR多样性的检测的技术仍存在以下问题,首先,利用DNA进行多重PCR对TCR、BCR的CDR区进行扩增,主要存在的问题有,首先是CDR区两端的V,J非常多样,可能每端需要的引物组为几个引物到几十个引物,取决于引物的设计。成套的引物对进行扩增,因为两端的引物组引物多,容易发生模板上引物不匹配,扩增效率相对较低,而一旦形成了主要的扩增子,则容易引起扩增偏倚性。另外一方面,由于二代测序本身的属性,容易在测序过程中引入错误,而目前的多重PCR方案并不能进行校正分析,对于多样性的检测往往带来很大的偏差。其次,利用RNA进行逆转录PCR对TCR、BCR的CDR区进行扩增也同时存在着一些问题,RNA样本的处理难度相比DNA的样本更加的困难,且不稳定,容易发生降解,在样本处理这一环节,已经是更加的容易丢失多样性信息。同时,目前有些方案的逆转录方案需要在延伸最后一个环节进行接头转换,但是现有的接头转换的转换技术的转换率较低,如果不能成功进行接头转换,则在后续的环节中,该部分信息丢失,同样对于多样性结果有较大的偏差。此外,因为每一个T细胞或者B细胞对应一个特有的TCR或者BCR,而RNA样本有可能在一个细胞中进行了大量的转录,无法实现每一个T细胞或者B细胞对应一个特有的TCR或者BCR的对应关系。综上所述,研发一种高效扩增,无偏倚性,分析结果准确,可以全面构建TCR或者BCR的可变区序列文库的技术方案是本领域技术人员亟待解决的技术问题。
技术实现思路
有鉴于此,本专利技术公开了可变区序列文库构建方法、测序方法及其试剂盒,能有效解决目前构建TCR或者BCR的可变区序列文库技术存在的扩增效率低、扩增存在偏倚性以及容易丢失可变区序列文库序列信息的技术缺陷。本专利技术提供了可变区序列文库的构建方法和可变区序列的测序方法,包括以下步骤:步骤一、获得含有编码可变区的DNA样本;步骤二、以所述DNA样本作为模板,通过第一引物群延伸编码所述可变区的DNA序列,获得第一扩增产物库,其中,所述第一引物群包括特异性识别J区的所有亚型的编码序列的的第一引物,所述第一引物包括特异性识别J区的编码序列的核苷酸序列、校对随机段和第一接头,且所述特异性识别J区的编码序列的核苷酸序列、所述校对随机段和所述第一接头依次连接,所述第一引物群的校对随机段的序列互不相同;步骤三、以所述第一扩增产物库作为模板,通过第二引物群和第一接头的引物扩增编码所述可变区的DNA序列,获得可变区序列组合产物,其中,所述第二引物群包括特异性识别V区的所有亚型的编码序列的的第二引物;所述第二引物包括特异性识别V区的编码序列的核苷酸序列和第二接头,且所述特异性识别V区的编码序列的核苷酸序列和所述第二接头相互连接;所述第一接头的引物包括特异性识别第一接头的核苷酸序列。其中,所述第一引物群包括多条序列各不相同的第一引物,每条所述第一引物的校对随机段的序列互不相同,每条第一引物包括特异性识别J区一个亚型的编码序列的序列,所述第一引物群包括特异性识别J区所有亚型的编码序列的序列,例如第一引物A包括特异性识别J区A亚型的编码序列的序列,第一引物B包括特异性识别J区B亚型的编码序列的序列,以此类推,第一引物群包括第一引物A、第一引物B等等的引物;所述第二引物群包括多条序列各不相同的第二引物,每条第二引物包括特异性识别V区一个亚型的编码序列的序列,所述第二引物群包括特异性识别V区所有亚型的编码序列的序列,例如第二引物A包括特异性识别V区A亚型的编码序列的序列,第二引物B包括特异性识别V区B亚型的编码序列的序列,以此类推,第二引物群包括第二引物A、第二引物B等等的引物。其中,第一接头和第二接头为构建文库所用的序列,构建的文库包括测序文库或基因文库。其中,所述特异性识别V区的编码序列的核苷酸序列和所述第二接头相互连接。其中,所述J区的编码序列为B细胞受体或T细胞受体的受体编码基因J片段的所有亚型的序列,因此,第一引物群包括特异性识别B细胞受体或T细胞受体的所有亚型的J区的编码序列的核苷酸序列,由于B细胞受体或T细胞受体的所有亚型的J区的编码序列各不相同,每条所述第一引物的特异性识别J区的编码序列的核苷酸序列的序列互不相同。其中,所述V区的编码序列为B细胞受体或T细胞受体的受体编码基因V片段的所有亚型的序列,因此,第二引物群包括特异性识别B细胞受体或T细胞受体的所有亚型的V区的编码序列的核苷酸序列,由于B细胞受体或T细胞受体的所有亚型的V区的编码序列各不相同,每条所述第一引物的特异性识别J区的编码序列的核苷酸序列的序列互不相同。作为优选,还包括步骤四,步骤四具体包括:以所述可变区序列组合产物为模板,通过第一测序接头和第二测序接头扩增编码所述可变区的DNA序列,获得可变区序列文库,其中,所述第一测序接头包括特异性识别所述第一接头的核苷酸序列和测序用接头A;所述第二测序接头包括特异性识别所述第二接头的核苷酸序列和测序用接头B,步骤四的目的是对可变区序列组合产物接上高通量测序有需要的测序接头。作为优选,所述校对随机段的序列长度为8-20个核苷酸。作为优选,所述校对随机段的序列长度为8-10个核苷酸本文档来自技高网
...

【技术保护点】
1.一种可变区序列文库的构建方法,其特征在于,包括以下步骤:步骤一、获得含有编码可变区的DNA样本;步骤二、以所述DNA样本作为模板,通过第一引物群延伸编码所述可变区的DNA序列,获得第一扩增产物库,其中,所述第一引物群包括特异性识别J区的所有亚型的编码序列的的第一引物,所述第一引物包括特异性识别J区的编码序列的核苷酸序列、校对随机段和第一接头,且所述特异性识别J区的编码序列的核苷酸序列、所述校对随机段和所述第一接头依次连接,所述第一引物群的校对随机段的序列互不相同;步骤三、以所述第一扩增产物库作为模板,通过第二引物群和第一接头的引物扩增编码所述可变区的DNA序列,获得可变区序列组合产物,其中,所述第二引物群包括特异性识别V区的所有亚型的编码序列的的第二引物;所述第二引物包括特异性识别V区的编码序列的核苷酸序列和第二接头,且所述特异性识别V区的编码序列的核苷酸序列和所述第二接头相互连接;所述第一接头的引物包括特异性识别第一接头的核苷酸序列。

【技术特征摘要】
【国外来华专利技术】1.一种可变区序列文库的构建方法,其特征在于,包括以下步骤:步骤一、获得含有编码可变区的DNA样本;步骤二、以所述DNA样本作为模板,通过第一引物群延伸编码所述可变区的DNA序列,获得第一扩增产物库,其中,所述第一引物群包括特异性识别J区的所有亚型的编码序列的的第一引物,所述第一引物包括特异性识别J区的编码序列的核苷酸序列、校对随机段和第一接头,且所述特异性识别J区的编码序列的核苷酸序列、所述校对随机段和所述第一接头依次连接,所述第一引物群的校对随机段的序列互不相同;步骤三、以所述第一扩增产物库作为模板,通过第二引物群和第一接头的引物扩增编码所述可变区的DNA序列,获得可变区序列组合产物,其中,所述第二引物群包括特异性识别V区的所有亚型的编码序列的的第二引物;所述第二引物包括特异性识别V区的编码序列的核苷酸序列和第二接头,且所述特异性识别V区的编码序列的核苷酸序列和所述第二接头相互连接;所述第一接头的引物包括特异性识别第一接头的核苷酸序列。2.根据权利要求1所述的可变区序列文库的构建方法,其特征在于,还包括步骤四,步骤四具体包括:以所述可变区序列组合产物为模板,通过第一测序接头和第二测序接头扩增编码所述可变区的DNA序列,获得可变区序列文库,其中,所述第一测序接头包括特异性识别所述第一接头的核苷酸序列和测序用接头A;所述第二测序接头包括特异性识别所述第二接头的核苷酸序列和测序用接头B。3.根据权利要求1或2所述的可变区序列文库的构建方法,其特征在于,所述校对随机段的序列长度为8-20个核苷酸。4.根据权利要求1至3任意一项所述的可变区序列文库的构建方法,其特征在于,所述校对随机段的序列长度为8-10个核苷酸。5.根据权利要求1至4任意一项所述的可变区序列文库的构建方法,其特征在于,多条所述第一接头的序列互相相同。6.根据权利要求1至5任意一项所述的可变区序列文库的构建方法,其特征在于,所述延伸具体包括:变性98℃,40s;延伸60℃,2min;终延伸72℃,2min;1个循环。7.根据权利要求1至6任意一项所述的可变区序列文库的构建方法,其特征在于,所述步骤三的扩增为多重PCR。8.根据权利要求7所述的可变区序列文库的构建方法,其特征在于,所述多重PCR具体包括:预变性95℃,15s;变性94℃,40s;退火60℃,4min;延伸72℃,90s;终延伸72℃,10s;35个循环。9.根据权利要求1至8任意一项所述的可变区序列文库的构建方法,其特征在于,所述可变区序列为B细胞受体或T细胞受体的可变区序列。10.根据权利要求1至9任意一项所述的可变区序列文库的构建方法,其特征在于,所述含有编码可变区的DNA样本为从动物外周血中提取的全基因组DNA。11.根据权利要求1至10任意一项所述的...

【专利技术属性】
技术研发人员:许林浩黄智敏
申请(专利权)人:广州合谐医疗科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1