System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 高通量测序质控用文库及其制备方法和应用技术_技高网

高通量测序质控用文库及其制备方法和应用技术

技术编号:41118567 阅读:2 留言:0更新日期:2024-04-25 14:08
本发明专利技术涉及基因测序技术领域,尤其涉及一种高通量测序质控用文库及其制备方法和应用。本发明专利技术提供的高通量测序质控用文库在每个碱基位置的碱基占比均是均衡的。将本发明专利技术提供的高通量测序质控用文库与待测样本文库混合后共同上机测序,可消除因待检样本文库碱基序列的不平衡性所导致的测序质量降低,提高对不平衡文库测序的准确性。

【技术实现步骤摘要】

本专利技术涉及基因测序,尤其涉及一种高通量测序质控用文库及其制备方法和应用


技术介绍

1、高通量测序技术又称下一代测序技术(next-generation sequencing,ngs),一次能对几十万到几百万条核酸分子进行序列测定,是目前发展最为迅速的技术之一,其已深入生命科学的各个领域,在肿瘤检测、新药研发等方面前景广阔。高通量测序技术通量大、灵敏度高等优点已使其成为目前临床分子检测中最重要的应用平台之一。

2、高通量测序仪在测序时会采用前几十个测序cycle信号来确定簇的位置和密度等信息,这些信息影响了测序信号采集、测序碱基质量。碱基不平衡文库(即每个测序cycle中a、g、c、t四种碱基的含量远远偏离25%)在测序时会导致测序仪荧光信号采集失真,大大降低碱基识别的准确性,进而影响测序结果的准确性。尤其在甲基化dna测序中,常通过亚硫酸氢盐使dna中未甲基化的c转化为u,进而在pcr过程中转化为t,这种转化使待测序的dna中c碱基占比大大降低,很容易导致测序中碱基的不平衡。

3、为解决这一问题,目前主要采用混合质控文库与待检样本文库共同上机测序的方式。但是现有质控文库主要通过非人源dna(如phix噬菌体dna)来制备,通过片段筛选方式获得一定长度范围的文库,最终混入待检样本文库中一同测序。这种方法的主要问题是:制备过程中涉及片段筛选、获得的质控文库非固定序列容易导致批间存在差异。

4、有鉴于此,特提出本专利技术。


技术实现思路

1、为解决上述技术问题,本专利技术提供了一种高通量测序质控用文库及其制备方法和应用,可有效降低因待测文库碱基不平衡导致的碱基测序质量下降问题。

2、具体的,本专利技术的技术方案如下:

3、第一方面,本专利技术提供了一种高通量测序质控用文库,由包括序列插入片段的模板dna经pcr扩增得到;所述序列插入片段包括序列插入片段a、序列插入片段b、序列插入片段c和序列插入片段d;所述序列插入片段a的核苷酸序列如seq id no.1所示;所述序列插入片段b的核苷酸序列如seq id no.2所示;所述序列插入片段c的核苷酸序列如seq idno.3所示;所述序列插入片段d的核苷酸序列如seq id no.4所示。

4、序列插入片段a:

5、cgaggattcaacaaggtgatcgaagtcgacagatccagagagacgggcttcaaagctgcgtgacgacgcttgcgagtccgtatcaatatcctcacaataagcacacgtgaccgttggttgaacagcacaggacgagctgaccagaagcactattatatcgcttaacggctcttgagccagtgtgcgttaccttgcagcaatcgaggccgtccgttaattcctcttgcattcatatcgcgtattgttgtctctgtacgcgcttacttggatcaggatgacatagcttcttacaggagcgtc

6、序列插入片段b:

7、acttagactgcagctagtcgatggtcgactgatcgtgactcctgatatcatgcctaacgcgatgtgtagcatgctagtacgtgactgcatgcatgctagctagtcacgtcagtcatcagtgcatcgtactcgatgctgtcgtcagtagctacaggacagatcgctgacgatgcatagtcactgatcgatggcatgcatgcatagcatgtcagtcgtgactgagactacgatgctagcatgcagtcgacagtcagctagtagactgactgcactatctcacctagcgtagctcacgtacaa

8、序列插入片段c:

9、gacatcgagtgttgctactagcctagtctatcgaagctgctactcacaggacttcggatactcactgtagcataccagtacgctggctgatagctgcgtgatcgtgtcagtacgcatgcactgcatgtgcatgctagactaggctctagagtcacgtgatgactgactagacgtctaagtacacgtacgttagcatcgctgactataacagtagactcgatgagactgacgcagctatcagcacgacgtcagtcgatacgacgacgtatgttctcactgtagctacagctggtatcgtcg

10、序列插入片段d:

11、ttgcctcgactgctaccagctatccaatggctcgtatctagtgatctgacgtggatctatacgtacactagcatgtcagtacagtcagcgagtgatgcctcgtagtaactgtaagcacactgtgtacgtatctactacagtattcgcttgcggctcgctcagagcttatcgaacgctgtcgactaacgcaagcatgtatgcgtctcgtagtacacgcgagactcgagtcgatgcgatgactgcaactagagacatgctatcgtgacaccaggacggagtggctagagcagatctcatagt

12、上述4种序列插入片段的长度均为300bp,其各自的4种碱基agct含量均相同(四种碱基各占25%),且这4种特定序列插入片段对应的相同位置上dna碱基(a/g/c/t)均不相同。4种特定序列插入片段均无法比对到人、常见动植物和微生物,可有效防止数据污染。

13、优选地,所述高通量测序质控用文库包括4组目标特定序列;所述目标特定序列包含双端接头、双端index和核心区序列。所述核心区序列由所述序列插入片段扩增得到;4组目标特定序列的核心区序列长度相同,且在序列插入片段a、序列插入片段b、序列插入片段c和序列插入片段d上对应的位置相同;所述核心区序列的长度为100-300bp。

14、本专利技术以上述4种序列插入片段a/b/c/d或包含上述4种序列插入片段a/b/c/d的质粒或长链dna分子为模板,经pcr扩增,可获得含有4种目标特定序列的文库。目标特定序列文库由4种不同序列的文库组成,文库两端包含双端接头、双端index及特定序列(特定序列来自上述序列插入片段a/b/c/d)。4种目标特定序列文库的核心区的长度均相同(100~300bp,优选150~250bp,优选250bp)。4种目标特定序列文库的序列均是单一且固定的。4种目标特定序列各自的4种碱基agct含量均相同(四种碱基各占25%),且这4种目标特定序列对应的相同位置上dna碱基(a/g/c/t)均不相同,因此可使用在同一个测序cycle中,这4种文库测出的序列各不相同。4种目标特定序列文库需与待检样本文库的长度接近,避免差异过大,以使目标特定序列文库与待检样本文库在测序仪上进行无本文档来自技高网...

【技术保护点】

1.高通量测序质控用文库,其特征在于,由包括序列插入片段的模板DNA经PCR扩增得到;所述序列插入片段包括序列插入片段a、序列插入片段b、序列插入片段c和序列插入片段d;所述序列插入片段a的核苷酸序列如SEQ ID NO.1所示;所述序列插入片段b的核苷酸序列如SEQ ID NO.2所示;所述序列插入片段c的核苷酸序列如SEQ ID NO.3所示;所述序列插入片段d的核苷酸序列如SEQ ID NO.4所示。

2.根据权利要求1所述高通量测序质控用文库,其特征在于,所述高通量测序质控用文库包括4组目标特定序列;所述目标特定序列包含双端接头、双端Index和核心区序列;所述核心区序列由所述序列插入片段扩增得到;4组目标特定序列的核心区序列长度相同,且在序列插入片段a、序列插入片段b、序列插入片段c和序列插入片段d上对应的位置相同;所述核心区序列的长度为100-300bp。

3.根据权利要求2所述高通量测序质控用文库,其特征在于,还包括poly(dN),N=A/C/T/G碱基。

4.根据权利要求3所述高通量测序质控用文库,其特征在于,所述poly(dN)选用poly(dA),所述poly(dA)的浓度为0.1-100mg/μL,dA碱基数为5-100。

5.权利要求1-4任意一项所述高通量测序质控用文库的制备方法,其特征在于,由包括序列插入片段的模板DNA经PCR扩增得到;所述序列插入片段包括序列插入片段a、序列插入片段b、序列插入片段c和序列插入片段d;所述序列插入片段a的核苷酸序列如SEQ ID NO.1所示;所述序列插入片段b的核苷酸序列如SEQ ID NO.2所示;所述序列插入片段c的核苷酸序列如SEQ ID NO.3所示;所述序列插入片段d的核苷酸序列如SEQ ID NO.4所示。

6.根据权利要求5所述制备方法,其特征在于,用于PCR扩增的引物对的上游引物核苷酸序列如SEQ ID NO.5所示,下游引物核苷酸序列如SEQ ID NO.6所示。

7.根据权利要求5所述制备方法,其特征在于,用于PCR扩增的引物对包括如下(1)、(2)、(3)、(4)和(5)所示引物对:

8.权利要求1-4任意一项所述高通量测序质控用文库或者权利要求5-7任意一项所述制备方法制备得到的高通量测序质控用文库在高通量测序中的应用。

9.根据权利要求8所述应用,其特征在于,将所述高通量测序质控用文库与待检样本文库混合,然后通过高通量测序仪测序;其中,所述高通量测序质控用文库中的目标特定序列与待测样本序列长度相同或相差±100bp以内。

10.高通量测序文库,其特征在于,包括权利要求1-4任意一项所述高通量测序质控用文库,还包括待测样本文库;所述高通量测序质控用文库在所述高通量测序文库中的占比为1-50%;所述高通量测序质控用文库中的4种目标特定序列两两之间的拷贝浓度相对偏差≤±10%。

...

【技术特征摘要】

1.高通量测序质控用文库,其特征在于,由包括序列插入片段的模板dna经pcr扩增得到;所述序列插入片段包括序列插入片段a、序列插入片段b、序列插入片段c和序列插入片段d;所述序列插入片段a的核苷酸序列如seq id no.1所示;所述序列插入片段b的核苷酸序列如seq id no.2所示;所述序列插入片段c的核苷酸序列如seq id no.3所示;所述序列插入片段d的核苷酸序列如seq id no.4所示。

2.根据权利要求1所述高通量测序质控用文库,其特征在于,所述高通量测序质控用文库包括4组目标特定序列;所述目标特定序列包含双端接头、双端index和核心区序列;所述核心区序列由所述序列插入片段扩增得到;4组目标特定序列的核心区序列长度相同,且在序列插入片段a、序列插入片段b、序列插入片段c和序列插入片段d上对应的位置相同;所述核心区序列的长度为100-300bp。

3.根据权利要求2所述高通量测序质控用文库,其特征在于,还包括poly(dn),n=a/c/t/g碱基。

4.根据权利要求3所述高通量测序质控用文库,其特征在于,所述poly(dn)选用poly(da),所述poly(da)的浓度为0.1-100mg/μl,da碱基数为5-100。

5.权利要求1-4任意一项所述高通量测序质控用文库的制备方法,其特征在于,由包括序列插入片段的模板dna经pcr扩增得到;所述序列插入片段包括序列...

【专利技术属性】
技术研发人员:陈辉王旭彤莫敏俐陈钊刘玉忠张艳万冲侯光远张峰许军普
申请(专利权)人:北京雅康博生物科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1