一种RNA测序文库的构建方法技术

技术编号:27731749 阅读:18 留言:0更新日期:2021-03-19 13:22
本发明专利技术公开了一种RNA测序文库的构建方法,包括在文库构建前通过标签对靶标RNA序列进行标记步骤,所述标签命名为Rx,由两部分组成:5'端为特定的标签序列Tx;3'端为随机序列Nx;标签Rx中的x为数字,用户可根据需求进行命名,如R1、R2、R3;标签序列Tx为一段固定的核酸序列,由5‑18个碱基组成,用户可根据需要进行选取,但应避免与靶标序列相同;随机序列Nx由一段随机的碱基序列组成,N可为A、T、C、G中的任一个,x表示含有N的个数,其碱基数量可为5‑15个。本发明专利技术公开的RNA测序文库的构建方法可有效减少试剂中核酸的污染,降低背景噪音,简化生物信息学分析流程。

【技术实现步骤摘要】
一种RNA测序文库的构建方法
本专利技术涉及高通量基因测序
,特别是一种RNA测序文库的构建方法。
技术介绍
随着高通量测序技术(NGS)的发展,自2004年问世以来,高通量测序成本已降低了几个数量级,使其在肿瘤检测、基因筛查等领域得到了广泛应用。自2014年首次报道了其在病原微生物检测领域的成功应用,在随后的几年里其在临床病原检测领域得到了广泛应用,尤其是在常规检测方法存在局限性的领域。NGS在临床微生物检测中的应用是多种多样的,包括宏基因组NGS,即mNGS,它可以无偏性的检测病原体,可用于从患者的临床样本中直接鉴定病原体,而无需依赖于传统的培养法,为难以培养或不能实验室培养的病原体检测提供了可靠的检测平台。mNGS虽能无假设或无偏的检测微生物并发现新的微生物,但其仍存在一定的缺点,如患者样本中宿主背景核酸的干扰,研究表明临床样本中用于鉴定的病原微生物的序列是相对较少的,绝大多数为宿主(>99%)的核酸序列,这为mNGS在病原体检测中的应用带来了很大的挑战。宿主序列可在样本制备和生物信息学分析阶段进行宿主剔除,目前在宿主去除方面已取得了较好的效果。mNGS另一方面的缺点是检测样本中存在背景微生物的污染,包括用于提取、建库等步骤的试剂或实验室环境中的微生物污染。实验室环境中的微生物污染可通过净化实验室环境得到有效改善。但来源于检测试剂中的污染很难通过常规手段去除,为后续测序数据分析带来极大的困难。目前,NGS已经广泛应用于RNA测序,在RNA测序过程中通常需要构建RNA测序文库,现有技术中构建RNA测序文库一般包括以下步骤:将RNA片段采用机械法或酶法打断到一定长度、纯化打断的RNA、利用随机引物进行反转录、合成cDNA二链、末端修复和加A加接头、纯化、indexPCR扩增和indexPCR产物纯化。这样的建库方法包括三次繁琐的纯化步骤,对实验试剂、耗材、时间和人力造成了很大的浪费。同时,建库过程中需要采用随机引物,随机引物有时会带来反转录的不平衡,给测序结果带来一定偏差。因此,开发一种新型RNA测序文库的构建方法并对其进行合理利用显得非常有必要,对提高了RNA文库构建的质量和效率,解决或降低试剂中微生物核酸对病原体检测造成的污染具有非常重要的意义。
技术实现思路
本专利技术的目的是要提供一种RNA测序文库的构建方法,该构建方法通过在文库构建前为RNA模板加一段标签标记,有效降低了试剂盒中的背景微生物核酸的噪音污染,优化了生信分析流程,提高了RNA测序检测的灵敏度;该方法不仅可标记RNA模板,还可有效保留RNA模板的相关信息,将RNA模板转化为DNA进行文库构建,同时将RNA模板转化为可用于文库构建的小片段,长度为50~1000bp;通过该技术标记的核酸与DNA模板一样,一起进行文库构建,通过生物信息学分析能有效的将两组核酸进行区分。为达到上述目的,本专利技术是按照以下技术方案实施的:一种RNA测序文库的构建方法,包括以下步骤:S1、在文库构建前通过标签对靶标RNA序列进行标记:所述标签命名为Rx,由两部分组成:5'端为特定的标签序列Tx;3'端为随机序列Nx;标签Rx中的x为1,2...n,n为整数;标签序列Tx为一段固定的核酸序列,由5-18个碱基组成;随机序列Nx由一段随机的核酸序列组成,N为A、T、C、G中的任一个,x表示含有N的个数,x为1,2...n,n为整数,随机序列Nx的碱基数量为5-15个;S2、直接按相应测序平台建库流程进行文库构建,或与同一样本中片段化后的DNA混合后按照相应测序平台建库流程进行文库构建。进一步地,所述步骤S1具体为:步骤S101、利用标签序列Tx为RNA模板进行标记,其碱基序列是固定的,在数据分析时根据该序列对模板进行筛选区分,并去除试剂中的背景噪音;步骤S102、所述随机序列Nx与模板上互补的区域结合形成RNA-DNA双链结构,该结构被逆转录酶识别并与之结合生成cDNA的第一条链,生成该cDNA链的5'端即标记有标签Tx;步骤S103、当Rx中的随机序列Nx与cDNA的第一条链中互补的区域结合时,其与cDNA的第一条链形成cDNA-cDNA双链结构,该结构被DNA聚合酶识别,并与之结合合成cDNA的第二条链,随着cDNA的第二条链的合成,所生成的cDNA的第二条链的5'端和3'端均含有固定的碱基标签序列,5'端为Rx,3'端为Rx的反向互补序列,生成Rx标记的序列。进一步地,所述步骤S2中的直接按相应测序平台建库流程进行文库构建,,其结果进行数据分析的具体步骤为:S201、对测序数据进行质量评估,去除低质量、长度小于50bp的短序列、接头等低质量的reads;S202、筛选数据中5'含有Tx的序列和/或3'含有Tx的反向互补序列的序列;S203、将上步筛选的序列与宿基因组序列进行比对,去除可与宿主基因组匹配的序列,此处宿主为人基因组;S204、将筛选的数据与相应数据库进行比对分析,确定其所属物种;S205、生成相应的检测报告。进一步地,所述步骤S2中的与同一样本中片段化后的DNA混合后按照相应测序平台建库流程进行文库构建,其结果进行数据分析的具体步骤为:S211、对测序数据进行质量评估,去除低质量、长度小于50bp的短序列、接头等低质量的reads;S212、将符合要求的数据中按5'端含有Tx的序列和/或3'端含有Tx的反向互补序列的序列分为一组,记为RNA组;5'端不含有Tx的序列且3'端不含有Tx的反向互补序列的序列分为一组,记为DNA组;S213、将RNA组数据与宿主人基因组序列进行比对,去除可与宿主基因组匹配的序列;S214、将上步筛选的RNA组剩余数据与病原体基因组数据库进行比对分析,确定其所含有的RNA病原体;S215、将DNA组数据与宿主人基因组序列进行比对,去除可与宿主基因组匹配的序列;S216、将上步筛选的DNA组剩余数据与病原体基因组数据库进行比对分析,确定其所含有的DNA病原体;S217、根据RNA组和DNA组的分析结果确定样本中所含有的病原体;S218、生成相应的检测报告。进一步地,所述步骤S103中的生成的Rx标记的序列为RNA模板的一部分,其长度为50-1000bp。进一步地,所述步骤S103中的生成的标签序列Rx为R1,由T8和N6组成;R1核酸序列为5'-CAGATATCNNNNNN-3';所用的T8含有8个固定碱基,其序列为CAGATATC;N6含有6个随机碱基,其序列为NNNNNN。进一步地,所述cDNA的第一条链合成方法,包括如下步骤:将待建库的靶标RNA与标签R1混匀,R1终浓度为2μM,加入RNase抑制剂、DTT、dNTP、AMV逆转录酶及其相应Buffer,各组分浓度分别为:RNase抑制剂1U/μL,AMV逆转录酶0.05-0.5U/μL,DTT为5mM,dNTP为1mM,混合均匀,将反应管置于PCR仪中,运行下述程本文档来自技高网
...

【技术保护点】
1.一种RNA测序文库的构建方法,其特征在于,包括以下步骤:/nS1、在文库构建前通过标签对靶标RNA序列进行标记:所述标签命名为Rx,由两部分组成:5'端为特定的标签序列Tx;3'端为随机序列Nx;标签Rx中的x为1,2...n,n为整数;标签序列Tx为一段固定的核酸序列,由5-18个碱基组成;随机序列Nx由一段随机的核酸序列组成,N为A、T、C、G中的任一个,x表示含有N的个数,x为1,2...n,n为整数,随机序列Nx的碱基数量为5-15个;/nS2、直接按相应测序平台建库流程进行文库构建,或与同一样本中片段化后的DNA混合后按照相应测序平台建库流程进行文库构建。/n

【技术特征摘要】
20200122 CN 20201007583101.一种RNA测序文库的构建方法,其特征在于,包括以下步骤:
S1、在文库构建前通过标签对靶标RNA序列进行标记:所述标签命名为Rx,由两部分组成:5'端为特定的标签序列Tx;3'端为随机序列Nx;标签Rx中的x为1,2...n,n为整数;标签序列Tx为一段固定的核酸序列,由5-18个碱基组成;随机序列Nx由一段随机的核酸序列组成,N为A、T、C、G中的任一个,x表示含有N的个数,x为1,2...n,n为整数,随机序列Nx的碱基数量为5-15个;
S2、直接按相应测序平台建库流程进行文库构建,或与同一样本中片段化后的DNA混合后按照相应测序平台建库流程进行文库构建。


2.根据权利要求1所述的RNA测序文库的构建方法,其特征在于,所述步骤S1具体为:
步骤S101、利用标签序列Tx为RNA模板进行标记,其碱基序列是固定的,在数据分析时根据该序列对模板进行筛选区分,并去除试剂中的背景噪音;
步骤S102、所述随机序列Nx与模板上互补的区域结合形成RNA-DNA双链结构,该结构被逆转录酶识别并与之结合生成cDNA的第一条链,生成该cDNA链的5'端即标记有标签Tx;
步骤S103、当Rx中的随机序列Nx与cDNA的第一条链中互补的区域结合时,其与cDNA的第一条链形成cDNA-cDNA双链结构,该结构被DNA聚合酶识别,并与之结合合成cDNA的第二条链,随着cDNA的第二条链的合成,所生成的cDNA的第二条链的5'端和3'端均含有固定的碱基标签序列,5'端为Rx,3'端为Rx的反向互补序列,生成Rx标记的序列。


3.根据权利要求1所述的RNA测序文库的构建方法,其特征在于,所述步骤S2中的直接按相应测序平台建库流程进行文库构建,其结果进行数据分析的具体步骤为:
S201、对测序数据进行质量评估,去除低质量、长度小于50bp的短序列、接头等低质量的reads;
S202、筛选数据中5'含有Tx的序列和/或3'含有Tx的反向互补序列的序列;
S203、将上步筛选的序列与宿基因组序列进行比对,去除可与宿主基因组匹配的序列,此处宿主为人基因组;
S204、将筛选的数据与相应数据库进行比对分析,确定其所属物种;
S205、生成相应的检测报告。


4.根据权利要求1所述的RNA测序文库的构建方法,其特征在于,所述步骤S2中的与同一样本中片段化后的DNA混合后按照相应测序平台建库流程进行文库构建,其结果进行数据分析的具体步骤为:
S211、对测序数据进行质量评估,去除低质量、长度小于50bp的短序列、接头等低质量的reads;
S212、将符...

【专利技术属性】
技术研发人员:盖伟宋翠丹马桂红王婷婷臧义坤
申请(专利权)人:微岩医学科技北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1