测序内标分子及其制备方法和应用技术

技术编号:24399290 阅读:43 留言:0更新日期:2020-06-06 04:45
本发明专利技术涉及一种测序内标分子及其制备方法和应用,属于基因检测技术领域。该测序内标分子的制备方法包括以下步骤:S1:以1000±200bp为窗口,获得与待测样本中基因序列非同源的unique植源性序列;S2:挑选出GC含量为35%‑70%的序列;S3:筛选出无微卫星的序列;S4:筛选出连续碱基序列数小于8的序列;S5:以测序读长±5bp为窗口进行两两比对,对筛选出的序列做同源性筛查,获得序列相似性低的序列,即为筛选序列;S6:以所述筛选序列为内标分子的基础序列进行PCR扩增,即得获得测序内标分子。上述测序内标分子经过严格的系统筛选后得出,不仅具有较低的成本,还能够在跟踪样本和监控样品间交叉污染的同时不影响病原微生物的检出和测序数据量。

Sequencing internal standard molecule and its preparation and Application

【技术实现步骤摘要】
测序内标分子及其制备方法和应用
本专利技术涉及基因检测
,特别是涉及一种测序内标分子及其制备方法和应用。
技术介绍
二代测序(又称下一代测序,NGS)技术在发现和转化研究的诸多方面已逐渐成为一种被广泛采用的技术,二代测序由于无偏倚性和高通量的特点,在急难危重感染性疾病的病原检测分析中有重要应用,且能够同时对多个样本进行测序。而在同时进行建库操作的过程中,因操作失误、气溶胶或indexhopping导致的同批次样本的互换或交叉污染对检测结果有很大的误导性,而样品跟踪和样本间交叉污染监控的方法就是运用内标分子掺入(uniquemoleculespike-in,UMSI)进行实现。对于内标分子,目前大多采用化学合成自然界不存在的序列作为内标分子,但是化学合成序列成本高,在进行大规模样本建库测序的时候就需要更多数量的内标分子。并且,内标分子必须参与建库全程,对于不同的样本类型,需考虑不同的掺入量,掺入量太低,不能起到监测污染的功能;掺入量太高,则成本增加,降低有效数据量。而对于宏转录组检测,内标分子需以RNA形式掺入,合成单链RNA成本更高。
技术实现思路
基于此,有必要针对上述化学合成内标分子成本高的问题,提供一种测序内标分子及其制备方法和应用,这些内标分子经过严格的系统筛选后得出,不仅具有较低的成本,还能够在样品跟踪及样本间交叉污染监控的同时不影响病原微生物的检出和测序数据量。一种测序内标分子的制备方法,包括以下步骤:S1:以1000±200bp为窗口,获得与待测样本中基因序列非同源的unique植源性序列;S2:从上述unique植源性序列中挑选出GC含量为35%-70%的序列;S3:从上述序列中筛选出无微卫星的序列;S4:从上述序列中筛选出连续碱基序列数小于8的序列;S5:在上述序列中,以测序读长±5bp为窗口进行两两比对,对筛选出的序列做同源性筛查,获得序列相似性低的序列,即为筛选序列;S6:以所述筛选序列为内标分子的基础序列,设计合成扩增引物,以所述植源性基因组为模板,进行PCR扩增,即得测序内标分子。上述测序内标分子的制备方法,包括序列筛选和扩增两部分,在序列筛选中,考虑到大部分临床检测的目标主要是针对人源和微生物基因组特异序列进行鉴定,因此,选择植物源性核酸序列作为内标分子的来源。且植物源性基因组中包含叶绿素、光合作用、花和果实的特殊基因序列,可获得大量与人和微生物无同源性的序列。在上述基础上,本专利技术人对植源性的序列进行了筛选,首先将植源性基因组序列分割为1000±200bp的序列集,便于后续使用PCR方法获得片段序列;对上述分割获得的序列集与本地数据库中人和微生物的序列进行比对,获得无同源性的序列集;对无同源性序列集进行GC含量过滤,挑选出GC含量为35%-70%的序列集;对符合GC含量的序列集进行微卫星过滤,剔除含微卫星的序列;后续进行连续碱基的过滤,筛选出连续碱基序列数小于8的序列集;对经过系列严格筛选后获得的序列集进行两两比对,获得低同源性的唯一序列集,作为内标分子序列集。上述内标分子序列集具有非常高的经济价值,如:相对于化学合成1.5元/碱基,为了能长期稳定使用内参分子,将一个与UMSI类似的内标分子克隆至常用载体上,需要4700-5000元的合成费用,78个内标分子需要36.6-39万元合成费。合成之后的内标分子并不能直接应用,需要将内标分子从载体上酶切或设计特异性引物扩增纯化后才可以使用。而UMSI的合成方法只需要合成扩增引物,对扩增产物进行纯化后即可应用,节约几十万元的合成费用。在其中一个实施例中,所述S1中,所述待测样本中基因序列的类型为人源和微生物基因组;所述植源性序列来源于拟南芥。通常,植物基因组中包含大量的重复元件,且基因组普遍较大,对植物的基因组测序和组装存在挑战。本专利技术人经过筛选对比后发现,拟南芥是目前已完成测序的植物中,基因组较小的植物之一,且是最早研究和完成基因组测序和组装的植物,基因组拼接质量较好。另外,拟南芥的可获得性较好,选择拟南芥基因组为内标分子的基础序列,具有较好的实用价值。在其中一个实施例中,所述S5中,所述序列相似性低的序列指:两条序列之间具有连续相同碱基的长度低于15bp。在其中一个实施例中,所述S6中,进行二次PCR扩增。为避免拟南芥基因组的本底污染,对PCR产物进行割胶纯化,以纯化的核酸作为模板,按上述程序进行二次PCR扩增。在其中一个实施例中,所述测序内标分子长度为400bp-800bp。在二代测序文库构建过程中会对核酸进行机械或酶切的片段化过程,如果片段太短,存在内标分子在片段化过程中片段化为小片段分子,导致不能同步进入后续的建库过程,丧失内标功能,或所建文库片段太小,在后续分选过程中被分选而不能进入测序环节或与测序目标(人源和微生物)片段在芯片内争抢成簇的机会和空间,导致有效数据量降低。但如片段过长,又会产生资源浪费等问题,本专利技术人从设计理论结合实践操作的综合考虑后,将测序内标分子长度控制在400bp-800bp,可兼顾上述多方面要求。在其中一个实施例中,扩增获得测序内标分子后,进行体外转录为单链RNA,即得转录组内标分子。可以理解的,上述转录组内标分子用于宏基因组测序时即为宏转录组内标分子。在其中一个实施例中,进行体外转录RNA时,在上游引物的5'端添加TAATACGACTCACTATAGGG(T7启动子)序列。本专利技术还公开了上述的测序内标分子的制备方法制备得到的筛选序列和/或测序内标分子。在其中一个实施例中,所述筛选序列选自:SEQIDNO.1所示序列~SEQIDNO.78所示序列。本专利技术还公开了上述的测序内标分子在宏基因组病原微生物检测污染监控中的应用。在其中一个实施例中,将测序内标分子按核酸提取量的1±0.2‰掺入到样本中。在其中一个实施例中,测序内标分子掺入样本中与样本同时进行核酸提取或在样本核酸定量后掺入,再进行文库构建,然后在IlluminaNEXTSEQ550进行测序。在其中一个实施例中,将宏转录组内标分子按核酸提取量的掺入到样品中。在其中一个实施例中,将宏转录组内标分子掺入样本中与样本同时进行核酸提取或在样本核酸定量后掺入,再进行文库构建,然后在IlluminaNEXTSEQ550进行测序。可以理解的,以上加入量也可以根据实际应用进行调整。而对于监控方式,为将测序内标分子掺入样本后,按照常规方式处理样本即可,对于后续测序所用的文库或设备等均不做限定。与现有技术相比,本专利技术具有以下有益效果:本专利技术的一种测序内标分子,以拟南芥基因组为内标分子的基础序列,经过严格的系统筛选后得出,不仅具有较低的成本,相对于化学合成内标,每组内标分子可节约几十万的合成费用,还能够在样品跟踪及样本间交叉污染监控的同时不影响病原微生物的检出和测序数据量。附图说明图1为实施例中测序内标分子的制备流程及在宏基因组病原微生物检测污染监本文档来自技高网...

【技术保护点】
1.一种测序内标分子的制备方法,其特征在于,包括以下步骤:/nS1:以1000±200bp为窗口,获得与待测样本中基因序列非同源的unique植源性序列;/nS2:从上述unique植源性序列中挑选出GC含量为35%-70%的序列;/nS3:从上述序列中筛选出无微卫星的序列;/nS4:从上述序列中筛选出连续碱基序列数小于8的序列;/nS5:在上述序列中,以测序读长±5bp为窗口进行两两比对,对筛选出的序列做同源性筛查,获得序列相似性低的序列,即为筛选序列;/nS6:以所述筛选序列为内标分子的基础序列,设计合成扩增引物,以所述植源性基因组为模板,进行PCR扩增,即得测序内标分子。/n

【技术特征摘要】
1.一种测序内标分子的制备方法,其特征在于,包括以下步骤:
S1:以1000±200bp为窗口,获得与待测样本中基因序列非同源的unique植源性序列;
S2:从上述unique植源性序列中挑选出GC含量为35%-70%的序列;
S3:从上述序列中筛选出无微卫星的序列;
S4:从上述序列中筛选出连续碱基序列数小于8的序列;
S5:在上述序列中,以测序读长±5bp为窗口进行两两比对,对筛选出的序列做同源性筛查,获得序列相似性低的序列,即为筛选序列;
S6:以所述筛选序列为内标分子的基础序列,设计合成扩增引物,以所述植源性基因组为模板,进行PCR扩增,即得测序内标分子。


2.根据权利要求1所述的测序内标分子的制备方法,其特征在于,所述S1中,所述待测样本中基因序列的类型为人源和微生物基因组;所述植源性序列来源于拟南芥。


3.根据权利要求1所述的测序内标分子的制备方法,其特征在于,所述S5中,所述序列相似性低的序列指:两条序列之间具有连续相同碱基的长度低于15bp...

【专利技术属性】
技术研发人员:许腾谢淑媚曾伟奇周晓思李永军王小锐苏杭
申请(专利权)人:广州微远基因科技有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1