人呼吸道病毒靶向富集捕获探针集及其应用制造技术

技术编号:27305405 阅读:38 留言:0更新日期:2021-02-10 09:16
本发明专利技术涉及人呼吸道病毒诊断领域,提供了用于产生针对人呼吸道病毒的靶向富集捕获探针集的方法,包括获取感染人呼吸道的病毒的基因序列;使用滑动窗口法来设计探针,穷举全部可能的核酸序列;对所得核酸序列进行过滤;滤除核酸序列库中与人类基因组高度同源的序列;对探针序列进行聚类。本发明专利技术还涉及将通过所述方法获得的探针集用于制备人呼吸道病毒的下一代测序文库的用途,从而获得全基因组序列信息,鉴定基因组变异,评估病毒潜在流行传播特征,指导呼吸道疾病的预警和防控。指导呼吸道疾病的预警和防控。指导呼吸道疾病的预警和防控。

【技术实现步骤摘要】
人呼吸道病毒靶向富集捕获探针集及其应用


[0001]本专利技术涉及人呼吸道病毒靶向富集捕获探针集,及其用于检测、鉴定和评估呼吸道病毒的用途。

技术介绍

[0002]人呼吸道病毒是导致人感染的重要病原,更是新发、突发传染病的主要病原。病毒易发生变异,可能导致毒力、耐药性或传播能力的改变,从而在人群中迅速传播引起重大公共卫生问题。快速、准确地检测和鉴定病原,尤其是获得其基因组序列特征,是发现是否存在突变和新型病毒,进而评估病毒潜在流行传播特征的关键,对传染病的预警防控具有重要意义。
[0003]导致人呼吸道感染的常见呼吸道病毒包括:(1)流行性感冒病毒(Influenza virus,IFV),IFV根据其核蛋白(Nucleocapsid protein,NP)和基质蛋白(Matrix protein,MP)的抗原性可以分为甲(A)、乙(B)、丙(C)三型,其中甲型流感病毒(Influenza A virus,IFVA)影响最为广泛,根据其表面植物血凝素蛋白(Hemagglutinin,HA)和神经氨酸酶(Neuramidinase,NA)的抗原性不同再分为若干亚型。目前发现18种HA亚型(H1-18)和11种NA亚型(N1-11),这些亚型可造成人和动物的感染发病,在群体中可引起区域和暴发流行。(2)人副流感病毒(Human parainfluenza virus,HPIV),HPIV是有包膜的单股负链RNA病毒,分为1、2、3和4四种血清型,4型根据血凝抑制活性和基于单克隆抗体反应特性又分为4a和4b两个亚型。基因组长度在15-19Kb,其5

端没有帽子结构,3

端没有多聚腺苷酸(polyA)“尾”。从3

到5

端的基因组组成包括约55nt的引导区(HPIV-2引导区为70nt),6个蛋白编码区基因(N、P、M、F、HN、L)和5

端21-291nt的拖尾序列。(3)呼吸道合胞病毒(Respiratory syncytial virus,RSV),RSV基因组为单股负链RNA,长度约15Kb,5

端无帽子结构,3

端无多聚腺苷酸尾。基因组编码11个蛋白质,从3

到5

的顺序依次是非结构蛋白NS1、非结构蛋白NS2、核蛋白NP、磷酸化蛋白P、基质蛋白M、小疏水蛋白SH、吸附蛋白G、融合蛋白F、转录加工因子M2-1、转录调节因子M2-2、聚合酶大亚基L。根据抗原性将其分为A和B两个亚型,根据RSV G基因序列的差异又将A和B亚型分为多个基因型,目前共报道37个基因型。(4)偏肺病毒(Human metapneumovirus,hMPV),hMPV基因组为单股不分节段的线状负链RNA,长度约13200核苷酸,编码9种病毒蛋白基因,其中G基因序列在病毒亚型间差异最大。hMPV仅有一个血清型,根据病毒G基因进化关系分为两个基因型A和B。(5)肠道病毒属(Enterovirus),其病毒基因组是一条单股正链线状RNA分子,全长约7Kb。该病毒属包括12个种,其中7个种可以感染人类,分别是肠道病毒(Enterovirus,EV)A种(EV-A)、EV-B、EV-C、EV-D和鼻病毒(Rhinovirus,RV)A种(RV-A)、RV-B、RV-C。截至2018年,已知EV-A包含25个血清/基因型,EV-B包括61个型,EV-C包含23个型,EV-D包括5个型,RV-A包含80个型,RV-B包括32个型,RV-C包括56个型。(6)冠状病毒(Human coronavirus,HCoV),HCoV是有包膜的单股负链RNA病毒,根据血清型和基因组特点冠状病毒亚科被分为四个属,分别为α、β、γ和δ。感染人的冠状病毒分属于α(HCoV-229E、HCoV-NL63)属和β(HCoV-OC43、HCoV-HKU1、SARS-CoV和MERS-CoV)属。
(7)腺病毒(Adenovirus,Adv),Adv基因组为线状双链DNA分子,基因组大小约36kb。Adv分为7个种,即:Adv-A、-B、-C、-D、-E、-F和-G。在7个种的Adv中已发现了57个血清型。(8)博卡病毒(Human bocavirus,HBoV),HBoV基因组为线性单链DNA,全长约5kb,其末端序列目前不明确,与细小病毒科(Pavoviridae)其他家族成员相似,HBoV含有两个主要的开放阅读框(Open Reading Frame,ORF),包括5

端ORF编码的非结构蛋白1(Non-structural protein 1,NS1),3

端ORF编码的两个重叠的衣壳蛋白VP1和VP2。
[0004]然而,在呼吸道传染病防控中,仅仅检测和鉴定病毒并不能满足防控需求,还需要第一时间获得其全基因组序列信息。这对于明确基因变异特征,分析其潜在传播能力具有重要作用。下一代测序(next-generation sequencing,NGS)技术实现了不需要经过培养就能够从临床或环境样本中直接获取遗传信息。这一方法用于病毒宏基因组研究,通过一次检测,能够获得样本中所有病原体序列。虽然感染过程中病毒核酸数量可能在百亿级,但由于与人类基因组相比,病毒基因组极小,因此病毒核酸在样本中所占的比例仍然很小。样本总核酸中有大量的宿主核糖体RNA、mRNA转录。从混有大量宿主遗传物质的样本中不易获取病毒全基因组序列。
[0005]靶向探针富集法是基于NGS测序的富集检测方法,通过对样本中靶目标序列进行正向选择捕获富集,从而产生足够的量用于NGS测序。与人类外显子等的靶向富集不同的是,病原体基因组大小和丰度较低,因此对病原体微生物基因靶向富集后,还需要构建测序库才能满足NGS的要求。其操作过程是先将样本中的核酸打断成小片段,然后通过覆盖整个病毒参考基因组的全长序列的多个短小互补序列——探针(一般为80-120bp),与样本中的核酸片段互补配对,对其中的病毒核酸序列进行捕获,将捕获的病毒核酸序列进行扩增、测序,可增加检测时的灵敏度与特异性,提高样本中病毒核酸的检出效率。
[0006]目前,仅报道了针对感染哺乳动物的病毒的广谱性富集探针集。但是广谱性富集探针集包含约200M碱基的探针序列,制备周期长,成本高昂;其探针设计也仅使用有限的参比序列,缺乏对呼吸道病毒变异序列的针对性捕获序列,对多态性区域覆盖不足,尤其在易突变的病毒序列获取上存在明显不足。对此,本领域内的共识是针对症候群建立病原针对性的靶向富集探针,提高病原检出率和基因组序列获取能力。然而,目前针对呼吸道病毒的NGS诊断专用富集探针集尚无相关报道。
[0007]因此,迫切需要特异性针对常见呼吸道病毒富集探针集,其可用于呼吸道病毒的NGS,获得其全基因组序列信息,鉴定基因组变异,进而评估病毒潜在流行传播特征,指导呼吸道疾病的预警和防控。

技术实现思路

[0008]在本研究中,我们针对可导本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种用于产生针对人呼吸道病毒的靶向富集捕获探针集的方法,所述方法包括以下步骤:(1)获取感染人呼吸道的病毒的基因序列;(2)针对所述基因序列,使用滑动窗口法来设计探针,穷举全部可能的核酸序列;(3)对所得核酸序列进行过滤,保留满足条件的核酸序列;(4)将得到的核酸序列比对到参比序列上,滤除核酸序列库中与人类基因组高度同源的序列;(5)对探针序列进行聚类,保留聚类簇的核心序列。2.权利要求1的方法,其中所述感染人呼吸道的病毒是如表1所示的病毒科、属、种/型的病毒。3.权利要求1的方法,其中所述滑动窗口法将窗口宽度设置为120nt,步长设置为1nt。4.权利要求1的方法,其中步骤(3)中对所得探针序列进行过滤的条件为:核酸序列的长度为120nt;核酸序列的Tm值为75
±
5℃;核酸序列的Tm值计算公式为Tm=64.9+41
×
(yG+zC-16.4)/(wA+xT+yG+zC),假定50mM Na
+
,pH=7.0;每条核酸序列中,可能形成发夹结...

【专利技术属性】
技术研发人员:任丽丽王健伟曹德盼肖艳朱俊琳
申请(专利权)人:中国医学科学院病原生物学研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利