一种非进化树依赖的分节段RNA病毒重配的方法技术

技术编号:37142002 阅读:30 留言:0更新日期:2023-04-06 21:47
本发明专利技术公开了一种自动检测分节段RNA病毒重配的方法。本发明专利技术提供了一种基于病毒各个节段序列特征进行病毒重配检测的方法,包括如下步骤:1)建立病毒各个节段序列的特征向量;2)将步骤1)得到的各节段的特征向量依据自组织映射神经网络进行聚类划分,得到每个毒株的各个节段的划分类型的重定义;3)依据该定义可实现病毒毒株的重配历史检测,同时对于新毒株数据,可依据序列特征向量相似度进行相应的重配检测。本发明专利技术的实验证明,本发明专利技术通过提取序列特征,不需要构建系统发育树即可实现对病毒毒株重配的检测,检测结果合理高效。检测结果合理高效。

【技术实现步骤摘要】
一种非进化树依赖的分节段RNA病毒重配的方法


[0001]本专利技术涉及生物
,尤其涉及一种非进化树依赖的自动检测分节段RNA病毒重配的方法。

技术介绍

[0002]病毒重配(Reassortment)是基因重组的一种过程,它是分节段RNA病毒所特有的,指的是多个病毒感染同一个宿主细胞时,由于病毒基因节段重排从而产生新的基因组合后代病毒的现象。重配在几乎所有的分节段病毒家族中都可以检测到,最典型的是甲型流感病毒。重配是流感病毒实现跨宿主传播或形成大规模流行的重要进化动力。例如,病毒可以通过重配快速获得跨越宿主屏障的关键位点突变,而单纯通过突变累积获得这些宿主标记则需要漫长的进化历程。人类历史上的多次流感疫情都与不同病毒之间的重配有关。
[0003]重配与重组(recombination)虽然都涉及到基因片段之间的重新组合,但二者是不同的。重配指的是病毒之间以基因节段为单位进行的重新组合,而重组指的是基因之间以核酸片段为单位进行的插入或交换,二者存在较大差异。
[0004]重配的检测对于研究病毒的毒力增强、跨宿主传播、免疫逃本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种待测病毒基因组分节片段重配检测的方法,其特征在于,包括:1)从原始数据库中获得基因组完整且具有全长序列的与所述待测病毒同种病毒的基因组核酸序列;2)按照如下方法对步骤1)得到的所有节段的每个核酸序列进行特征提取;3)使用自组织映射神经网络方法,对步骤2)得到的所有核酸序列的特征向量分节段进行聚类划分;4)对步骤3)得到的每个划分类型进行时间、地域、宿主、亚型等信息提取,得到每个划分类型的信息特征,为每一个划分类型进行命名标注;5)将待测病毒的核酸序列的所有阶段与步骤4中的划分类型进行比对,获得对病毒重配过程的溯源分析或检测。2.根据权利要求1所述方法,其特征在于:所述步骤2)包括如下步骤:21)计算密码子每次出现的位置序列,记为{p0,p1,

,p
m
},p
r
代表第r次出现该密码子的位置,其中p0=0,m是该密码子在序列中出现的次数;22)计算密码子出现的位置之间的间隔序列,记为{α1,α2,


m
},计算公式如下:其中,p
r
‑1代表第r

1次出现该密码子的位置,p
r
代表第r次出现该密码子的位置,α
r
代表第r次出现该密码子与第r

1次出现该密码子之间的间隔;23)根据间隔序列,计算其间隔和序列,记为{β1,β2,


m
},计算公式如下:其中,其中,α
r
代表第r次出现该密码子与第r

1次出现该密码子之间的间隔,β
j
为前j个间隔的间隔和序列;24)计算香农熵,定义一个离散概率分布Q=(q1,q2,

,q
m
),其中q
i
的计算公式如下:然后计算香农熵如下:25)对每一种密码子重复步骤(1)

(4),提取其特征,最终可以得到一个64维的向量,记为{H1,H2,

,H
64
},这一向量即为从该核酸序列提取出...

【专利技术属性】
技术研发人员:任洪广龚行飞胡明达杨浩艺王博千靳远岳俊杰梁龙陈微
申请(专利权)人:中国人民解放军军事科学院军事医学研究院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1