【技术实现步骤摘要】
一种非进化树依赖的分节段RNA病毒重配的方法
[0001]本专利技术涉及生物
,尤其涉及一种非进化树依赖的自动检测分节段RNA病毒重配的方法。
技术介绍
[0002]病毒重配(Reassortment)是基因重组的一种过程,它是分节段RNA病毒所特有的,指的是多个病毒感染同一个宿主细胞时,由于病毒基因节段重排从而产生新的基因组合后代病毒的现象。重配在几乎所有的分节段病毒家族中都可以检测到,最典型的是甲型流感病毒。重配是流感病毒实现跨宿主传播或形成大规模流行的重要进化动力。例如,病毒可以通过重配快速获得跨越宿主屏障的关键位点突变,而单纯通过突变累积获得这些宿主标记则需要漫长的进化历程。人类历史上的多次流感疫情都与不同病毒之间的重配有关。
[0003]重配与重组(recombination)虽然都涉及到基因片段之间的重新组合,但二者是不同的。重配指的是病毒之间以基因节段为单位进行的重新组合,而重组指的是基因之间以核酸片段为单位进行的插入或交换,二者存在较大差异。
[0004]重配的检测对于研究病毒的毒力增强 ...
【技术保护点】
【技术特征摘要】
1.一种待测病毒基因组分节片段重配检测的方法,其特征在于,包括:1)从原始数据库中获得基因组完整且具有全长序列的与所述待测病毒同种病毒的基因组核酸序列;2)按照如下方法对步骤1)得到的所有节段的每个核酸序列进行特征提取;3)使用自组织映射神经网络方法,对步骤2)得到的所有核酸序列的特征向量分节段进行聚类划分;4)对步骤3)得到的每个划分类型进行时间、地域、宿主、亚型等信息提取,得到每个划分类型的信息特征,为每一个划分类型进行命名标注;5)将待测病毒的核酸序列的所有阶段与步骤4中的划分类型进行比对,获得对病毒重配过程的溯源分析或检测。2.根据权利要求1所述方法,其特征在于:所述步骤2)包括如下步骤:21)计算密码子每次出现的位置序列,记为{p0,p1,
…
,p
m
},p
r
代表第r次出现该密码子的位置,其中p0=0,m是该密码子在序列中出现的次数;22)计算密码子出现的位置之间的间隔序列,记为{α1,α2,
…
,α
m
},计算公式如下:其中,p
r
‑1代表第r
‑
1次出现该密码子的位置,p
r
代表第r次出现该密码子的位置,α
r
代表第r次出现该密码子与第r
‑
1次出现该密码子之间的间隔;23)根据间隔序列,计算其间隔和序列,记为{β1,β2,
…
,β
m
},计算公式如下:其中,其中,α
r
代表第r次出现该密码子与第r
‑
1次出现该密码子之间的间隔,β
j
为前j个间隔的间隔和序列;24)计算香农熵,定义一个离散概率分布Q=(q1,q2,
…
,q
m
),其中q
i
的计算公式如下:然后计算香农熵如下:25)对每一种密码子重复步骤(1)
‑
(4),提取其特征,最终可以得到一个64维的向量,记为{H1,H2,
…
,H
64
},这一向量即为从该核酸序列提取出...
【专利技术属性】
技术研发人员:任洪广,龚行飞,胡明达,杨浩艺,王博千,靳远,岳俊杰,梁龙,陈微,
申请(专利权)人:中国人民解放军军事科学院军事医学研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。