System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及医学领域,尤其涉及一种hiv序列分型方法、设备及存储介质。
技术介绍
1、由于hiv病毒高复制率和高突变率的特性,以及特有的重组机制,会导致新的亚型,目前有高达120+以上的型别/重组型,而这其中的多个亚型则具有强烈的地域特征或者传播途径特征。因此,根据病毒型别判断hiv分子流行病学以及病毒溯源有着特殊意义。发现并鉴定hiv各种亚型对于追踪病毒流行趋势、研发诊断试剂、新药以及疫苗均具有重要意义。
2、目前国际上常用的hiv序列分型工具均存在参考序列较少,数据库更新不及时,支持的crf较少,方法单一的问题,难以满足目前hiv研究对分型工具高准确度、及时更新和支持更多最新发现的亚型的需求。
技术实现思路
1、本专利技术实施例提供一种hiv序列分型方法、设备及存储介质,用以至少提高hiv分型结果准确度。
2、第一方面,本专利技术提供一种hiv序列分型方法,所述hiv序列分型方法包括:
3、基于局部比对算法的搜索工具blast,将待分型hiv序列与预先设置的参考序列数据集进行比对;
4、在匹配结果满足预设的分型条件情况下,将满足分型条件的参考序列的亚型作为所述待分型hiv序列的亚型结果;
5、在匹配结果不满足预设的分型条件情况下,根据所述待分型hiv序列的重组判定,确定所述待分型hiv序列的亚型结果。
6、可选地,所述hiv序列分型方法还包括:
7、根据预设的匹配数量,确定出匹配的x条参考序列
8、根据匹配的x条参考序列和待分型hiv序列的一致度、匹配长度和亚型信息,判断匹配结果是否满足预设的分型条件情况。
9、可选地,根据匹配的x条参考序列和待分型hiv序列的一致度、匹配长度和亚型信息,判断匹配结果是否满足预设的分型条件情况,包括:
10、在匹配的x条参考序列与所述待分型hiv序列之间的一致度和匹配长度分别大于第一一致度阈值和第一匹配长度阈值,并且匹配的x条参考序列的亚型一致的情况下,判定匹配的x条参考序列满足预设的分型条件。
11、可选地,根据匹配的参考序列和待分型hiv序列的一致度、匹配长度和亚型信息,判断匹配结果是否满足预设的分型条件情况,包括:
12、在匹配的x条参考序列与所述待分型hiv序列之间的一致度和匹配长度分别大于第二一致度阈值和第二匹配长度阈值,并且匹配的x条参考序列的亚型不一致的情况下,根据预设的固定外参序列数量,确定出匹配的y条固定外参序列;y为大于x的整数;
13、根据所述待分型hiv序列、x条参考序列和y条固定外参序列,构建进化树;
14、对所述进化树进行解析,获得待分型hiv序列所在枝的节点支持值及与枝内序列的基因距离值,在所述节点支持值大于预设节点支持值阈值且待分型hiv序列与枝内序列的基因距离值小于预设距离阈值,判定该枝内序列满足预设的分型条件。
15、可选地,第二一致度阈值小于第一一致度阈值,第二匹配长度阈值不小于第一匹配长度阈值。
16、可选地,所述根据预设的固定外参序列数量,确定出匹配的y条固定外参序列,包括:
17、根据预设的固定外参序列数量,匹配相应数量的固定外参序列,
18、对匹配出的相应数量的固定外参序列与x条参考序列进行去重处理;
19、根据去重处理结果,确定出匹配的y条固定外参序列。
20、可选地,所述根据所述待分型hiv序列的重组判定,确定所述待分型hiv序列的亚型结果,包括:
21、根据预设的窗口值和步长值,将所述待分型hiv序列打断;
22、将打断的每段序列与预先设置的参考序列数据集进行比对;
23、在每段序列的最佳匹配参考序列的亚型一致的情况下,将最佳匹配参考序列的亚型作为所述待分型hiv序列的亚型结果;
24、在最佳匹配参考序列的亚型不一致的情况下,根据每段序列的最佳匹配参考序列的重组判定,确定所述待分型hiv序列的亚型结果。
25、可选地,所述根据每段序列的最佳匹配参考序列的重组判定,确定所述待分型hiv序列的亚型结果,包括:
26、利用每段序列的最佳匹配参考序列,根据打断位置的随机组合拼接,生成n条拼接序列;所述拼接序列的序列长度与待分型hiv序列长度一致;
27、将所述n条拼接序列作为初始种群;
28、根据预设的迭代次数,生成相应迭代数量的变异序列;将相应迭代数量的变异序列增加到初始种群中,得到最终种群;
29、根据预先定义的适应性函数s,将最终种群中适应性函数s值最低的序列的亚型,作为所述待分型hiv序列的亚型结果;
30、对于任一次迭代,生成一条变异序列包括:
31、根据所述适应性函数s,确定初始种群中各序列的适应性函数s值;所述适应性函数s为基于预设权重对基因距离和亚型个数的求和,所述基因距离为拼接序列或变异序列与待分型hiv序列的基因距离,所述亚型个数为拼接序列或变异序列中的亚型个数;
32、按照适应性函数s值的倒数筛选出两条拼接序列;
33、将两条拼接序列作为父母序列;
34、对父母序列分别截取,并拼接生成后代序列;
35、根据后代序列的随机变异,生成变异序列;
36、确定所述变异序列的适应性函数s值;
37、将变异序列添加到初始种群。
38、第二方面,本专利技术提供一种电子设备,所述电子设备包括:存储器和处理器,所述存储器存储有hiv序列分型程序,所述hiv序列分型程序被所述处理器执行时,实现如上任一项所述hiv序列分型方法的步骤。
39、第三方面,本专利技术提供一种计算机可读存储介质,所述计算机可读存储介质上存储有hiv序列分型程序,所述hiv序列分型程序可被至少一个处理器执行,以实现如上任一项所述hiv序列分型方法的步骤。
40、本专利技术基于局部比对算法的搜索工具blast,将待分型hiv序列与预先设置的参考序列数据集进行比对;在匹配结果满足预设的分型条件情况下,将满足分型条件的参考序列的亚型作为所述待分型hiv序列的亚型结果;在匹配结果不满足预设的分型条件情况下,根据所述待分型hiv序列的重组判定,确定所述待分型hiv序列的亚型结果,融合多种方法进行hiv序列分型,有效提高分型结果的准确度,并且在判断序列的重组组成时综合考虑整体序列以及亚型组成个数的情况。
41、上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。
本文档来自技高网...【技术保护点】
1.一种HIV序列分型方法,其特征在于,所述HIV序列分型方法包括:
2.根据权利要求1所述的HIV序列分型方法,其特征在于,所述HIV序列分型方法还包括:
3.根据权利要求2所述的HIV序列分型方法,其特征在于,根据匹配的X条参考序列和待分型HIV序列的一致度、匹配长度和亚型信息,判断匹配结果是否满足预设的分型条件情况,包括:
4.根据权利要求3所述的HIV序列分型方法,其特征在于,根据匹配的参考序列和待分型HIV序列的一致度、匹配长度和亚型信息,判断匹配结果是否满足预设的分型条件情况,包括:
5.根据权利要求4所述的HIV序列分型方法,其特征在于,第二一致度阈值小于第一一致度阈值,第二匹配长度阈值不小于第一匹配长度阈值。
6.根据权利要求4所述的HIV序列分型方法,其特征在于,所述根据预设的固定外参序列数量,确定出匹配的Y条固定外参序列,包括:
7.根据权利要求1-6中任一项所述的HIV序列分型方法,其特征在于,所述根据所述待分型HIV序列的重组判定,确定所述待分型HIV序列的亚型结果,包括:
9.一种电子设备,其特征在于,所述电子设备包括:存储器和处理器,所述存储器存储有HIV序列分型程序,所述HIV序列分型程序被所述处理器执行时,实现如权利要求1至8中任一项所述HIV序列分型方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有HIV序列分型程序,所述HIV序列分型程序可被至少一个处理器执行,以实现如权利要求1至8中任一项所述HIV序列分型方法的步骤。
...【技术特征摘要】
1.一种hiv序列分型方法,其特征在于,所述hiv序列分型方法包括:
2.根据权利要求1所述的hiv序列分型方法,其特征在于,所述hiv序列分型方法还包括:
3.根据权利要求2所述的hiv序列分型方法,其特征在于,根据匹配的x条参考序列和待分型hiv序列的一致度、匹配长度和亚型信息,判断匹配结果是否满足预设的分型条件情况,包括:
4.根据权利要求3所述的hiv序列分型方法,其特征在于,根据匹配的参考序列和待分型hiv序列的一致度、匹配长度和亚型信息,判断匹配结果是否满足预设的分型条件情况,包括:
5.根据权利要求4所述的hiv序列分型方法,其特征在于,第二一致度阈值小于第一一致度阈值,第二匹配长度阈值不小于第一匹配长度阈值。
6.根据权利要求4所述的hiv序列分型方法,其特征在于,所述根据预设的固定外参序列数量,确...
【专利技术属性】
技术研发人员:吴林寰,曹丕,范国梅,卢键,张荐辕,
申请(专利权)人:中国科学院微生物研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。