System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及医学领域,尤其涉及一种hiv序列质控方法、设备及存储介质。
技术介绍
1、由于hiv(感染艾滋病病毒)基因组的高度变异性和复杂性,序列分析过程中经常会出现序列质量问题,影响序列数据的准确性和可靠性。利用序列质控工具对hiv序列数据进行质量检查和修复,能够提高数据质量和准确性,为后续分析提供更可靠的基础数据。
2、目前常用的hiv序列的质控内容主要包括输出待质控hiv序列的长度、混合碱基比例、超突变情况、终止密码子突变情况、移码突变情况、非常规突变(即突变频率非常低的突变)。但是,常规突变筛选+注释软件(mummer和annovar)并不能处理带有混合碱基的序列,不适用于hiv序列的分析,无法实现对移码突变、终止密码子突变、非常规突变的质控。
3、本专利技术旨在提供一种可替代的hiv序列质控方案,实现对密码子突变情况、移码突变情况、非常规突变的计算。
技术实现思路
1、本专利技术实施例提供一种hiv序列质控方法、设备及存储介质,用以至少实现对密码子突变情况、移码突变情况、非常规突变的计算。
2、第一方面,本专利技术提供一种hiv序列质控方法,所述hiv序列质控包括:
3、按照顺序逐行将比对处理后的两个序列的碱基或空位追加到预先设置的序列信息文件中,并记录两个序列的碱基或空位的位置序号;在记录每个序列的碱基或空位的位置序号过程中,当追加到碱基时,该碱基对应的位置序号加1;当追加到空位时,该空位对应的位置序号保持与前一个位置序
4、根据每行中两个序列的碱基或空位对应的位置序号及两个序列的碱基和空位的组合关系,对待质控hiv序列进行质量质控;所述两个序列为hiv标准序列和待质控hiv序列。
5、可选地,所述根据每行中两个序列的碱基或空位对应的位置序号及两个序列的碱基和空位的组合关系,对待质控hiv序列进行质量质控,包括:对于任一行的两个序列:
6、在待质控hiv序列当前行为空位的情况下,当待质控hiv序列中当前行之后连续为空位的行数不为3的倍数时,确定所述待质控hiv序列为移码缺失突变。
7、可选地,所述对待质控hiv序列进行质量质控包括:
8、根据当前行的标准序列位置序号,确定标准序列位置所属的基因片段类型、基因片段的相对位置及缺失的碱基。
9、可选地,所述根据每行中两个序列的碱基或空位对应的位置序号及两个序列的碱基和空位的组合关系,对待质控hiv序列进行质量质控,包括:对于任一行的两个序列:
10、在hiv标准序列当前行为空位的情况下,当hiv标准序列中当前行之后连续为空位的行数不为3的倍数时,确定所述待质控hiv序列为移码插入突变。
11、可选地,所述根据每行中两个序列的碱基或空位对应的位置序号及两个序列的碱基和空位的组合关系,对待质控hiv序列进行质量质控,包括:对于任一行的两个序列:
12、在hiv标准序列和待质控hiv序列的当前行均为碱基的情况下,输出与当前行碱基属于同一个密码子的三联碱基翻译的氨基酸的类型;根据三联碱基翻译的氨基酸的类型,确定所述待质控hiv序列的密码子突变类型。
13、可选地,所述输出与当前行碱基属于同一个密码子的三联碱基翻译的氨基酸的类型,包括:
14、在判断hiv标准序列和待质控hiv序列的n+m行均为碱基的情况下,根据hiv标准序列当前行对应的位置序号,判断当前行与n+m行是否分属不同的翻译氨基酸的密码子;其中n表示当前行,m为1或2;
15、根据判断结果,输出与当前行碱基属于同一个密码子的三联碱基翻译的氨基酸的类型。
16、可选地,所述三联碱基翻译的氨基酸的类型包括:基因片段类型、基因片段的相对位置、突变的碱基、hiv标准序列该碱基所处三联碱基翻译的氨基酸和待质控hiv序列突变后三联碱基翻译的氨基酸;
17、所述密码子突变类型包括:同义突变、非同义突变和终止密码子突变,以及突变后的氨基酸出现在低频突变数据集中。
18、可选地,所述序列信息文件为序列信息表格;所述按照顺序逐行将比对处理后的两个序列的碱基或空位追加到预先设置的序列信息文件中,包括:
19、将待质控的序列文件拆分成多个fasta文件,使一条待质控hiv序列构成一个待质控的子序列文件;完成后在每个待质控的子序列文件内添加hiv标准序列并保存,对每个待质控的子序列文件内待质控hiv序列和hiv标准序列进行比对处理;
20、对于每个序列:按顺序遍历该序列,将该序列的碱基或空位追加到序列信息表格中,并记录该序列的碱基或空位的位置序号;其中,当遍历到碱基时,该碱基对应的位置序号加1;当遍历到空位时,该空位对应的位置序号保持与前一个位置序号相同;
21、对序列信息文件中hiv标准序列和待质控hiv序列进行去重处理。
22、第二方面,本专利技术提供一种电子设备,所述电子设备包括:存储器和处理器,所述存储器存储有hiv序列质控程序,所述hiv序列质控程序被所述处理器执行时,实现如上任一项所述hiv序列质控方法的步骤。
23、第三方面,本专利技术提供一种计算机可读存储介质,所述计算机可读存储介质上存储有hiv序列质控程序,所述hiv序列质控程序可被至少一个处理器执行,以实现如上任一项所述hiv序列质控方法的步骤。
24、本专利技术至少实现对密码子突变情况、移码突变情况、非常规突变的计算。
25、上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其它目的、特征和优点能够更明显易懂,以下特举本专利技术的具体实施方式。
本文档来自技高网...【技术保护点】
1.一种HIV序列质控方法,其特征在于,所述HIV序列质控方法包括:
2.根据权利要求1所述的HIV序列质控方法,其特征在于,所述根据每行中两个序列的碱基或空位对应的位置序号及两个序列的碱基和空位的组合关系,对待质控HIV序列进行质量质控,包括:对于任一行的两个序列:
3.根据权利要求2所述的HIV序列质控方法,其特征在于,所述对待质控HIV序列进行质量质控包括:
4.根据权利要求1所述的HIV序列质控方法,其特征在于,所述根据每行中两个序列的碱基或空位对应的位置序号及两个序列的碱基和空位的组合关系,对待质控HIV序列进行质量质控,包括:对于任一行的两个序列:
5.根据权利要求1所述的HIV序列质控方法,其特征在于,所述根据每行中两个序列的碱基或空位对应的位置序号及两个序列的碱基和空位的组合关系,对待质控HIV序列进行质量质控,包括:对于任一行的两个序列:
6.根据权利要求5所述的HIV序列质控方法,其特征在于,所述输出与当前行碱基属于同一个密码子的三联碱基翻译的氨基酸的类型,包括:
7.根据权利要求5所述的
8.根据权利要求1-7中任一项所述的HIV序列质控方法,其特征在于,所述序列信息文件为序列信息表格;所述按照顺序逐行将比对处理后的两个序列的碱基或空位追加到预先设置的序列信息文件中,包括:
9.一种电子设备,其特征在于,所述电子设备包括:存储器和处理器,所述存储器存储有HIV序列质控程序,所述HIV序列质控程序被所述处理器执行时,实现如权利要求1至8中任一项所述HIV序列质控方法的步骤。
10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有HIV序列质控程序,所述HIV序列质控程序可被至少一个处理器执行,以实现如权利要求1至8中任一项所述HIV序列质控方法的步骤。
...【技术特征摘要】
1.一种hiv序列质控方法,其特征在于,所述hiv序列质控方法包括:
2.根据权利要求1所述的hiv序列质控方法,其特征在于,所述根据每行中两个序列的碱基或空位对应的位置序号及两个序列的碱基和空位的组合关系,对待质控hiv序列进行质量质控,包括:对于任一行的两个序列:
3.根据权利要求2所述的hiv序列质控方法,其特征在于,所述对待质控hiv序列进行质量质控包括:
4.根据权利要求1所述的hiv序列质控方法,其特征在于,所述根据每行中两个序列的碱基或空位对应的位置序号及两个序列的碱基和空位的组合关系,对待质控hiv序列进行质量质控,包括:对于任一行的两个序列:
5.根据权利要求1所述的hiv序列质控方法,其特征在于,所述根据每行中两个序列的碱基或空位对应的位置序号及两个序列的碱基和空位的组合关系,对待质控hiv序列进行质量质控,包括:对于任一行的两个序列:
6.根据权利要求5所述的hiv序列质控方法,其特征在于,所述输出与当前行碱基属于同一个...
【专利技术属性】
技术研发人员:吴林寰,曹丕,范国梅,卢键,张荐辕,
申请(专利权)人:中国科学院微生物研究所,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。