System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种重组腺相关病毒组织分布鉴定的分析方法及系统技术方案_技高网

一种重组腺相关病毒组织分布鉴定的分析方法及系统技术方案

技术编号:41335139 阅读:15 留言:0更新日期:2024-05-20 09:54
本发明专利技术提供一种重组腺相关病毒组织分布鉴定的分析方法及系统,涉及病毒数据分析技术领域,该方法包括输入多组重组腺相关病毒组织分布的测序数据,同时对多组NGS双端测序数据进行合并得到完整测序数据;去除5’端引物序列得到干净测序数据;提取正/反向序列得到正向测序数据和反向测序数据;提取barcode序列得到目标数据;进行转换格式得到fasta格式数据;将反向barcode序列反向互补后,比较正/反向barcode序列是否一致,过滤不一致序列中与barcode序列错配多于1个碱基的序列;校正与barcode序列存在错配的序列,校正后将所有序列匹配到对应的barcode名称并计数,统计不同barcode占比;将多个校正并计数后的barcode序列文件,整理为Excel表格汇总。本发明专利技术提高分析效率以及分析结果的准确性。

【技术实现步骤摘要】

本专利技术涉及病毒数据分析,尤其涉及一种重组腺相关病毒组织分布鉴定的分析方法及系统


技术介绍

1、腺相关病毒(adeno-associated virus,aav)是细小病毒科(parvoviridae)的病毒,病毒颗粒大小约为20-25nm,是目前已知的最小的动物病毒。aav是一种复制缺陷型病毒,其增殖复制需要腺病毒(adenovirus,ad)或者单纯孢疹病毒(herpes simplex virus,hsv)的辅助。在缺乏辅助病毒的情况下,aav可以在许多类型的细胞中长期潜伏存在。

2、aav是单链dna病毒,基因组结构简单,全长约4.7kb。aav基因组dna的两端为145个核苷酸长度的反向末端重复序列(inverted terminal repeat,itr),itr序列折叠成发卡结构,是dna复制起始和包装重组aav基因组为感染性的病毒颗粒所需的顺式作用元件。itr序列之间为病毒编码区,含有rep和cap两个基因。其中rep基因编码rep78、rep68、rep52和rep40四种蛋白质,主要作用于病毒基因组复制以及与宿主基因组的整合;而cap基因编码vp1、vp2和vp3三种病毒衣壳蛋白和组装激活蛋白aap,主要作用于病毒基因组的包装以及从宿主细胞中的分泌。

3、vp1和vp2蛋白共享vp3序列,并在其n端具有其他残基。vp1的n端具有一个保守的磷脂酶a2序列,该序列与病毒从体内逃逸有关,并对其感染性至关重要;vp2蛋白对于组装或者感染并非比不可少;vp3蛋白的核心由保守的β-桶基序组成,决定了不同血清型aav与宿主细胞作用受体的差异。

4、虽然aav感染在人类中很常见,但与任何已知疾病无关,加上其转导分裂细胞和静止细胞的能力、非常低的免疫原性以及转基因长期表达(与野生型aav病毒感染后整合到宿主细胞dna不同,重组aav载体主要作为染色体外游离体长期存在)。这些特性使aav作为一种高效安全的转基因载体,被广泛应用于基因治疗、神经环路标记、活体成像、基因编辑以及神经系统疾病动物模型的制备等方面。

5、现在发现的十多种常见血清型以及上百种病毒变种的主要区别在于衣壳蛋白cap基因的不同,编码结构蛋白的不同从而导致不同血清型的aav对不同的组织和细胞感染效率不同。aav2是人类发现最早、研究最早的血清型,在这几十年的研究中aav2是研究得最清楚的血清型。但aav2有一定的局限性,它对很多组织和细胞的感染效率不高。

6、腺相关病毒的转导效率与细胞类型有关。有些细胞类型显示较低的转导效率,而有些细胞类型则显示较高的效率。aav在组织中的转导效果可以持续2-6个月,并且通常在注射后2-4周可以达到表达峰值。不同血清型的aav对不同的组织感染效率不同。

7、重组腺相关病毒(aav)近年来已成为用于基因治疗和疫苗开发的热门基因递送载体。在早期临床研究中,为测试aav载体在体内的可靠性和安全性,一个关键的问题便是需要鉴定其在多种器官和组织中的分布情况与留存时长。

8、目前有多种方式鉴定aav在器官、组织和细胞水平上的分布鉴定,包括报告基因荧光成像、流式细胞仪分离荧光阳性细胞、荧光素酶报告基因活性测定、qpcr测定基因组拷贝数、rt-pcr分析目的基因表达等。

9、以上方法中,提到的荧光素酶报告相关系统属于生物发光系统,其中的荧光素酶来自于不同生物体内的氧化酶,很多物种(细菌、海洋动物、昆虫等)中都含有荧光素酶,其中应用比较广泛的是荧火虫荧光素酶。

10、以上基于荧光的报告系统结果比较直观,但是每一种aav都需要单独检测,不仅工作量大,而且如果是体内实验,实验动物的用量也很大,成本很高。虽然可以用不同的荧光基团标记不同的aav,但是因为荧光基团的发射光谱常常有一定程度的交叉和重叠,荧光检测仪器能够同时检测的不同荧光基团数量有限,不能做到高通量。而且不同荧光的亮度和稳定性不同,单独从荧光强弱上判断其相对的表达高低常常会有些偏差。

11、另外,在aav药物的毒性评估和药效评价中,我们常常既要测定病毒基因组(dna),又要测定载体的转导效率(rna或者蛋白质)。以上方法中,基于荧光蛋白的检测系统和rt-pcr的手段只能分析蛋白质或者rna,qpcr只测定dna,常常需要两套不同的系统来完成dna和rna(或者蛋白质)的同时分析,费时费力。


技术实现思路

1、为了解决上述问题,本专利技术实施例提供了一种重组腺相关病毒组织分布鉴定的分析方法及系统,本专利技术的目的在于可以在同个物种中鉴定不同aav基因载体的组织分布。具体而言,每个基因载体均带有一个“标签”(barcode),而且这个标签会在病毒携带的基因转录的时候同时转录出来,所以在病毒基因组上和病毒转导进细胞以后表达的mrna中均能检测到。在给定组织中,通过新一代测序技术(the next generation sequencing,ngs)测定这些barcode就能鉴定这些aav载体的基因组dna或mrna在组织中的分布模式。该方法可以显著地减少鉴定的成本和时长,更关键的是,该方法允许在组织中转导高丰度的互为内参的不同类型载体,从而增加了数据的灵敏度和可靠性。同时通过一键式自动完成ngs下机数据分析,能够在短时间内获得精确数据,节约人力和时间。

2、为了实现上述目的,本专利技术实施例提供一种重组腺相关病毒组织分布鉴定的分析方法,该方法包括:

3、步骤s1:输入多组重组腺相关病毒组织分布的测序数据,同时对多组ngs双端测序数据进行合并,得到完整测序数据;

4、步骤s2:对所述完整测序数据去除5’端引物序列,得到干净测序数据;

5、步骤s3:对所述干净测序数据分别提取正向序列和反向序列,得到正向测序数据和反向测序数据;

6、步骤s4:对所述正向测序数据和所述反向测序数据提取barcode序列,得到目标数据;

7、步骤s5:对所述目标数据进行转换格式,得到fasta格式数据;

8、步骤s6:根据得到的fasta格式数据,将反向barcode序列反向互补后,比较正向barcode序列与反向barcode序列是否一致,过滤不一致序列中与barcode序列错配多于1个碱基的序列,保留与已知barcode序列完全匹配和只有一个错配的序列;

9、步骤s7:根据步骤s6得到的数据,校正与barcode序列存在错配的序列,校正后,将所有序列匹配到对应的barcode名称并计数,统计不同barcode占比;

10、步骤s8:将多个校正并计数后的barcode序列文件,整理为excel表格汇总。

11、优选地,所述对所述完整测序数据去除5’端引物序列,得到干净测序数据的方法为:

12、使用cutadapt软件对所述完整测序数据去除5’端引物序列,得到干净测序数据。

13、优选地,对所述干净测序数据分别提取正向序列和反向序列,得到正向测序数据和反向测本文档来自技高网...

【技术保护点】

1.一种重组腺相关病毒组织分布鉴定的分析方法,其特征在于,包括:

2.根据权利要求1所述的重组腺相关病毒组织分布鉴定的分析方法,其特征在于,所述对所述完整测序数据去除5’端引物序列,得到干净测序数据的方法为:

3.根据权利要求1所述的重组腺相关病毒组织分布鉴定的分析方法,其特征在于,对所述干净测序数据分别提取正向序列和反向序列,得到正向测序数据和反向测序数据的方法为:

4.根据权利要求1所述的重组腺相关病毒组织分布鉴定的分析方法,其特征在于,对所述正向测序数据和所述反向测序数据提取barcode序列,得到目标数据的方法为:

5.根据权利要求1所述的重组腺相关病毒组织分布鉴定的分析方法,其特征在于,所述对所述目标数据进行转换格式,得到fasta格式数据的方法为:

6.根据权利要求1所述的重组腺相关病毒组织分布鉴定的分析方法,其特征在于,所述根据得到的fasta格式数据,将反向barcode序列反向互补后,比较正向barcode序列与反向barcode序列是否一致,过滤不一致序列中与barcode序列错配多于1个碱基的序列,保留与已知barcode序列完全匹配和只有一个错配的序列,具体包括:

7.根据权利要求1所述的重组腺相关病毒组织分布鉴定的分析方法,其特征在于,所述根据步骤S6得到的数据,校正与barcode序列存在错配的序列,校正后,将所有序列匹配到对应的barcode名称并计数,统计不同barcode占比,具体包括:

8.一种重组腺相关病毒组织分布鉴定的分析系统,其特征在于,所述系统用于实现权利要求1至7任意一项所述的重组腺相关病毒组织分布鉴定的分析方法,具体包括:

9.一种电子设备,其特征在于,所述电子设备包括处理器、存储器和总线系统,所述处理器和存储器通过该总线系统相连,所述存储器用于存储指令,所述处理器用于执行存储器存储的指令,以实现权利要求1至7任意一项所述的重组腺相关病毒组织分布鉴定的分析方法。

10.一种计算机存储介质,其特征在于,所述计算机存储介质存储有计算机软件产品,所述计算机软件产品包括的若干指令,用以使得一台计算机设备执行权利要求1至7任意一项所述的重组腺相关病毒组织分布鉴定的分析方法。

...

【技术特征摘要】

1.一种重组腺相关病毒组织分布鉴定的分析方法,其特征在于,包括:

2.根据权利要求1所述的重组腺相关病毒组织分布鉴定的分析方法,其特征在于,所述对所述完整测序数据去除5’端引物序列,得到干净测序数据的方法为:

3.根据权利要求1所述的重组腺相关病毒组织分布鉴定的分析方法,其特征在于,对所述干净测序数据分别提取正向序列和反向序列,得到正向测序数据和反向测序数据的方法为:

4.根据权利要求1所述的重组腺相关病毒组织分布鉴定的分析方法,其特征在于,对所述正向测序数据和所述反向测序数据提取barcode序列,得到目标数据的方法为:

5.根据权利要求1所述的重组腺相关病毒组织分布鉴定的分析方法,其特征在于,所述对所述目标数据进行转换格式,得到fasta格式数据的方法为:

6.根据权利要求1所述的重组腺相关病毒组织分布鉴定的分析方法,其特征在于,所述根据得到的fasta格式数据,将反向barcode序列反向互补后,比较正向barcode序列与反向barcode序列是否一致,过滤不一致序列中与barcode序列错配多...

【专利技术属性】
技术研发人员:戴明星张庆硕
申请(专利权)人:瑞诺元苏州生物科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1