【技术实现步骤摘要】
本专利技术涉及生物信息,具体为涉及基于模糊查找与精确匹配相结合的二代测序数据分析装置、方法及计算机可读存储介质。
技术介绍
1、dna是生物体内遗传信息的主要载体,对dna序列的测定以及解读也是当前生物信息学的主要工作之一。随着测序技术的飞速发展,二代测序技术逐渐得到普及,并且测序时间及成本也一降再降,这也直接导致二代测序数据量的指数增长。并且近几年来,随着新发传染病的反复出现,二代测序已经成为鉴定新发传染病病原种类体及其进化关系的重要工具,比如在sars-cov-2冠状病毒的鉴定及后续进化趋势分析,以及猴痘病毒亚型的鉴定中,都是通过对二代测序的数据分析才能对病原体进行快速准确的判断。这就意味着面对当前海量的测序数据,后续的分析方法尤为重要,只有对测序结果进行充分、快速、准确的解读,才能真正发挥出二代测序高准确性的优势。
2、常用的二代测序数据分析软件主要有bwa,soapdenovo,spades,velvet以及bowtie 2等,不同的软件侧重不同的功能,比如bwa常用于针对大型参考基因组(例如人基因组)dna序列的m
...【技术保护点】
1.二代测序数据分析的装置,其特征在于:所述装置包括如下模块:
2.根据权利要求1所述的装置,其特征在于:B4)中,所述LD值小于等于0.05的所述初步匹配测序读段被输出为无indel突变测序read,所述LD值大于0.05的所述初步匹配测序读段被输出为有indel突变测序read。
3.根据权利要求1或2所述的装置,其特征在于:B5)包括如下子模块:
4.根据权利要求1-3中任一权利要求所述的装置,其特征在于:B6)所述模块通过包括如下步骤的方法实现:将所有所述无indel突变测序reads和所有所述有indel突变测序reads
...【技术特征摘要】
1.二代测序数据分析的装置,其特征在于:所述装置包括如下模块:
2.根据权利要求1所述的装置,其特征在于:b4)中,所述ld值小于等于0.05的所述初步匹配测序读段被输出为无indel突变测序read,所述ld值大于0.05的所述初步匹配测序读段被输出为有indel突变测序read。
3.根据权利要求1或2所述的装置,其特征在于:b5)包括如下子模块:
4.根据权利要求1-3中任一权利要求所述的装置,其特征在于:b6)所述模块通过包括如下步骤的方法实现:将所有所述无indel突变测序reads和所有所述有indel突变测序reads命名为合格测序读段,将所述合格测序读段映射到(比对)所述待分析生物的参考组序列;计算所述参考组序列自5’端第1位核苷酸起的每一位核苷酸位点上所有映射上的所述合格测序读段中该位点的数量最多的核苷酸种类,作为所述待分析生物测序数据该位点的核苷酸种类,最终得到所述参考组序列中每一位核苷酸位点对应的所述待分析生物测序数据中该核苷酸位点的核苷酸种类,得到所述待分析生物的测序数据的组装分析结果;所述核苷酸的种类为a、t、c、g或缺失。
5.二代测序数据分析的方法,其特征在于:所述方法包括如下步骤:
6.根据权利要求5所述的方法,其特征在于:...
【专利技术属性】
技术研发人员:李靖,张森,董罡,姜涛,康晓平,陈月红,冯烨,李裕昌,
申请(专利权)人:中国人民解放军军事科学院军事医学研究院,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。