System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 一种筛选基因组复杂突变合并的方法以及装置制造方法及图纸_技高网

一种筛选基因组复杂突变合并的方法以及装置制造方法及图纸

技术编号:40326757 阅读:8 留言:0更新日期:2024-02-09 14:20
本发明专利技术公开了一种筛选基因组复杂突变合并的方法,该方法包括以下步骤:用Pisces软件中的Scylla模块对原始VCF输入文件进行突变合并,获得初步输出结果和突变合并过程的运行记录,然后读取的运行记录,筛选出有效的合并结果以及对应的合并成员,在原始VCF输入文件中对筛选后的合并成员进行标记,然后将合并结果的完整信息写入原始VCF输入文件,获得最终输出结果。本发明专利技术的方法可以有效的解决两个距离较远单碱基突变(SNV)进行合并的情况,避免无效合并的出现,最大限度保留原有的突变信息,提高突变检测的可靠性,同时可以保留参与合并的成员的完整信息,给后续报告解读提供复核和确认的原始依据,提高突变检测的可追溯性。

【技术实现步骤摘要】

本专利技术属于生物信息学领域,具体涉及到一种筛选基因组复杂突变合并的方法以及装置


技术介绍

1、突变是指在基因突变是指dna序列发生了突发性的、不可预测的变异,引起基因产物(如蛋白质)的异常或完全改变,导致遗传信息发生了改变。基因突变可以出现在单个核苷酸水平(称为点突变),也可以涉及更大的部分,例如基因缺失、重复或倒位等。基因突变可以是自然发生的,也可以由环境因素(如化学物质、辐射等)或遗传缺陷等引起。一些基因突变可能对生物体的正常功能产生影响,例如导致疾病的突变,而其他突变则可能没有显著的影响或在某些情况下甚至可能具有适应优势。研究基因突变对我们理解基因结构和功能、遗传疾病的病因以及演化过程等方面都具有重要意义。常见的突变可大致归为以下几种类型:

2、1)单碱基或多碱基缺失(deletion),即某位置发生了单个或多个碱基的缺失(删除)。

3、2)单碱基或多碱基的插入或重复(insertion/duplication),即某位置发生了单个或多个碱基的插入或重复。

4、3)替代突变(substitution),即某位置的单个碱基或多个碱基被另外的单个或多个碱基替代,其中单个碱基的替代突变通常称为单碱基突变(snv)。

5、4)复杂突变(complex variation)。如果在同一条序列中上述的3种突变类型连续发生或在一定距离内连续发生,那么这些突变可以整合或简并为一个由上述突变类型复合而成的、结构较为复杂的突变。

6、多个单独的突变可能会产生相互作用,导致更大范围的生物学影响,合并这些多个单独的突变成为一个复杂突变可以更准确地反映这种叠加效应。将多个单独的突变合并成复杂突变后,我们可以更方便地对其进行功能解释,相比于分别研究和理解多个单独的突变,合并后的复杂突变能够更直接地揭示蛋白质结构和功能的改变,可以简化研究的过程,并提供更便捷的诊断方式。特别是在遗传疾病研究中,复杂突变的检测和解读相对于单个突变的研究更能准确地确定相关疾病的致病基因。

7、目前针对复杂突变合并的工具软件种类较少,pisces软件(https://github.com/tamsen/pisces)中的scylla模块可以实现对不同上游突变检测软件得到的结果中的潜在的复杂突变进行探测、解析与合并。

8、在实际应用中,scylla会对两个距离较远snv进行合并,这在突变检测应用中常常是没有必要的,合并成员中的两个snv完全可以单独解读,并且这种合并使突变表达式变得非常冗长,为后续的解读带来困扰。而且,scylla会进行无效合并,即最终合并的结果是参与合并的多个突变中的一员,这种无效合并不能产生有用的合并结果,但会改变原有突变的相关信息,影响突变检测的可靠性。scylla最后产生的合并结果会覆盖参与合并的成员,这在后续的解读过程中让复杂突变的来源变得无迹可寻,对最终报告的结果可能产生隐患。


技术实现思路

1、本专利技术的目的在于克服现有技术的至少一个不足,提供一种筛选基因组复杂突变合并的方法以及装置。

2、本专利技术所采取的技术方案是:

3、第一个方面,本专利技术提供一种筛选基因组复杂突变合并的方法,包括以下步骤:

4、1)用pisces软件中的scylla模块对原始vcf输入文件进行突变合并,获得初步输出结果和突变合并过程的运行记录;

5、2)读取步骤1)得到的运行记录,筛选出有效的合并结果以及对应的合并成员,得到筛选后的合并结果及合并成员;

6、3)在步骤1)得到的初步输出结果中,提取步骤2)得到的合并结果的完整信息备用;

7、4)在原始vcf输入文件中对步骤2)得到的合并成员进行标记,然后将步骤3)提取的完整信息写入原始vcf输入文件,获得最终输出结果;

8、其中,所述步骤2)的筛选结果要同时满足以下两个条件:

9、1)合并结果中的野生型序列和突变型序列的长度不相等;

10、2)合并成员中不包含合并结果。

11、在一些实例中,所述步骤2)的筛选后的合并结果不属于碱基缺失的突变类型。

12、在一些实例中,所述步骤2)的筛选后的合并结果不属于碱基插入的突变类型。

13、在一些实例中,所述步骤2)的筛选后的合并结果是由单个碱基缺失与单个碱基替代组成的复杂突变。

14、在一些实例中,所述步骤2)的筛选后的合并结果是由单个碱基插入与单个碱基替代组成的复杂突变。

15、第二个方面,本专利技术一种筛选基因组复杂突变合并的装置,所述装置包括:

16、存储模块,用于存储突变合并的初步输出结果和运行记录;

17、判断模块,用于筛选出有效的合并结果以及对应的合并成员;

18、输出模块,用于将判断模块获取的信息写入原始输入文件,获得最终输出结果。

19、第三个方面,本专利技术提供一种设备,包括:

20、一个或多个处理器;

21、存储装置,用于存储一个或多个程序;

22、当所述一个或多个程序被所述一个或多个处理器执行,使得所述一个或多个处理器实现第一个方面所述的方法。

23、第四个方面,本专利技术提供一种存储介质,所述存储介质存储有计算机指令,所述计算机指令用于被所述计算机执行以实现第一个方面所述的方法。

24、本专利技术的有益效果是:

25、1)本专利技术的方法可以有效的解决两个距离较远单碱基突变(snv)进行合并的情况,提高检测结果的可读性,让后续的报告解读更加清晰,从而更加高效地为患者提供用药指导;

26、2)本专利技术的方法可以避免无效合并的出现,最大限度保留原有的突变信息,提高突变检测的可靠性;

27、3)本专利技术的方法可以保留参与合并的成员的完整信息,给后续报告解读提供复核和确认的原始依据,提高突变检测的可追溯性;

28、4)本专利技术的方法降低了分析流程的编写复杂性,同时提高了代码执行效率。

本文档来自技高网...

【技术保护点】

1.一种筛选基因组复杂突变合并的方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的方法,其特征在于,所述步骤2)的筛选后的合并结果不属于碱基缺失的突变类型。

3.根据权利要求1所述的方法,其特征在于,所述步骤2)的筛选后的合并结果不属于碱基插入的突变类型。

4.根据权利要求1所述的方法,其特征在于,所述步骤2)的筛选后的合并结果是由单个碱基缺失与单个碱基替代组成的复杂突变。

5.根据权利要求1所述的方法,其特征在于,所述步骤2)的筛选后的合并结果是由单个碱基插入与单个碱基替代组成的复杂突变。

6.一种筛选基因组复杂突变合并的装置,其特征在于,所述装置包括:

7.一种设备,其特征在于,包括:

8.一种存储介质,所述存储介质存储有计算机指令,所述计算机指令用于被所述计算机执行以实现如权利要求1所述的方法。

【技术特征摘要】

1.一种筛选基因组复杂突变合并的方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的方法,其特征在于,所述步骤2)的筛选后的合并结果不属于碱基缺失的突变类型。

3.根据权利要求1所述的方法,其特征在于,所述步骤2)的筛选后的合并结果不属于碱基插入的突变类型。

4.根据权利要求1所述的方法,其特征在于,所述步骤2)的筛选后的合并结果是由单个碱基缺失与单个碱基替...

【专利技术属性】
技术研发人员:韩尔康欧小华袁剑颖陈嘉昌柳俊胡朝晖
申请(专利权)人:广州市金圻睿生物科技有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1