【技术实现步骤摘要】
一种筛选致病性变异的方法和系统
本专利技术涉及测序数据分析的
具体地,本专利技术涉及一种筛选致病性变异的方法以及实施该方法的系统。
技术介绍
在循症医学迈向精准医学的时代背景下,基因组测序技术是实现复杂疾病预警、预防、早诊和提高疗效的一种重要手段。随着测序时间和成本的下降,高通量测序数据将面临爆发式增长。但是,基因组测序数据的解读,仍然面临着诸多挑战。如何快速、准确的发现基因组数据中的致病性变异,以及如何系统、全面地服务于临床疾病的诊断是亟待解决的问题。通常,需要使用一系列分析软件,例如质量控制软件(FastQC、Trimmomatic等)、序列比对软件(BWA、Bowtie、SOAP等)、变异判读软件(GATK、Samtools等)来分析基因组测序产生的原始下机数据,才能获得遗传变异信息。举例而言,通过捕获测序检测到的遗传变异主要包含单核苷酸多态性(SNP)和小的插入缺失(InDel)这两种变异类型。而依据不同的捕获探针,全外显子捕获测序检测到的遗传变异的数量通常在3-5万之间。变异位点通常以VCF文件格式 ...
【技术保护点】
1.一种筛选致病性变异的方法,包括以下步骤:/n(1)读取测序数据,并获得遗传变异信息;/n(2)变异注释:用注释软件和genomAD、HGMD、Clinvar、dbSNP、HGNC数据库对遗传变异信息进行注释,获得变异注释文件;/n(3)变异筛选:基于人群频率和是否有致病性数据支持从变异注释文件中筛选致病性变异。/n
【技术特征摘要】
1.一种筛选致病性变异的方法,包括以下步骤:
(1)读取测序数据,并获得遗传变异信息;
(2)变异注释:用注释软件和genomAD、HGMD、Clinvar、dbSNP、HGNC数据库对遗传变异信息进行注释,获得变异注释文件;
(3)变异筛选:基于人群频率和是否有致病性数据支持从变异注释文件中筛选致病性变异。
2.根据权利要求1所述的方法,在步骤(1)之后还包括根据变异类型将遗传变异信息分为SNP和InDel两个文件的步骤,且在步骤(2)之后还包括合并完成注释的SNP和InDel文件的步骤。
3.根据权利要求1所述的方法,在步骤(2)中,用注释软件和genomAD、HGMD、Clinvar、dbSNP、HGNC数据库进行注释是模块化、并行化进行的。
4.根据权利要求1-3任一项所述的方法,在HGNC注释之后还包括用OMIM数据库注释遗传方式的步骤。
5.根据权利要求1-4任一项所述的方法,步骤(2)包括预先将用于注释的数据库构建为二进制文件,然后再进行注释并获得变异注释文件。
6.根据权利要求5所述的方法,所述二进制文件中存储的数据具有哈希结构。
7.根据权利要求1-6任一项所述的方法,步骤(3)中用于筛选的人群频率的标准是在所有人群频率数据库中,变异的频率低于0.05或为NA。
8.根据权利要求1-7任一项所述的方法,步骤(3)还包括基于表型的筛选。
9.根据权利要求1-8任一项所述的方法,步骤(3)中所述“基于是否有致病性证据支持进行筛选”是指筛选符合HGMD中的DM和DM?划分标准的变异。
10.根据权利要求9所述的方法,步骤(3)还包括对不符合HGMD中的DM和DM?划分标准的变异进行进一步筛选,筛选标准是:在所有人群频率数据库中,变异频率小于0.01或为NA;并且该变异通过SNP致病性过滤或InDel功能过滤。
11.根据权利要求1-10任一项所述的方法,步骤(3)还包括基于OMIM注释筛选符合孟德尔遗传方式的基因所对应的变异。
12.根据权利要求1-11任一项所述的方法,还包括步骤(4):以报告的形式输出筛选的致病性变异及其注释信息。
13.一种筛...
【专利技术属性】
技术研发人员:房柯池,侯光远,李文涵,
申请(专利权)人:广州欧蒙未一医学检验实验室有限公司,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。