噬血细胞综合征候选致病基因与变异的筛选装置及介质制造方法及图纸

技术编号:39043195 阅读:11 留言:0更新日期:2023-10-10 11:56
本申请涉及一种噬血细胞综合征候选致病基因与变异的筛选装置及介质,属于基因测序分析技术领域,其装置包括:获取模块,用于获取受检者的基因测序变异文件;初步过滤模块,用于对基因测序变异文件中的变异位点进行初步过滤;变异注释模块,用于对初步过滤后的基因测序变异文件中的变异位点进行注释,生成变异注释文件;二次过滤模块,用于对变异注释文件中的变异位点进行二次过滤;筛选模块,用于基于本地变异库对二次过滤后的变异注释文件中的变异位点进行筛选,得到候选致病基因及变异;其中,本地变异库存储有相似HLH表型患者及无表型的家属的基因测序数据。本申请能够快速、准确地筛选出与HLH相关的有害突变。准确地筛选出与HLH相关的有害突变。准确地筛选出与HLH相关的有害突变。

【技术实现步骤摘要】
噬血细胞综合征候选致病基因与变异的筛选装置及介质


[0001]本申请涉及基因测序分析
,尤其是涉及一种噬血细胞综合征候选致病基因与变异的筛选装置及介质。

技术介绍

[0002]噬血细胞综合征(hemophagocytic syndrome,HPS),又称噬血细胞性淋巴组织细胞增生症(hemophagocytic lymphohistiocytosis,HLH),是一种罕见的、危及生命的免疫综合征。其特征是,淋巴细胞和组织细胞过度增生而导致细胞因子介导的组织损伤和多器官的功能障碍。该疾病起病急,病情进展迅速,死亡率高。
[0003]根据病因的不同,HLH可分为家族性(即原发性)和获得性(即继发性)两种形式。原发性HLH由影响细胞溶解功能、淋巴细胞存活的基因突变或炎症小体激活引起,主要发生于儿童,且发病年龄较小。继发性HLH主要是由获得性因素触发,常与感染、恶性肿瘤、风湿性疾病和自身免疫性疾病相关,儿童和成人均可见。最常见的感染相关的HLH是EBV

HLH(EB病毒相关HLH)。最常见的HLH相关的恶性肿瘤是淋巴瘤。当HLH发生在风湿性疾病的背景下,如系统性幼年特发性关节炎(sJIA)、成人发病的Still病(ASD)或系统性红斑狼疮(SLE),它通常被称为巨噬细胞激活综合征(MAS)。目前认为很多继发性HLH也存在一定的基因背景,如原发性HLH相关基因的杂合改变及多态性,并且在遭受外界触发因素(如病毒感染等)的“二次打击”后表现出HLH发病。
[0004]由于HLH进展迅速,因此快速及时的诊断非常必要。目前公认的HLH诊断标准为HLH

2004诊断标准,即将基因检测、临床表现和实验室检查结果相结合。常用的基因检测方法有一代(Sanger)测序、聚合酶链反应(PCR)及二代测序(NGS)。其中二代测序主要包括全外显子组测序(WES)、全基因组测序(WGS)及靶向测序等。全基因组测序检测范围全面,但成本相对较高,且众多的非编码区变异筛选与解读存在困难。靶向测序成本相对较低,但检测范围不够全面。而随着测序技术的不断发展,全外显子组测序不仅可检测到蛋白编码区域,也可检测到编码区边界区域的部分非编码区及深度内含子区的已知致病性突变,成本可控,覆盖已知致病基因,还有助于检出新的致病突变,因此被广泛应用。但是,每个全外显子组测序样本原始检出的变异个数均在十万以上,尤其是单人检测样本,单人样本的检测数据筛选难度较大,尤其是对于遗传方式为AD、XLD及XLR的疾病不能判断家系共分离,无论是在筛选位点的准确性还是在筛选时间上都存在比较大的挑战。
[0005]因此,如何快速、准确地筛选出与HLH相关的有害突变是亟待解决的问题。目前尚没有与HLH相关疾病的全外显子组测序数据筛选方法。

技术实现思路

[0006]为了解决上述技术问题,本申请提供一种噬血细胞综合征候选致病基因与变异的筛选装置及介质。
[0007]第一方面,本申请提供一种噬血细胞综合征候选致病基因与变异的筛选装置,采
用如下的技术方案:一种噬血细胞综合征候选致病基因与变异的筛选装置,包括:获取模块,用于获取受检者的基因测序变异文件;初步过滤模块,用于对所述基因测序变异文件中的变异位点进行初步过滤;变异注释模块,用于对初步过滤后的基因测序变异文件中的变异位点进行注释,生成变异注释文件;二次过滤模块,用于对所述变异注释文件中的变异位点进行二次过滤;筛选模块,用于基于所述本地变异库对二次过滤后的变异注释文件中的变异位点进行筛选,得到候选致病基因及变异;其中,所述本地变异库存储有相似HLH表型患者及无表型的家属的基因测序数据。
[0008]可选的,所述获取模块包括:质控子模块,用于获取所述受检者的原始测序数据,对所述原始测序数据进行质控,生成fastq格式文件;比对子模块,用于将所述fastq格式文件与参考基因组中的碱基序列进行比对,生成sam文件;转换处理子模块,用于将所述sam文件转换为bam文件,并对所述bam文件进行预设处理,其中,所述预设处理包括去重和建立索引;变异检测子模块,用于对第一处理后的bam文件进行变异检测,生成所述基因测序变异文件。
[0009]可选的,所述初步过滤模块,具体用于将满足初步过滤条件的变异位点过滤掉;其中,所述初步过滤条件包括低质量值、测序总深度小于预设深度、突变频率小于第一预设频率以及长度不小于预设长度的INDEL变异中的至少一种条件。
[0010]可选的,所述变异注释文件包括变异基本信息注释、变异在人群频率数据库中的注释、变异相关疾病的注释、变异ACMG评级注释、变异危害性预测注释、变异相关文献注释和HLH疾病相关基因集注释中的至少一种。
[0011]可选的,所述二次过滤模块包括:第一过滤子模块,用于将属于预设变异类型的变异位点确定为第一候选过滤对象,将满足第一保留条件、第二保留条件、第三保留条件、第四保留条件和第五保留条件中的任一种条件的第一候选过滤对象进行保留,并过滤掉其余的第一候选过滤对象;第二过滤子模块,用于将在公共人群频率数据库中所有数据库频率均大于第二预设频率的变异位点确定为第二候选过滤对象,将满足所述第一保留条件、所述第二保留条件和所述第三保留条件中的任一种条件的第二候选过滤对象进行保留,并过滤掉其余的第二候选过滤对象;第三过滤子模块,用于将属于Clinvar数据库中2星以上的良性或者可能良性的变异位点确定为第三候选过滤对象,将满足所述第二保留条件的第三候选过滤对象进行保留,并过滤掉其余的第三候选过滤对象;其中,所述预设变异类型包括未知突变、同义突变、基因间区突变、非编码RNA突变、内含子突变、5`UTR突变、3`UTR突变、上游突变及下游突变中的至少一种;所述第一保留条件为属于Clinvar数据库中致病性Pathogenic或可能致病性Likely Pathogenic的变异位点;
所述第二保留条件为在人类基因突变数据库HGMD中的突变标签是致病突变DM、疑似致病突变DM?以及疾病相关多态性突变DFP中的任一种的变异位点;所述第三保留条件为在所述变异ACMG评级注释中ACMG评级为致病性Pathogenic或可能致病性Likely Pathogenic的变异位点;所述第四保留条件为具有所述变异相关文献注释的变异位点;所述第五保留条件为所述变异危害性预测注释中至少一个软件预测为有害的变异位点。
[0012]可选的,所述候选致病基因及变异包括候选新发突变致病基因及变异、候选复合杂合突变致病基因及变异、候选纯合突变致病基因及变异、候选性染色体突变致病基因及变异和候选AR单杂合突变致病基因及变异中的至少一种。
[0013]可选的,所述二次过滤模块包括:判断模块,用于判断所述变异注释文件中的变异位点是否满足第六保留条件、第七保留条件和第八保留条件;第一保留模块,用于对同时满足所述第六保留条件、所述第七保留条件和所述第八保留条件的变异位点进行保留,并将未保留的变异位点作为第一候选保留对象;第二保留模块,用于对所述第一候选保本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种噬血细胞综合征候选致病基因与变异的筛选装置,其特征在于,包括:获取模块,用于获取受检者的基因测序变异文件;初步过滤模块,用于对所述基因测序变异文件中的变异位点进行初步过滤;变异注释模块,用于对初步过滤后的基因测序变异文件中的变异位点进行注释,生成变异注释文件;二次过滤模块,用于对所述变异注释文件中的变异位点进行二次过滤;筛选模块,用于基于所述本地变异库对二次过滤后的变异注释文件中的变异位点进行筛选,得到候选致病基因及变异;其中,所述本地变异库存储有相似HLH表型患者及无表型的家属的基因测序数据。2.根据权利要求1所述的方法,其特征在于,所述获取模块包括:质控子模块,用于获取所述受检者的原始测序数据,对所述原始测序数据进行质控,生成fastq格式文件;比对子模块,用于将所述fastq格式文件与参考基因组中的碱基序列进行比对,生成sam文件;转换处理子模块,用于将所述sam文件转换为bam文件,并对所述bam文件进行预设处理,其中,所述预设处理包括去重和建立索引;变异检测子模块,用于对第一处理后的bam文件进行变异检测,生成所述基因测序变异文件。3.根据权利要求1所述的方法,其特征在于,所述初步过滤模块,具体用于将满足初步过滤条件的变异位点过滤掉;其中,所述初步过滤条件包括低质量值、测序总深度小于预设深度、突变频率小于第一预设频率以及长度不小于预设长度的INDEL变异中的至少一种条件。4.根据权利要求1至3任一项所述的方法,其特征在于,所述变异注释文件包括变异基本信息注释、变异在人群频率数据库中的注释、变异相关疾病的注释、变异ACMG评级注释、变异危害性预测注释、变异相关文献注释和HLH疾病相关基因集注释中的至少一种;其中,所述变异在人群频率数据库中的注释包括所述本地变异库的注释。5.根据权利要求4所述的方法,其特征在于,所述二次过滤模块包括:第一过滤子模块,用于将属于预设变异类型的变异位点确定为第一候选过滤对象,将满足第一保留条件、第二保留条件、第三保留条件、第四保留条件和第五保留条件中的任一种条件的第一候选过滤对象进行保留,并过滤掉其余的第一候选过滤对象;第二过滤子模块,用于将在公共人群频率数据库中所有数据库频率均大于第二预设频率的变异位点确定为第二候选过滤对象,将满足所述第一保留条件、所述第二保留条件和所述第三保留条件中的任一种条件的第二候选过滤对象进行保留,并过滤掉其余的第二候选过滤对象;第三过滤子模块,用于将属于Clinvar数据库中2星以上的良性或者可能良性的变异位点确定为第三候选过滤对象,将满足所述第二保留条件的第三候选过滤对象进行保留,并过滤掉其余的第三候选过滤对象;其中,所述预设变异类型包括未知突变、同义突变、基因间区突变、非编码RNA突变、内含子突变、5`UTR突变、3`UTR突变、上游突变及下游突变中的至少一种;
所述第一保留条件为属于Clinvar数据库中致病性Pathogenic或可能致病性Likely Pathogenic的变异位点;所述第二保留条件为在人类基因突变数据库HGMD中的突变标签是致病突变DM、疑似致病突变DM?以及疾病相关多态性突变DFP中的任一种的变异位点;所述第三保留条件为在所述变异ACMG评级注释中ACMG评级为致病性Pathogenic或可能致病性Likely Pathogenic的变异位点;所述第四保留条件为具有所述变异相关文献注释的变异位点;所述第五保留条件为所述变异危害性预测注释中至少一个软件预测为有害的变异位点。6.根据权利要求4所述的方法,其特征在于,所述二次过滤模块包括:判断模块,用于判断所述变异注释文件中的变异位点是否满足第六保留条件、第七保留条件和第八保留条件;第一保留模块,用于对同时满足所述第六保留条件、所述第七保留条件和所述第八保留条件的变异位点进行保留,并将未保留的变异位点作为第一候选保留对象;第二保留模块,用于对所述第一候选保留对象中满足第二保留条件的变异位点进行保留,并将未保留的变异位点作为第二候选保留对象;第三保留模块,用于对所述第二候选保留对象中满足第九保留条件的变异位点进行保留,并将未保留的变异位点作为第三候选保...

【专利技术属性】
技术研发人员:卓频
申请(专利权)人:倍科为天津生物技术有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1