【技术实现步骤摘要】
一种全外显子组测序数据的处理方法、系统及一种检测短串联重复疾病相关异常扩增的系统
[0001]本专利技术涉及医药
,尤其涉及一种全外显子测序数据的处理方法、系统及一种检测短串联重复疾病相关异常扩增的系统。
技术介绍
[0002]基因组上外显子占总序列约1
‑
2%,却包含高达85%疾病相关致病性变异。通过序列捕获或靶向技术将全基因组外显子区域DNA富集后的高通量测序方法叫全外显子组测序(WES),因其全面性、有效性和极高性价比已经成为大多数临床异质性较高疾病的分子诊断首选方案,可以同时检测SNP、Indel、CNV,若增加线粒体环的捕获,还可以同时检测线粒体环基因变异。
[0003]短串联重复(STR),通常指基因组中由1~6个碱基单元(motif)组成的一段DNA重复序列。重复数在个体间高度变异且数量众多,具有丰富的遗传多态性,据估计在人类基因组中有超过一百万STR位点,,占人类基因组的约3%。短串联重复扩增能够导致一系列疾病包括亨廷顿、各种共济失调、肌萎缩性侧索硬化症、额颞叶痴呆、脆X综合征和其他神经系统疾病。同时也有较多的研究表明串联重复多态性(TRP)在多基因疾病的基因表达调控中发挥重要的作用。串联重复相关疾病(TRDs)在表型上并不是一个简单有和无的定义(患病人群和正常人群的比较),因其特殊性根据其串联重复次数的变化通常导致一种连续的量级的变化(比如发病的年龄、疾病严重程度等)。
[0004]目前,对于这类疾病的常规分子诊断是基于精确的PCR扩增或者Southern印迹 ...
【技术保护点】
【技术特征摘要】
1.一种全外显子测序数据的处理方法,其特征在于,包括以下步骤:步骤S1、获取第一参考数据,所述第一参考数据包括参考样本的STR相关疾病基因靶标区域内碱基覆盖度数据和预定的碱基覆盖度下的样本占比数据;获取第二参考数据,所述第二参考数据包括阴性参考样本扩增次数数据;步骤S2、获取检测样本数据,所述检测样本数据包括检测样本的STR相关疾病基因靶标区域内碱基覆盖度数据、预定的碱基覆盖度下的样本占比数据和检测样本扩增次数数据;将所述检测样本的STR相关疾病基因靶标区域内碱基覆盖度数据和预定的碱基覆盖度下的样本占比数据与所述参考样本的STR相关疾病基因靶标区域内碱基覆盖度数据和预定的碱基覆盖度下的样本占比数据进行比对,获得第一比对结果数据;若所述第一比对结果数据为不符合,则将所述检测样本扩增次数数据与所述阴性参考样本扩增次数数据进行比对,获得第二比对结果数据。2.根据权利要求1所述的处理方法,其特征在于,所述步骤S1具体包括:获取STR相关疾病基因数据,确定STR相关疾病异常扩增的靶标区域数据;获取参考样本的WES测序数据,对比所述参考样本的WES测序数据与所述STR相关疾病异常扩增的靶标区域数据,获得参考样本的STR相关疾病基因靶标区域内碱基覆盖度数据和预定的碱基覆盖度下的样本占比数据;采用ExpansionHunter软件对参考样本中阴性样本的WES测序数据进行分析,获得阴性参考样本扩增次数数据。3.根据权利要求2所述的处理方法,其特征在于,所述步骤S2具体为:获取检测样本的WES测序数据,对比所述检测样本的WES测序数据与所述STR相关疾病异常扩增的靶标区域数据,获得检测样本的STR相关疾病基因靶标区域内碱基覆盖度数据和预定的碱基覆盖度下的样本占比数据;采用ExpansionHunter软件对检测样本的WES测序数据进行分析,获得检测样本扩增次数数据。4.根据权利要求1~3任意一项所述的处理方法,其特征在于,所述步骤S1还包括:对所述阴性参考样本扩增次数数据进行修正,获得修正后的阴性参考样本扩增次数数据。5.根据权利要求4所述的处理方法,其特征在于,对所述阴性参考样本扩增次数数据进行修正具体为:获取阳性样本的实际扩增次数数据和WES测序数据;采用ExpansionHunter软件对阳性样本的WES测序数据进行分析,获得阳性样本的预测扩增次数数据;根据所述阳性样本的实际扩增次数数据和预测扩充次数,对所述阴性参考样本扩增次数数据进行修正。6.根据权利要求1~3任意一项所述的处理方法,其特征在于,还包括:采用exSTRa软件对所述参考样本的WES测序数据进行分析,获得所述参考样本中阳性样本的STR计算得分;采用exSTRa软件对所述检测样本的WES测序数据进行分析,获得所述检测样本的STR计算得分。7.一种全外显子测序数据的处理系统,其特征在于,包括第一参考数据获取单元,所述
第一参考数据单元用于获取第一参考数据,所述第一参考数据包括参考样本的STR相关疾病基因靶标区域内碱基覆盖度数据和预定的碱基覆盖度下的样本占比数据;第二参考数据获取单元,所以第二参考数据获取单元用于获取第二参考数据,所述第二参考数据包括阴性参...
【专利技术属性】
技术研发人员:王佳,鲍远亮,鲍成佳,
申请(专利权)人:赛福解码北京基因科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。