一种用于PGT-M检测的基因分型评估模型的构建方法及装置制造方法及图纸

技术编号:25839895 阅读:36 留言:0更新日期:2020-10-02 14:19
本申请涉及一种用于PGT‑M检测的基因分型评估模型的构建方法及装置。所述方法通过获取PGT‑M的历史测序数据,对历史测序数据进行预处理,得到预处理后的测序数据以及对应的SNP分型结果,根据预处理后的测序数据以及对应的SNP分型结果,生成模拟测序数据以及对应的模拟SNP分型结果,根据模拟SNP分型结果建立基因分型评估模型,根据该模型得到对该待评估基因的预测分型成功率的分型评估结果,相较于传统技术中通过预实验的方法评估致病基因的分型成功率,不仅操作简单,而且极大的节省了研究人员的实验时间,还降低了成本。

【技术实现步骤摘要】
一种用于PGT-M检测的基因分型评估模型的构建方法及装置
本申请涉及分子生物学与生物信息学
,特别是涉及一种用于PGT-M检测的基因分型评估模型的构建方法及装置。
技术介绍
基因测序技术的快速发展,极大地推动了生物医学、生命科学等领域的发展。PGT-M(PreimplantationGeneticTestingforMonogenic,胚胎植入前单基因遗传学检测)是PGT的一个重要应用,主要适用于单基因疾病的高风险人群,以降低后代健康风险。PGT-M目前主要通过基因上下游特定区域紧密连锁的SNP(SingleNucleotidePolymorphism,单核苷酸多态性)位点判断胚胎致病基因的携带情况,从而筛选出基因型正常的胚胎优先移植。但是,PGT-M致病基因检测分型的成功率与其所处的染色体位置有关,还需要通过一定区域范围内的SNP位点提供遗传信息才能够进行遗传连锁分型,从而判断致病基因的携带情况。目前评估致病基因检测分型成功率的方法主要是通过PGT-M预实验判断测序结果是否能够成功分型。即通过公共数据库查询该致病基因上下游区域的SNP位点,只有人群频率满足一定要求的SNP位点才可以用来设计预实验。且在预实验的测序结果中,致病突变区域的上下游特定范围内至少具有2个SNP位点才能提供遗传信息进行连锁分型。预实验成功,则表明可以通过PGT-M技术检测和阻断该致病基因的遗传。综上所述,通过预实验的方法评估致病基因检测分型的成功率,不仅操作麻烦而且费时费力。
技术实现思路
基于此,有必要针对上述现有技术中评估致病基因检测分型的成功率操作麻烦且费时费力的问题,提供一种能够方便快捷的用于PGT-M检测的基因分型评估模型的构建方法及装置、基因分型评估方法、装置、计算机设备和存储介质。一种基因分型评估模型的构建方法,包括:获取PGT-M的历史测序数据;对历史测序数据进行预处理,得到预处理后的测序数据以及对应的SNP分型结果;根据预处理后的测序数据以及对应的SNP分型结果,生成模拟测序数据以及对应的模拟SNP分型结果;根据模拟SNP分型结果建立基因分型评估模型。在其中一个实施例中,对历史测序数据进行预处理,得到预处理后的测序数据以及对应的SNP分型结果,包括:根据设定的质控指标对历史测序数据进行第一过滤处理,得到第一过滤处理后的测序数据;将第一过滤处理后的测序数据比对到人类基因组,根据设定的比对条件对比对后的测序数据进行第二过滤处理,得到预处理后的测序数据;获取预处理后的测序数据的比对结果,根据比对结果进行遗传连锁分型,得到对应的SNP分型结果。在其中一个实施例中,根据比对结果进行遗传连锁分型,包括:查找比对结果中所有的SNP位点,对深度小于设定值的SNP位点进行第三过滤处理;根据参考数据对第三过滤处理后的比对结果中的SNP位点进行遗传连锁分型,其中,参考数据为测序数据的样本对应的家系测序数据。在其中一个实施例中,根据预处理后的测序数据以及对应的SNP分型结果,生成模拟测序数据以及对应的模拟SNP分型结果,包括:获取与预处理后的测序数据的样本对应的家系测序数据,根据家系测序数据生成模拟测序数据;对模拟测序数据进行遗传连锁分型,得到对应的模拟SNP分型结果。在其中一个实施例中,根据家系测序数据生成模拟测序数据,包括:根据家系测序数据建立数据生成模型,其中,数据生成模型包括连锁不平衡子模型、基因重组子模型和单倍群子模型;通过连锁不平衡子模型、基因重组子模型和单倍群子模型生成对应的模拟测序数据。在其中一个实施例中,根据家系测序数据建立数据生成模型之后,还包括:根据家系测序数据对连锁不平衡子模型、基因重组子模型和单倍群子模型进行校正。在其中一个实施例中,根据模拟SNP分型结果建立基因分型评估模型,包括:根据模拟SNP分型结果获取每一种致病基因的分型成功率;根据每一种致病基因的分型成功率,建立基因分型评估模型。在其中一个实施例中,根据模拟SNP分型结果获取每一种致病基因的分型成功率,包括:根据模拟SNP分型结果确定每一种致病基因的总个数以及能够进行分型的个数,其中,能够进行分型是指致病基因在上游设定区域内和下游设定区域内的SNP位点数量均满足分型条件的阈值;将能够进行分型的个数与对应致病基因的总个数的百分比作为所述致病基因的分型成功率。在其中一个实施例中,建立基因分型评估模型之后,所述方法还包括:根据预处理后的测序数据以及对应的SNP分型结果,获取每一种致病基因的参考分型成功率;根据每一种致病基因的参考分型成功率与对应的分型成功率之间的显著性差异,对基因分型评估模型进行优化训练,直到显著性差异大于0.05时停止训练。一种基因分型评估方法,包括:获取待评估基因;利用上述方法构建的基因分型评估模型对待评估基因进行检测,得到待评估基因的分型评估结果,其中,分型评估结果中包括对待评估基因的预测分型成功率。一种基因分型评估装置,所述装置包括:待评估基因获取模块,用于获取待评估基因;基因分型评估模块,用于将待评估基因输入基因分型评估模型中,得到待评估基因的分型评估结果,其中,分型评估结果中包括对待评估基因的预测分型成功率;基因分型评估模型是通过对PGT-M的历史测序数据进行分析后建立的。一种基因分型评估模型的构建装置,包括:历史测序数据获取模块,用于获取PGT-M的历史测序数据;预处理模块,用于对所述历史测序数据进行预处理,得到预处理后的测序数据以及对应的SNP分型结果;模拟测序数据生成模块,用于根据预处理后的测序数据以及对应的SNP分型结果,生成模拟测序数据以及对应的模拟SNP分型结果;模型建立模块,用于根据模拟SNP分型结果建立所述基因分型评估模型。一种计算机设备,包括存储器和处理器,所述存储器存储有计算机程序,所述处理器执行所述计算机程序时实现如上所述方法的步骤。一种计算机可读存储介质,其上存储有计算机程序,所述计算机程序被处理器执行时实现如上所述方法的步骤。上述用于PGT-M检测的基因分型评估模型的构建方法,通过获取PGT-M的历史测序数据,对历史测序数据进行预处理,得到预处理后的测序数据以及对应的SNP分型结果,根据预处理后的测序数据以及对应的SNP分型结果,生成模拟测序数据以及对应的模拟SNP分型结果,根据模拟SNP分型结果建立基因分型评估模型,根据该模型得到对该待评估基因的预测分型成功率的分型评估结果,相较于传统技术中通过预实验的方法评估致病基因的分型成功率,不仅操作简单,而且极大的节省了研究人员的实验时间,还降低了成本。附图说明图1为一个实施例中基因分型评估方法的流程示意图;图2为一个实施例中建立基因分型评估模型的步骤的流程示意图;图3为一个实施例中对历史测序数据进行预处理的步骤的流程示意图;图4为一个实施例中生成模拟数据的步骤的流程示意图;图5为一个实施例中根据本文档来自技高网...

【技术保护点】
1.一种基因分型评估模型的构建方法,其特征在于,包括:/n获取PGT-M的历史测序数据;/n对所述历史测序数据进行预处理,得到预处理后的测序数据以及对应的SNP分型结果;/n根据预处理后的测序数据以及对应的SNP分型结果,生成模拟测序数据以及对应的模拟SNP分型结果;/n根据模拟SNP分型结果建立所述基因分型评估模型。/n

【技术特征摘要】
1.一种基因分型评估模型的构建方法,其特征在于,包括:
获取PGT-M的历史测序数据;
对所述历史测序数据进行预处理,得到预处理后的测序数据以及对应的SNP分型结果;
根据预处理后的测序数据以及对应的SNP分型结果,生成模拟测序数据以及对应的模拟SNP分型结果;
根据模拟SNP分型结果建立所述基因分型评估模型。


2.根据权利要求1所述的方法,其特征在于,所述对所述历史测序数据进行预处理,得到预处理后的测序数据以及对应的SNP分型结果,包括:
根据设定的质控指标对所述历史测序数据进行第一过滤处理,得到第一过滤处理后的测序数据;
将第一过滤处理后的测序数据比对到人类基因组,根据设定的比对条件对比对后的测序数据进行第二过滤处理,得到预处理后的测序数据;
获取预处理后的测序数据的比对结果,根据所述比对结果进行遗传连锁分型,得到对应的SNP分型结果。


3.根据权利要求2所述的方法,其特征在于,所述根据所述比对结果进行遗传连锁分型,包括:
查找所述比对结果中所有的SNP位点,对深度小于设定值的SNP位点进行第三过滤处理;
根据参考数据对第三过滤处理后的比对结果中的SNP位点进行遗传连锁分型,所述参考数据为所述测序数据的样本对应的家系测序数据。


4.根据权利要求1所述的方法,其特征在于,所述根据预处理后的测序数据以及对应的SNP分型结果,生成模拟测序数据以及对应的模拟SNP分型结果,包括:
获取与预处理后的测序数据的样本对应的家系测序数据,根据所述家系测序数据生成模拟测序数据;
对所述模拟测序数据进行遗传连锁分型,得到对应的模拟SNP分型结果。


5.根据权利要求1所述的方法,其特征在于,所述根据模拟SNP分型结果建立所述基因分型评估模型,包括:
根据模拟SNP分型结果获取每一种致病基因的分型...

【专利技术属性】
技术研发人员:赵学超张军孔令印郁培基季志晨梁波
申请(专利权)人:苏州贝康医疗器械有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1