System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术涉及生物,特别涉及一种生物样本鉴定方法、装置、设备及介质。
技术介绍
1、无论是产前诊断还是对流产原因的确定,基因检测都是一种高准确性、操作方便的手段,而全外显子测序可诊断无法解释的假定遗传性疾病(如出生缺陷),并且实验室和临床医生已经开始提供wes(whole exome sequencing,全外显子测序)作为评估胎儿畸形的临床护理。但在样本收集的过程中,常见的介入性产前诊断技术包括膜腔穿刺、绒毛穿刺、经皮脐血穿刺等。由于这些穿刺过程不可避免的经过母体,存在母源细胞污染(maternal cell contamination,mcc)的风险,再加上后续染色体检查和基因诊断存在基因扩增,这使得微量的母体组织污染都可能严重干扰诊断结果,造成严重的临床后果,另外流产物样本也有可能由于存在取样部位等问题引入母源组织的污染,在对流产原因进行基因检测的过程中,若流产样本为母源三倍体,那很容易与母源污染进行混淆,而导致对结果的误判,因此在检测过程中对于母源污染与三倍体的区分也尤为重要。
2、目前常用的鉴定母源污染的方法为str(short tandem repeat,短串联重复序列)方法,通常在dna(deoxyribonucleic acid,脱氧核糖核酸)建库测序前进行鉴定,无母源污染的样本或污染比例较低的样本进行后续的高通量测序,但在产前诊断要求时间紧张的情况下,str的鉴定方式会延长检测周期。
3、综上,如何确定生物样本母源污染比例,同时准确判断生物样本是否为母源污染或者为三倍体,缩短检测周期是本
技术实现思路
1、有鉴于此,本专利技术的目的在于提供一种生物样本鉴定方法、装置、设备及介质,能够确定生物样本母源污染比例,同时准确判断生物样本是否为母源污染或者为三倍体,缩短检测周期。其具体方案如下:
2、第一方面,本申请公开了一种生物样本鉴定方法,包括:
3、分别对待测组织样本和父母血液样本进行全外显子捕获测序处理,以分别得到原始待测样本测序数据以及原始父母血液测序数据;
4、分别对所述原始待测样本测序数据以及所述原始父母血液测序数据进行筛选处理、与参考基因组比对处理,以分别得到待测样本比对文件和父母血液比对文件;
5、对所述待测样本比对文件和所述父母血液比对文件进行变异检测处理和变异点筛选处理,并获取待测样本突变位点、父亲样本突变位点以及母亲样本突变位点,并基于所述待测样本突变位点、所述父亲样本突变位点以及所述母亲样本突变位点确定变异等位基因频率;
6、利用所述变异等位基因频率进行聚类分析并确定所述待测组织样本的污染比例。
7、可选的,所述分别对待测组织样本和父母血液样本进行全外显子捕获测序处理之前,还包括:
8、获取待测生物的待测组织样本以及所述待测生物的父母血液样本。
9、可选的,所述分别对待测组织样本和父母血液样本进行全外显子捕获测序处理,以分别得到原始待测样本测序数据以及原始父母血液测序数据,包括:
10、分别对待测组织样本和父母血液样本进行脱氧核糖核酸提取,以获取待测组织样本基因组和父母血液样本基因组;
11、利用酶切方式和/或超声方式对所述待测组织样本基因组和所述父母血液样本基因组进行打断处理,并对打断处理后的待测组织样本基因组以及打断处理后的父母血液样本基因组进行全外显子捕获测序处理,以分别得到原始待测样本测序数据以及原始父母血液测序数据。
12、可选的,所述分别对所述原始待测样本测序数据以及所述原始父母血液测序数据进行筛选处理、与参考基因组比对处理,以分别得到待测样本比对文件和父母血液比对文件,包括:
13、分别对所述原始待测样本测序数据以及所述原始父母血液测序数据进行测序接头和读取错误碱基的丢弃处理,并对丢弃处理后的原始待测样本测序数据和丢弃处理后的原始父母血液测序数据进行质量评估,以筛选出满足预设质控条件的目标待测样本测序数据和目标父母血液测序数据;
14、将所述目标待测样本测序数据和所述目标父母血液测序数据映射到参考基因组,以获取包含所述目标待测样本测序数据在所述参考基因组上的映射位置信息的待测样本比对文件和包含所述目标父母血液测序数据在所述参考基因组上的映射位置信息的父母血液比对文件。
15、可选的,所述对所述待测样本比对文件和所述父母血液比对文件进行变异检测处理,包括:
16、对所述待测样本比对文件和所述父母血液比对文件进行点突变检测,以得到待测样本变异数据文件和家系突变数据文件。
17、可选的,所述获取待测样本突变位点、父亲样本突变位点以及母亲样本突变位点,并基于所述待测样本突变位点、所述父亲样本突变位点以及所述母亲样本突变位点确定变异等位基因频率,包括:
18、从所述家系突变数据文件中确定杂合型的母亲样本突变位点以及野生型的父亲样本突变位点;
19、从所述待测样本变异数据文件中确定出与所述杂合型的母亲样本突变位点以及所述野生型的父亲样本突变位点对应的待测样本突变位点;
20、从所述母亲样本突变位点、所述父亲样本突变位点以及所述待测样本突变位点筛选出满足预设位点深度条件的目标母亲样本突变位点、目标父亲样本突变位点以及目标待测样本突变位点;
21、计算所述目标母亲样本突变位点、所述目标父亲样本突变位点以及所述目标待测样本突变位点的变异等位基因频率。
22、可选的,所述利用所述变异等位基因频率进行聚类分析并确定所述待测组织样本的污染比例,包括:
23、利用无监督聚类算法并基于目标待测样本突变位点及对应的变异等位基因频率对待测组织样本的倍型进行判断;
24、分别按照不同样本倍型对应的污染比例判定规则,获取与所述待测组织样本相应的污染比例。
25、第二方面,本申请公开了一种生物样本鉴定装置,包括:
26、数据处理模块,用于分别对待测组织样本和父母血液样本进行全外显子捕获测序处理,以分别得到原始待测样本测序数据以及原始父母血液测序数据;
27、比对文件获取模块,用于分别对所述原始待测样本测序数据以及所述原始父母血液测序数据进行筛选处理、与参考基因组比对处理,以分别得到待测样本比对文件和父母血液比对文件;
28、频率确定模块,用于对所述待测样本比对文件和所述父母血液比对文件进行变异检测处理和变异点筛选处理,并获取待测样本突变位点、父亲样本突变位点以及母亲样本突变位点,并基于所述待测样本突变位点、所述父亲样本突变位点以及所述母亲样本突变位点确定变异等位基因频率;
29、比例确定模块,用于利用所述变异等位基因频率进行聚类分析并确定所述待测组织样本的污染比例。
30、第三方面,本申请公开了一种电子设备,包括:
31、存储器,用于保存计算机程序;
32、处理器,用于执行所述计算机程序,以实现本文档来自技高网...
【技术保护点】
1.一种生物样本鉴定方法,其特征在于,包括:
2.根据权利要求1所述的生物样本鉴定方法,其特征在于,所述分别对待测组织样本和父母血液样本进行全外显子捕获测序处理之前,还包括:
3.根据权利要求1所述的生物样本鉴定方法,其特征在于,所述分别对待测组织样本和父母血液样本进行全外显子捕获测序处理,以分别得到原始待测样本测序数据以及原始父母血液测序数据,包括:
4.根据权利要求1所述的生物样本鉴定方法,其特征在于,所述分别对所述原始待测样本测序数据以及所述原始父母血液测序数据进行筛选处理、与参考基因组比对处理,以分别得到待测样本比对文件和父母血液比对文件,包括:
5.根据权利要求1所述的生物样本鉴定方法,其特征在于,所述对所述待测样本比对文件和所述父母血液比对文件进行变异检测处理,包括:
6.根据权利要求5所述的生物样本鉴定方法,其特征在于,所述获取待测样本突变位点、父亲样本突变位点以及母亲样本突变位点,并基于所述待测样本突变位点、所述父亲样本突变位点以及所述母亲样本突变位点确定变异等位基因频率,包括:
7.根据权利
8.一种生物样本鉴定装置,其特征在于,包括:
9.一种电子设备,其特征在于,包括:
10.一种计算机可读存储介质,其特征在于,用于存储计算机程序;其中,所述计算机程序被处理器执行时实现如权利要求1至7任一项所述的生物样本鉴定方法的步骤。
...【技术特征摘要】
1.一种生物样本鉴定方法,其特征在于,包括:
2.根据权利要求1所述的生物样本鉴定方法,其特征在于,所述分别对待测组织样本和父母血液样本进行全外显子捕获测序处理之前,还包括:
3.根据权利要求1所述的生物样本鉴定方法,其特征在于,所述分别对待测组织样本和父母血液样本进行全外显子捕获测序处理,以分别得到原始待测样本测序数据以及原始父母血液测序数据,包括:
4.根据权利要求1所述的生物样本鉴定方法,其特征在于,所述分别对所述原始待测样本测序数据以及所述原始父母血液测序数据进行筛选处理、与参考基因组比对处理,以分别得到待测样本比对文件和父母血液比对文件,包括:
5.根据权利要求1所述的生物样本鉴定方法,其特征在于,所述对所述待测样本比对文件和所述父母...
【专利技术属性】
技术研发人员:文曙,李珉,栗海波,鞠向阳,姜玥,
申请(专利权)人:苏州赛美科基因科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。