样本同源性判定模型及其建立方法和应用技术

技术编号:34691811 阅读:95 留言:0更新日期:2022-08-27 16:26
本发明专利技术涉及一种样本同源性判定模型及其建立方法和应用,属于基因检测技术领域。该方法包括以下步骤:样本收集:以同一来源的两样本为阳性样本对组成阳性样本集合,以不同来源的两样本为阴性样本对组成阴性样本集合;SNV数据收集:将测序数据比对至人类参考基因组,获得各样本单核苷酸变异位点SNV情况,任意挑选样本对,统计分型不一致位点数与共同检出位点数的比值为错配率;模型构建:以样本测序数据量、目标序列区域、SNV过滤条件和基因型差异为模型参数条件,以错配率为判定指标,根据样本共同检出位点数量的梯度范围对应匹配的错配率,构建分类模型。该模型能够用于样本测序深度较低的场景,完成样本的同源性判定,具有成本低且高效快速的优势。成本低且高效快速的优势。成本低且高效快速的优势。

【技术实现步骤摘要】
样本同源性判定模型及其建立方法和应用


[0001]本专利技术涉及基因检测
,特别是涉及一种样本同源性判定模型及其建立方法和应用。

技术介绍

[0002]近年来,随着高通量测序数据普及和各种应用研究和开发,病原宏基因组检测作为一项崭新的微生物检测方法出现在各大医院。然而,病原宏基因组整个过程步骤繁杂,包括核酸提取,去宿主,构建高通量测序文库,最后上机测序到生物信息分析等。在整个实验过程中都有相应的质控指标进行监控实验过程是否出现问题。但难免会出现人工操作失误,例如样本标签填错,混淆吸取溶液等等。且当一个患者分开送检一份或多份样本情况下,为了排除出现人工操作或其他导致检出菌谱差异大的情况下,需要确定两份或多份样本是否来自于同一个患者。
[0003]由此带来的问题在于,如何在高通量病原宏基因组超低测序深度情况下,对样本的同源性(同一个患者)进行区分。
[0004]常规技术中,在司法鉴定领域常用STR去区分不同样本,在群体遗传学研究中常用多态性高的单核苷酸位点组合用于区分不同样本,由于宏基因组测序时效性要求高和测序读长短无法满足常本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种样本同源性判定模型的建立方法,其特征在于,包括以下步骤:样本收集:以同一来源的两样本为阳性样本对,以不同来源的两样本为阴性样本对,收集若干阳性样本对组成阳性样本集合,收集若干阴性样本对组成阴性样本集合;SNV数据收集:将上述样本基于相同的测序方法进行测序得到的测序数据比对至人类参考基因组,获得各样本序列在人类基因组的比对情况,获得各样本单核苷酸变异位点SNV情况,任意挑选样本对,统计分型不一致位点数与共同检出位点数的比值,记为错配率;模型构建:以样本测序数据量、目标序列区域、SNV过滤条件和基因型差异为模型参数条件,以错配率为判定指标,并根据样本共同检出位点数量的梯度范围,对应匹配的错配率,构建分类模型,即为样本同源性判定模型。2.根据权利要求1所述的样本同源性判定模型的建立方法,其特征在于,所述目标序列区域通过以下方法确定:从数据库获取与样本来源相同人种的多态性位点集合,分别以多态性位点百分率为30%

70%的外显子位点和/或多态性位点百分率为10%

90%的基因组位点为目标序列区域。3.根据权利要求2所述的样本同源性判定模型的建立方法,其特征在于,当所述样本来源于危重病患者,所述目标序列区域还包括线粒体序列区域。4.根据权利要求1所...

【专利技术属性】
技术研发人员:许腾巫文才陈文景沈杨秦子颖李永军王小锐
申请(专利权)人:广州微远医疗器械有限公司广州微远医学检验实验室有限公司深圳微远医疗科技有限公司微远深圳医学研究中心有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1