一种基于二代测序的微单倍型检测分型系统和方法技术方案

技术编号:28678550 阅读:16 留言:0更新日期:2021-06-02 02:56
本发明专利技术公开了一种基于二代测序的微单倍型检测分型系统和方法,属于生物信息学技术领域。所述系统包括:数据输入模块、数据库存储模块、MHParser分型模块、MHParser样本相似度计算模块,还可包括MHParser多序列比对模块和MHParser样本聚类模块。所述方法包括:获得检测位点列表和样本二代测序比对文件;利用检测位点列表,根据样本二代测序比对文件计算微单倍型位点,得到微单倍型分型结果;计算任意两个样本之间的相似性分值。利用本发明专利技术,可以准确获得任意两个样本之间的相似度,简单可靠,进一步,还可通过多序列比对和聚类分析,对样本进行识别,排除样本混淆和污染问题,进一步提高比对的准确性,具有重要的应用价值。

【技术实现步骤摘要】
一种基于二代测序的微单倍型检测分型系统和方法
本专利技术属于生物信息
,具体地,涉及一种基于二代测序的微单倍型检测分型系统和方法。
技术介绍
单倍型(haplotype)是指在一条染色体或线粒体上,紧密连锁的多个等位基因的线性组合,每一种组合方式即为一种单倍型。近年来单倍型在法医学中的应用越来越广泛,主要涉及Y染色体、X染色体及线粒体上STR和SNP多态性的研究。微单倍型(microhaplotype)的片段长度更短,其是在200bp范围内2~5个SNP的组合。由于微单倍型基因座内含有多个SNP位点,所以微单倍型是多等位基因遗传标记,包含更加丰富的遗传信息。微单倍型是近年来国际法医遗传学界广泛关注的一类新型遗传标记,在混合DNA分型领域展现出巨大潜力,且支持人类种族地域推断、复杂亲缘关系鉴定、微量降解检材检验等法医学应用。它兼具STR和SNP遗传标记的优势:(1)高度多态性。通常SNP位点仅有2个等位基因,若n个二等位基因的SNP构成一个微单倍型位点,那么该微单倍型位点理论上最多有2n种SNP的组合,即最多有2n种基因型。(2)低突变率。微单倍型的突变率相当于SNP的突变率,为10-9~10-8/代,是STR突变率的百万分之一到十万分之一,在亲权鉴定中有独特优势。(3)检测无阴影带。基于电泳技术分型的STR会产生阴影带,不利于复杂混合DNA样本的分析。微单倍型通过测序手段检测,无阴影带,且二代测序具有高通量、高灵敏度的优点,在定量分析复杂混合DNA中有很大潜力。(4)长度优势。STR基因座的等位基因长度跨度很大,因此会产生扩增不平衡问题,而较长的等位基因在降解检材中极可能被破坏,得不到准确的分型结果,微单倍型长度相对均一,可减少因长度差异带来的扩增不平衡问题。微单倍型检测方法包括二代测序、高分辨熔解曲线、单链构象多态性分析等,其中二代测序,也称下一代测序(nextgenerationsequencing,NGS)或大规模并行测序(massivelyparallelsequencing,MPS),在科研和临床诊断领域已得到广泛应用。由于微单倍型为近几年才兴起的一种检测技术,基于二代测序数据进行微单倍型分析的方法较少,且功能比较单一,例如一些基于扩增子平台的微单倍型检测软件,只能进行微单倍型的单一计数。
技术实现思路
为了解决上述技术问题中的至少一个,本专利技术采用的技术方案如下:一种基于二代测序的微单倍型检测分型系统,包括:数据输入模块,用于接受样本二代测序比对文件输入;数据库存储模块,用于存储检测位点列表;MHParser分型模块,分别与所述数据输入模块和所述数据库存储模块连接,用于基于所述检测位点列表,根据输入的样本二代测序比对文件计算微单倍型位点,并输出微单倍型分型结果;其中,所述微单倍型分型结果包括单倍型信息及计数信息;MHParser样本相似度计算模块,与所述MHParser分型模块连接,用于接受所述MHParser分型模块输出的微单倍型分型结果,并根据微单倍型分型结果计算任意两个样本之间的相似性分值;结果输出模块,用于输出所述相似性分值。在本专利技术中,MHParser是自定义名称,对相应模块没有限定作用。在本专利技术的一些实施方案中,所述位点包括微单倍型和单独SNP/InDel位点。在本专利技术的一些实施方案中,所述检测位点列表格式下表所示:在本专利技术的一个具体实施方案中,所述检测位点列表如下:在本专利技术的一些实施方案中,所述计数信息是指支持相应位点的reads数目信息。在本专利技术的一些实施方案中,所述MHParser样本相似度计算模块还输出样本整合微单倍型序列信息;所述微单倍型检测分型系统还包括:MHParser多序列比对模块,与所述MHParser样本相似度计算模块连接,用于接受MHParser样本相似度计算模块输出的样本整合微单倍型序列信息,并根据样本整合微单倍型序列信息进行多序列比对,得到样本多序列比对结果;MHParser样本聚类模块,与所述MHParser多序列比对模块连接,用于接受MHParser多序列比对模块输出的多序列比对结果,并根据所述样本多序列比对结果进行聚类分析;所述结果输出模块还与所述MHParser样本聚类模块连接,用于样本输出聚类分析结果。在本专利技术的一些实施方案中,所述整合微单倍型序列信息是指将检测位点的序列拼接在一起得到的序列。在本专利技术的一些实施方案如此,所述数据库存储模块还用于存储测序变异检测信息。进一步地,所述MHParser分型模块输出位点的基因型。更进一步地,所述位点为SNP/InDel位点。本专利技术的第二方面提供一种基于二代测序的微单倍型检测分型方法,包括以下步骤:S1,获得检测位点列表和样本二代测序比对文件;S2,利用检测位点列表,根据样本二代测序比对文件计算样本的微单倍型位点,得到微单倍型分型结果,所述微单倍型分型结果包括单倍型信息及计数信息;S3,根据步骤S2的微单倍型分型结果计算任意两个样本之间的相似性分值。在本专利技术的一些实施方案中,步骤S3还获得样本整合微单倍型序列信息。进一步地,所述方法还包括以下步骤:S4,根据样本整合微单倍型序列信息进行多序列比对,得到多序列比对结果;S5,根据多序列比对结果进行聚类分析,得到聚类分析结果。在本专利技术的一些实施方案中,所述步骤S2中,具体利用以下步骤获得所述微单倍型分型结果:S21,针对检测位点列表中的任意微单倍型位点,遍历样本二代测序比对文件中的每条序列,根据位点的坐标信息提取reads的碱基组合,得到单倍型,并对具有相同单倍型的reads进行计数;S22,针对相同单倍型,按照reads数目对不同碱基组合进行排序;由此得到检测位点列表中所述微单倍型分型结果。在本专利技术的一些实施方案中,所述步骤S3中,具体利用以下公式获得所述相似性分值:S31,按照步骤S2的方法获得多个样本的微单倍型分型结果S32,按照下面公式计算任意两个样本间的相似性分值:其中,S为相似性分值;m为位点个数;C1为常量,取值1,为两个样本某个位点碱基型相同时的打分值;C2为常量,取值-1,为两个样本某个位点碱基型不同时的打分值;G1和G2分别为某个位点样本1和样本2的碱基组合数目,其中,样本1为该位点上碱基组合数目较少的样本,样本2为该位点上碱基组合数目较多的样本;G1∩G2表示该位点上两个样本具有相同的碱基组合的数目。在本专利技术的一些具体实施方案中,针对某个位点,如果两个样本在该位点上碱基组合数目相同,则任意一个样本为样本1,另外一个样本为样本2。针对碱基组合,例如对于某个位点,参考位点为T,G和A;但某个样本该位点有T,A和A;G,G和A;T本文档来自技高网
...

【技术保护点】
1.一种基于二代测序的微单倍型检测分型系统,其特征在于,包括:/n数据输入模块,用于接受样本二代测序比对文件输入;/n数据库存储模块,用于存储检测位点列表;/nMHParser分型模块,分别与所述数据输入模块和所述数据库存储模块连接,用于根据输入的样本二代测序比对文件计算微单倍型位点,并输出微单倍型分型结果;其中,所述微单倍型分型结果包括单倍型信息及计数信息;/nMHParser样本相似度计算模块,与所述MHParser分型模块连接,用于接受所述MHParser分型模块输出的微单倍型分型结果,并根据微单倍型分型结果计算任意两个样本之间的相似性分值;/n结果输出模块,用于输出所述相似性分值。/n

【技术特征摘要】
1.一种基于二代测序的微单倍型检测分型系统,其特征在于,包括:
数据输入模块,用于接受样本二代测序比对文件输入;
数据库存储模块,用于存储检测位点列表;
MHParser分型模块,分别与所述数据输入模块和所述数据库存储模块连接,用于根据输入的样本二代测序比对文件计算微单倍型位点,并输出微单倍型分型结果;其中,所述微单倍型分型结果包括单倍型信息及计数信息;
MHParser样本相似度计算模块,与所述MHParser分型模块连接,用于接受所述MHParser分型模块输出的微单倍型分型结果,并根据微单倍型分型结果计算任意两个样本之间的相似性分值;
结果输出模块,用于输出所述相似性分值。


2.根据权利要求1所述的微单倍型检测分型系统,其特征在于,所述MHParser样本相似度计算模块还输出样本整合微单倍型序列信息;所述微单倍型检测分型系统还包括:
MHParser多序列比对模块,与所述MHParser样本相似度计算模块连接,用于接受MHParser样本相似度计算模块输出的样本整合微单倍型序列信息,并根据样本整合微单倍型序列信息进行多序列比对,得到样本多序列比对结果;
MHParser样本聚类模块,与所述MHParser多序列比对模块连接,用于接受MHParser多序列比对模块输出的多序列比对结果,并根据所述样本多序列比对结果进行聚类分析;
所述结果输出模块还与所述MHParser样本聚类模块连接,用于样本输出聚类分析结果。


3.根据权利要求1或2所述的微单倍型检测分型系统,其特征在于,所述数据库存储模块还用于存储测序变异检测信息。


4.根据权利要求3所述的微单倍型检测分型系统,其特征在于,所述MHParser分型模块输出位点的基因型。


5.根据权利要求4所述的微单倍型检测分型系统,其特征在于,所述位点为SNP/InDel位点。


6.一种基于二代测序的微单倍型检测分型方法,其特征在于,包括以下步骤:
S1...

【专利技术属性】
技术研发人员:钱刚韩斐然戴凡刘歆陈云阎敏
申请(专利权)人:杭州联川基因诊断技术有限公司
类型:发明
国别省市:浙江;33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1