一种Y单倍群检测方法技术

技术编号:16188411 阅读:41 留言:0更新日期:2017-09-12 11:31
本发明专利技术涉及一种Y单倍群检测方法,包括以下步骤:获取用于参照的Y单倍群树的参照Y单倍群树信息,其中,参照Y单倍群树信息包括Y单倍群树中每个参照单倍群的参照单倍群信息;将每个参照单倍群信息与测试SNP信息进行匹配,得到至少一个满足预设条件的目标参照单倍群;根据目标参照单倍群的参照单倍群坐标信息,获取与目标参照单倍群相关的第一数值与第二数值,并对每个目标参照单倍群进行评分,输出评分最高的目标参照单倍群所对应的结果信息。本发明专利技术实施例通过将参照单倍群与测试单倍群进行比对,基于从根节点出发到目标单倍群的路径的评分系统,可以同时适用二代测序结果和高通量micro array的SNP分型结果,检测适用性更高,提高检测手段的应用广泛度。

A Y haplotype detection method

The invention relates to a haplogroup Y detection method comprises the following steps: obtaining Y for haplogroup tree reference reference haplogroup Y tree information, which, according to the Y haplogroup tree information including each haplogroup Y haplogroup tree reference reference haplogroup information; each single reference group and test information times the SNP information matching, get at least one meets the preset conditions of the target reference haplogroup; according to the target reference haplogroup haplogroup according to the coordinate information, and obtain the object reference haplogroup first value associated with second values, and for each target reference haplogroup score, the highest score of the reference target output corresponding haplogroup the results of information. The embodiment of the invention will refer to haplogroup haplogroup and test for comparison, starting from the root node to the path to the target scoring system based on the haplogroup, can also apply to the two generation sequencing results and high-throughput micro array SNP typing detection results, higher applicability, improve the detection means of extensive application.

【技术实现步骤摘要】
一种Y单倍群检测方法
本专利技术涉及基因测绘技术,更具体地说,涉及一种Y单倍群检测方法。
技术介绍
人的基因组由22对常染色体和XY两条性染色体组成,其中22对常染色体在男性和女性中都有两条;而性染色体,女性有两个X染色体,男性则有一条X染色体和一条Y染色体。所以,Y染色体在人类遗传中,仅能由男性个体从其父亲遗传得到,而且该染色体不会发生同源重组的现象,因此可以用其上的SNP(单核苷酸多态性SingleNucleotidePolymorphism)标记,利用分子生物学的方法,来反演推算父系祖源,并形成一个有根的Y染色体单倍群树。这个Y染色体单倍群树,将现代人类分为18个大类型,用A到R的十八个字母作为索引。树上的父节点对应的SNP是所有子节点共有的。这个树表征了人类从最早的根结点,在迁徙繁衍过程中的不断在Y染色体上累积突变的过程。目前,有ISOGG、Yfull等机构收录并升级各个研究的Y单倍群树结构的结果,包括树上的分支结构,以及各个节点对应的单倍群名字和所包含的SNP位点。现有的Y单倍体检测算法大多是科学研究工具,如amy-tree算法,使用的方法适用于二代测序结果,在其算法中会挑选Y单倍群树中,对研究深入的单倍群会有倾向性输出,而且少量在单倍群树的叶子节点的假阳性测序结果,会很容被输出为计算结果,导致计算错误。YHap则是利用群体的低深度测序结果进行预测,不适用直接得到基因型的SNP分型数据。因此,上述检测算法存在不能同时适用二代测序结果和高通量microarray(芯片数据)的SNP分型结果,使得检测算法适用性不够高,且容易出错的问题。
技术实现思路
专利技术要解决的技术问题在于,针对现有技术的上述检测算法存在不能同时适用二代测序结果和高通量microarray的SNP分型结果,使得检测算法适用性不够高,且容易出错的的缺陷,提供一种Y单倍群检测方法。本专利技术解决其技术问题所采用的技术方案是:构造一种Y单倍群检测方法,所述方法包括以下步骤:获取用于参照的Y单倍群树的参照Y单倍群树信息,其中,所述参照Y单倍群树信息包括所述Y单倍群树中每个参照单倍群的参照单倍群信息,所述参照单倍群信息包括参照单倍群坐标信息;将所述每个参照单倍群的参照单倍群信息与每个测试SNP的测试SNP信息进行匹配,得到至少一个满足预设条件的目标参照单倍群;根据所述目标参照单倍群的参照单倍群坐标信息,获取与所述目标参照单倍群相关的第一数值与第二数值,其中,所述第一数值为从所述目标参照单倍群到与所述目标参照单倍群对应的根节点单倍群之间路径上的其他目标参照单倍群数量,所述第二数值为所述其他目标参照单倍群数量与在所述路径上总的有效单倍群数量的比值;根据所述第一数值与第二数值对每个所述目标参照单倍群进行评分,输出评分最高的目标参照单倍群所对应的结果信息。实施本专利技术的Y单倍群检测方法,具有以下有益效果:1、通过将参照单倍群与测试单倍群进行比对,利用从根节点出发到目标单倍群的路径所获得的数据对该目标单倍群的评分,同时适用二代测序结果和高通量microarray的SNP分型结果,使得检测适用性更高,提高检测手段的灵活度及应用广泛度;2、利用高通量的SNP位点分型结果,通过遍历Y单倍群树的所有可能结果,基于从根节点出发的全路径评分系统,得到准确的Y单倍群分型结果,具有使Y单倍群的检测过程更加高效、稳定的特点;3、该检测方法具有很强的容错性,可以根据实际检测的Y染色体DNA数量和质量,灵活调整参数,即使是质量较低的检测数据集也能得到较好的结果。附图说明下面将结合附图及实施例对本专利技术作进一步说明,附图中:图1是本专利技术实施例一种Y单倍群检测方法的实现流程示意图;图2是本专利技术实施例中删除不相关叶子节点单倍群的实现流程示意图;图3是本专利技术实施例中测试SNP信息与叶子节点单倍群中参照SNP信息的匹配实现流程示意图;图4是本专利技术实施例中获得目标参照单倍群的实现流程示意图;图5是本专利技术实施例中参照单倍群的参照SNP信息与测试SNP信息匹配的实现流程示意图;图6是本专利技术实施例中对目标参照单倍群进行标记的实现流程示意图;图7是本专利技术实施例中一种输出评分最高的目标参照单倍群所对应的结果信息的实现流程示意图。具体实施方式为了使本专利技术的目的、技术方案及优点更加清楚明白,以下结合附图及实施例,对本专利技术进行进一步详细说明。应当理解,此处所描述的具体实施例仅仅用以解释本专利技术,并不用于限定本专利技术。人的基因组由22对常染色体和XY两条性染色体组成,其中22对常染色体在男性和女性中都有两条;而性染色体,女性有两个X染色体,男性则有一条X染色体和一条Y染色体。所以,Y染色体在人类遗传中,仅能由男性个体从其父亲遗传得到,而且该染色体不会发生同源重组的现象,因此可以用其上的SNP标记,利用分子生物学的方法,来反演推算父系祖源,并形成一个有根的Y染色体单倍群树。这个Y染色体单倍群树,将现代人类分为18个大类型,用A到R的十八个字母作为索引。树上的父节点对应的SNP是所有子节点共有的。这个树表征了人类从最早的根结点,在迁徙繁衍过程中的不断在Y染色体上累积突变的过程。SNP是单核苷酸多态性(SingleNucleotidePolymorphism)的简写,是指基因组上单个核苷酸变异,即A、T、C、G四种碱基的互相改变,形成基因组上同一位置会有多种碱基存在的多态性。SNP在人群中广泛存在,多态性丰富,是很好的遗传标记物。尤其高通量的SNP检测方法出现之后,被广泛用于生物信息学的分析。本专利技术是基于Y染色体上的单核苷酸多态性(SNP)建立的应用。本专利技术实施例适用于运行在python环境上,并且,python可以运行于debian系统,也可将其移植并运行于linux和windows系统,当然除了上述环境或平台,也可采用其他的环境或平台,本专利技术实施例对此不作限定。图1示出了本专利技术实施例中一种Y单倍群检测方法的流程,为了便于说明,仅示出了与本专利技术实施例相关的部分。如图1所示,在本专利技术的实施例中,包括以下步骤S:步骤S100,获取用于参照的Y单倍群树的参照Y单倍群树信息,其中,参照Y单倍群树信息包括Y单倍群树中每个参照单倍群的参照单倍群信息,参照单倍群信息包括参照单倍群坐标信息;步骤S200,将每个参照单倍群的参照单倍群信息与测试Y单倍群树中每个测试单倍群的测试单倍群信息进行匹配,得到至少一个满足预设条件的目标参照单倍群;步骤S300,根据目标参照单倍群的参照单倍群坐标信息,获取与目标参照单倍群相关的第一数值与第二数值,其中,第一数值为从目标参照单倍群到与目标参照单倍群对应的根节点单倍群之间路径上的其他目标参照单倍群数量,第二数值为其他目标参照单倍群数量与在路径上总的有效单倍群数量的比值;步骤S400,根据第一数值与第二数值对每个目标参照单倍群进行评分,输出评分最高的目标参照单倍群所对应的结果信息。本专利技术实施例中,通过将参照单倍群与测试单倍群进行比对,利用从根节点出发到目标单倍群的路径所获得的数据对该目标单倍群的评分,可同时适用二代测序结果和高通量microarray的SNP分型结果,使得检测适用性更好,提高检测手段的灵活度及应用广泛度;且具有使Y单倍群的检测过程更加高效、稳定的有益效果。在本专利技术实施例中,用本文档来自技高网...
一种Y单倍群检测方法

【技术保护点】
一种Y单倍群检测方法,其特征在于,包括以下步骤:获取用于参照的Y单倍群树的参照Y单倍群树信息,其中,所述参照Y单倍群树信息包括所述Y单倍群树中每个参照单倍群的参照单倍群信息,所述参照单倍群信息包括参照单倍群坐标信息;将所述每个参照单倍群的参照单倍群信息与每个测试SNP的测试SNP信息进行匹配,得到至少一个满足预设条件的目标参照单倍群;根据所述目标参照单倍群的参照单倍群坐标信息,获取与所述目标参照单倍群相关的第一数值与第二数值,其中,所述第一数值为从所述目标参照单倍群到与所述目标参照单倍群对应的根节点单倍群之间路径上的其他目标参照单倍群数量,所述第二数值为所述其他目标参照单倍群数量与在所述路径上总的有效单倍群数量的比值;根据所述第一数值与第二数值对每个所述目标参照单倍群进行评分,输出评分最高的目标参照单倍群所对应的结果信息。

【技术特征摘要】
1.一种Y单倍群检测方法,其特征在于,包括以下步骤:获取用于参照的Y单倍群树的参照Y单倍群树信息,其中,所述参照Y单倍群树信息包括所述Y单倍群树中每个参照单倍群的参照单倍群信息,所述参照单倍群信息包括参照单倍群坐标信息;将所述每个参照单倍群的参照单倍群信息与每个测试SNP的测试SNP信息进行匹配,得到至少一个满足预设条件的目标参照单倍群;根据所述目标参照单倍群的参照单倍群坐标信息,获取与所述目标参照单倍群相关的第一数值与第二数值,其中,所述第一数值为从所述目标参照单倍群到与所述目标参照单倍群对应的根节点单倍群之间路径上的其他目标参照单倍群数量,所述第二数值为所述其他目标参照单倍群数量与在所述路径上总的有效单倍群数量的比值;根据所述第一数值与第二数值对每个所述目标参照单倍群进行评分,输出评分最高的目标参照单倍群所对应的结果信息。2.如权利要求1所述的Y单倍群检测方法,其特征在于,在所述将所述每个参照单倍群的单倍群参照信息与每个测试SNP的测试SNP信息进行匹配,得到至少一个满足预设条件的目标参照单倍群之前,还包括:根据所述参照Y单倍群树信息,获取在所述参照Y单倍群树信息中的叶子节点单倍群的参照单倍群信息;获取所述测试SNP信息,将所述测试SNP信息与所述叶子节点单倍群的参照单倍群信息中的参照SNP信息进行坐标匹配;根据匹配结果,删除坐标不匹配的参照SNP信息对应的所述叶子节点单倍群的参照单倍群信息,直至每一所述叶子节点单倍群的参照SNP信息均有所述测试SNP信息与之匹配。3.如权利要求2所述的Y单倍群检测方法,其特征在于,所述获取所述测试SNP信息,将所述测试SNP信息与所述叶子节点单倍群的参照单倍群信息中的参照SNP信息进行匹配,包括:获取所述测试SNP信息,以及所述叶子节点单倍群的参照单倍群信息的参照SNP信息;将所述测试SNP信息中的测试SNP位点信息与所述参照SNP信息中的参照SNP位点信息进行匹配。4.如权利要求1所述的Y单倍群检测方法,其特征在于,所述将所述每个参照单倍群的参照单倍群信息与每个测试SNP的测试SNP信息进行匹配,得到至少一个满足预设条件的目标参照单倍群,包括:遍历所述参照Y单倍群树信息;若所述参照Y单倍群树信息中有参照单倍群的参照SNP信息与所述测试SNP信息匹配,则将所述参照SNP信息对应的参照SNP定义为目标SNP;若有所述参照单倍群满足至少包含...

【专利技术属性】
技术研发人员:姚笑天王传超唐森威陈钢郑强
申请(专利权)人:深圳市早知道科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1