【技术实现步骤摘要】
【国外来华专利技术】确定SNP位点集合的方法、装置及其应用优先权信息无
本专利技术涉及生物
,具体而言,涉及纯种鉴定
,更具体地,涉及确定SNP位点集合的方法、装置及其应用。
技术介绍
随着人类对动物的驯化以及特异性的人工选择,使得在一个物种之中演化出数百种形状不同的子类。例如宠物狗,目前科学研究论证狗源于灰狼,但随着人类的培养,已形成了两百多个被犬业俱乐部认证的品种。由于纯种宠物狗、猫等的价格显著高于非纯种的,故针对物种进行纯种鉴定具有现实的经济意义。然而,目前的对物种(例如狗、猫等)进行纯种鉴定的技术仍有待改进。
技术实现思路
本专利技术旨在至少解决现有技术中存在的技术问题之一。为此,本专利技术的一个目的在于提出一种成本低、检测周期短、准确度高的纯种鉴定技术。需要说明的是,本专利技术是基于专利技术人的下列工作和发现而完成的:目前检测宠物狗(或猫)是否为纯种,主要有两种方法:一、依据其性状,包括身高,体长,毛色,肩宽等指标来判定,使用性状来判定纯种狗的方法,需要由受过训练的专业人员执行,具有较大的主观色彩,成本高;二、通过DNA上的短串联重复来确定两只宠物狗(或猫)的直系亲缘关系,当已确认待检测狗为两只已认证的纯种狗的后代后,确定该待检测狗为纯种狗,然而,这种使用直系亲属来确定待检测狗是否为纯种的方法,需要检测待检测狗的父母的DNA,采样成本高,且在待检测狗父母的品种不确定时无法使用。而专利技术人发现,不同品种间之间由于人为的生殖隔离与繁育时的瓶颈效应,造成了每个品种都具 ...
【技术保护点】
一种确定SNP位点集合的方法,其特征在于,所述SNP位点集合用于预定物种的预定品种的纯种鉴定,所述方法包括:/n(1)构建第一SNP位点集合和第二SNP位点集合,所述第一SNP位点集合中的每一个SNP位点均来源于所述预定物种的生物体,所述第二SNP位点集合中的每一个SNP位点均来源于所述预定品种的生物体;/n(2)针对所述第一SNP位点集合中的每一个SNP位点,分别确定预定碱基类型在所述预定物种中的物种出现频率;/n(3)针对所述第二SNP位点集合中的每一个SNP位点,分别确定预定碱基类型在所述预定品种中的品种出现频率;/n(4)基于所述品种出现频率与所述物种出现频率的差异,确定用于所述预定品种的纯种鉴定的SNP位点集合。/n
【技术特征摘要】
【国外来华专利技术】一种确定SNP位点集合的方法,其特征在于,所述SNP位点集合用于预定物种的预定品种的纯种鉴定,所述方法包括:
(1)构建第一SNP位点集合和第二SNP位点集合,所述第一SNP位点集合中的每一个SNP位点均来源于所述预定物种的生物体,所述第二SNP位点集合中的每一个SNP位点均来源于所述预定品种的生物体;
(2)针对所述第一SNP位点集合中的每一个SNP位点,分别确定预定碱基类型在所述预定物种中的物种出现频率;
(3)针对所述第二SNP位点集合中的每一个SNP位点,分别确定预定碱基类型在所述预定品种中的品种出现频率;
(4)基于所述品种出现频率与所述物种出现频率的差异,确定用于所述预定品种的纯种鉴定的SNP位点集合。
根据权利要求1所述的方法,其特征在于,在步骤(2)中,所述物种出现频率是通过下述公式确定的:
(特定SNP的预定碱基类型出现次数)/(构成所述第一SNP位点集合的生物体数目)×2。
根据权利要求1所述的方法,其特征在于,在步骤(3)中,所述品种出现频率是通过下述公式确定的:
(特定SNP的预定碱基类型出现次数)/(构成所述第二SNP位点集合的生物体数目)×2。
根据权利要求2或3所述的方法,其特征在于,在步骤(2)和(3)的至少之一中,基于以下原则确定特定SNP的预定碱基类型出现次数:
针对纯合型预定碱基类型,将所述预定碱基类型的出现次数记为2次;
针对杂合型预定碱基类型,将所述预定碱基类型的出现次数记为1次。
根据权利要求1所述的方法,其特征在于,所述预定碱基类型为野生型碱基。
根据权利要求1所述的方法,其特征在于,在步骤(4)中,基于所述品种出现频率与所述物种出现频率的差值绝对值,确定用于所述预定品种的纯种鉴定的SNP位点集合。
根据权利要求6所述的方法,其特征在于,选择所述品种出现频率与所述物种出现频率的差值绝对值最大的20个SNP位点,作为用于预定品种的纯种鉴定的SNP位点集合。
根据权利要求1所述的方法,其特征在于,进一步包括:
(5)对所述用于预定品种的纯种鉴定的SNP位点集合进行过滤,所述过滤是基于对所述SNP位点进行PCR引物设计实现的。
根据权利要求1所述的方法,其特征在于,进一步包括:
(a)构建第三SNP位点集合,所述第三SNP位点集合中的每一个SNP位点均来源于所述预定品种的至少一种近亲品种的生物体;
(b)针对所述第三SNP位点集合中的每一个SNP位点,确定预定碱基类型在所述预定品种的所述近亲品种中的近亲品种出现频率;
(c)基于所述品种出现频率与所述近亲品种出现频率的差异,确定补充SNP位点集合,并将所述补充SNP位点集合并入至所述用于预定物种的纯种鉴定的SNP位点集合。
根据权利要求9所述的方法,其特征在于,在步骤(b)中,所述近亲品种出现频率是通过下述公式确定的:
(特定SNP的预定碱基类型出现次数)/(构成所述第三SNP位点集合的生物体数目)×2。
根据权利要求9所述的方法,其特征在于,在步骤(c)中,基于所述品种出现频率与所述近亲品种出现频率的差值绝对值,确定所述补充SNP位点集合。
根据权利要求11所述的方法,其特征在于,针对每种所述近亲品种,选择所述品种出现频率与所述近亲品种出现频率的差值绝对值最大的5个SNP位点,构建所述补充SNP位点集合。
根据权利要求9所述的方法,其特征在于,在步骤(a)中,采用与所述预定品种最接近的两种近亲品种。
根据权利要求1所述的方法,其特征在于,所述预定物种为狗或猫。
一种SNP位点集合,其是通过权利要求1~14任一项所述的方法确定的。
一种SNP位点集合,其特征在于,由下表所示的30个SNP位点构成:
一种针对预定物种的预定品种进行纯种鉴定的方法,其特征在于,包括:
(I)针对所述预定品种选择用于进行纯种鉴定的SNP位点集合,所述用于进行纯种鉴定的SNP位点集合是基于权利要求1~14任一项所述的方法确定的,或者是如权利要求15或16所述的SNP位点集合;
(II)基于所述用于进行纯种鉴定的SNP位点集合,构建候选SNP位点集合,所述候选SNP位点集合是所述用于进行纯种鉴定的SNP位点集合的子集;
(III)针对所述候选SNP位点集合的每一个SNP位点,确定待鉴定生物体的SNP碱基类型,并按照下列公式确定所述待鉴定生物体的差异度D:
a是所述候选SNP位点集合中SNP位点的数目,
maf是基于多个预定品种的纯种生物体确定的所述候选SNP位点集合中每一个SNP位点的特定碱基类型的出现频率,所述特定碱基类型为每一个SNP位点的出现频率较高的碱基类型,
针对所述候选SNP位点集合中每一个SNP位点,Min(Test)是基于下列原则确定的:
当所述待鉴定生物体的SNP碱基类型是纯合的所述特定碱基类型,则Min(Test)为1,
当所述待鉴定生物体的SNP碱基类型是杂合的所述特定碱基类型,则Min(Test)为0.5,
当所述待鉴定生物体的SNP碱基类型不含有所述特定碱基类型,则Min(Test)为0;
(IV)基于所述待鉴定生物体的差异度D与预定阈值的比较,确定所述待鉴定生物体是否为所述预定品种的纯种生物体。
根据权利要求17所述的方法,其特征在于,所述预定阈值是基于多个预定品种的纯种生物体的所述差异度D确定的。
根据权利要求18所述的方法,其特征在于,所述预定阈值是通过下列步骤确定的:
(i)针对所述候选SNP位点集合,基于多个所述预定品种的纯种生物体,分别确定各纯种生物体的差异度D;
(ii)基于步骤(i)中获得的各纯种生物体的差异度D,确定所述多个预定品种的纯种生物体的差异度D的平均值E和标准偏差SD;
(iii)基于公式E+4*SD,确定所述预定阈值。
根据权利要求17所述的方法,其特征在于,所述预定物种为狗或猫。
根据权利要求17所述的方法,其特征在于,所述候选SNP集合是通过从用于进行纯种鉴定的SNP位点集合中减去所述待鉴定生物体中无法检测的SNP而确定的。
根据权利要求21所述的方法,其特征在于,所述候选SNP集合中SNP位点的数目比所述用于进行纯种鉴定的SNP位点集合少1~2个。
根据权利要求21所述的方法,其特征在于,所述候选SNP位点集合由下表所示的30个SNP位点构成:
根据权利要求17所述的方法,其特征在于,所述待鉴定生物体的差异度D小于所述预定阈值是所述待鉴定生物体为所述预定品种的纯种生物体的指示。
根据权利要求17所述的方法,其特征在于,所述预定品种为迷你贵宾犬,所述预定阈值为至多5.965449379。
一种用于确定SNP位点集合的装置,其特征在于,所述SNP位点集合用于预定物
种的预定品种的纯种鉴定,所述方法包括:
SNP位点集合构建单元,所述SNP位点集合构建单元用于构建第一SNP位点集合和第二SNP位点集合,所述第一SNP位点集合中的每一个SNP位点均来源于所...
【专利技术属性】
技术研发人员:郭瑞东,贾超,
申请(专利权)人:深圳华大生命科学研究院,
类型:发明
国别省市:广东;44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。