确定SNP位点集合的方法、装置及其应用制造方法及图纸

技术编号:23901661 阅读:27 留言:0更新日期:2020-04-22 11:15
提供了一种确定SNP位点集合的方法。其中,该SNP位点集合用于预定物种的预定品种的纯种鉴定,该方法包括:(1)构建第一SNP位点集合和第二SNP位点集合,该第一SNP位点集合中的每一个SNP位点均来源于该预定物种的生物体,该第二SNP位点集合中的每一个SNP位点均来源于该预定品种的生物体;(2)针对该第一SNP位点集合中的每一个SNP位点,分别确定预定碱基类型在该预定物种中的物种出现频率;(3)针对该第二SNP位点集合中的每一个SNP位点,分别确定预定碱基类型在该预定品种中的品种出现频率;(4)基于该品种出现频率与该物种出现频率的差异,确定用于该预定品种的纯种鉴定的SNP位点集合。

【技术实现步骤摘要】
【国外来华专利技术】确定SNP位点集合的方法、装置及其应用优先权信息无
本专利技术涉及生物
,具体而言,涉及纯种鉴定
,更具体地,涉及确定SNP位点集合的方法、装置及其应用。
技术介绍
随着人类对动物的驯化以及特异性的人工选择,使得在一个物种之中演化出数百种形状不同的子类。例如宠物狗,目前科学研究论证狗源于灰狼,但随着人类的培养,已形成了两百多个被犬业俱乐部认证的品种。由于纯种宠物狗、猫等的价格显著高于非纯种的,故针对物种进行纯种鉴定具有现实的经济意义。然而,目前的对物种(例如狗、猫等)进行纯种鉴定的技术仍有待改进。
技术实现思路
本专利技术旨在至少解决现有技术中存在的技术问题之一。为此,本专利技术的一个目的在于提出一种成本低、检测周期短、准确度高的纯种鉴定技术。需要说明的是,本专利技术是基于专利技术人的下列工作和发现而完成的:目前检测宠物狗(或猫)是否为纯种,主要有两种方法:一、依据其性状,包括身高,体长,毛色,肩宽等指标来判定,使用性状来判定纯种狗的方法,需要由受过训练的专业人员执行,具有较大的主观色彩,成本高;二、通过DNA上的短串联重复来确定两只宠物狗(或猫)的直系亲缘关系,当已确认待检测狗为两只已认证的纯种狗的后代后,确定该待检测狗为纯种狗,然而,这种使用直系亲属来确定待检测狗是否为纯种的方法,需要检测待检测狗的父母的DNA,采样成本高,且在待检测狗父母的品种不确定时无法使用。而专利技术人发现,不同品种间之间由于人为的生殖隔离与繁育时的瓶颈效应,造成了每个品种都具有其特异性的基因位点,如果能够将这些位点提取出来,就可以构建出一个用于纯种鉴定的SNP位点集合。类似的SNP位点选取方式不仅可以用于各宠物(如狗、猫等)品种的鉴定,还可以用于猪,牛,羊以及警犬等的有经济价值的优良品种选育,以及适应特定环境(适合干旱,高海拔)的物种选育。然而,如何科学有效地筛选出能够用于纯种鉴定的SNP位点集合,仍然是本领域的难题。进而,专利技术人通过一系列科学的实验设计和实际探索工作,惊喜地得到了筛选确定用于纯种鉴定的SNP位点集合的方法,并进而专利技术了基于该方法确定的SNP位点集合进行纯种鉴定的技术。从而,在本专利技术的一个方面,本专利技术提供了一种确定SNP位点集合的方法。根据本专利技术的实施例,所述SNP位点集合用于预定物种的预定品种的纯种鉴定,所述方法包括:(1)构建第一SNP位点集合和第二SNP位点集合,所述第一SNP位点集合中的每一个SNP位点均来源于所述预定物种的生物体,所述第二SNP位点集合中的每一个SNP位点均来源于所述预定品种的生物体;(2)针对所述第一SNP位点集合中的每一个SNP位点,分别确定预定碱基类型在所述预定物种中的物种出现频率;(3)针对所述第二SNP位点集合中的每一个SNP位点,分别确定预定碱基类型在所述预定品种中的品种出现频率;(4)基于所述品种出现频率与所述物种出现频率的差异,确定用于所述预定品种的纯种鉴定的SNP位点集合。根据本专利技术的实施例,通过该方法确定的SNP位点集合,能够有效用于预定物种的预定品种的纯种鉴定,并且,所得鉴定结果准确可靠。在本专利技术的另一方面,本专利技术提供了一种SNP位点集合。根据本专利技术的实施例,该SNP位点集合是通过前面所述的确定SNP位点集合的方法确定的。专利技术人惊奇地发现,该SNP位点集合能够有效用于预定物种的预定品种的纯种鉴定,并且,所得鉴定结果准确可靠。在本专利技术的又一方面,本专利技术提供了一种SNP位点集合。根据本专利技术的实施例,该SNP位点集合由下表所示的30个SNP位点构成:。根据本专利技术的实施例,利用该SNP位点集合能够有效进行迷你贵宾犬的纯种鉴定,并且,所得鉴定结果准确可靠。在本专利技术的再一方面,本专利技术提供了一种针对预定物种的预定品种进行纯种鉴定的方法。根据本专利技术的实施例,该方法包括:(I)针对所述预定品种选择用于进行纯种鉴定的SNP位点集合,所述用于进行纯种鉴定的SNP位点集合是基于前面所述的确定SNP位点集合的方法确定的,或者是如前所述的SNP位点集合;(II)基于所述用于进行纯种鉴定的SNP位点集合,构建候选SNP位点集合,所述候选SNP位点集合是所述用于进行纯种鉴定的SNP位点集合的子集;(III)针对所述候选SNP位点集合的每一个SNP位点,确定待鉴定生物体的SNP碱基类型,并按照下列公式确定所述待鉴定生物体的差异度D:a是所述候选SNP位点集合中SNP位点的数目,maf是基于多个预定品种的纯种生物体确定的所述候选SNP位点集合中每一个SNP位点的特定碱基类型的出现频率,所述特定碱基类型为每一个SNP位点的出现频率较高的碱基类型,针对所述候选SNP位点集合中每一个SNP位点,Min(Test)是基于下列原则确定的:当所述待鉴定生物体的SNP碱基类型是纯合的所述特定碱基类型,则Min(Test)为1,当所述待鉴定生物体的SNP碱基类型是杂合的所述特定碱基类型,则Min(Test)为0.5,当所述待鉴定生物体的SNP碱基类型不含有所述特定碱基类型,则Min(Test)为0;(IV)基于所述待鉴定生物体的差异度D与预定阈值的比较,确定所述待鉴定生物体是否为所述预定品种的纯种生物体。根据本专利技术的实施例,利用本专利技术的针对预定物种的预定品种进行纯种鉴定的方法,能够有效地实现对预定物种的预定品种的纯种鉴定,并且该方法简单易操作、成本低、检测周期短,检测结果准确可靠。在本专利技术的又一方面,本专利技术提供了一种用于确定SNP位点集合的装置。根据本专利技术的实施例,该用于确定SNP位点集合的装置包括:SNP位点集合构建单元,所述SNP位点集合构建单元用于构建第一SNP位点集合和第二SNP位点集合,所述第一SNP位点集合中的每一个SNP位点均来源于所述预定物种的生物体,所述第二SNP位点集合中的每一个SNP位点均来源于所述预定品种的生物体;物种出现频率确定单元,所述物种出现频率确定单元与所述SNP位点集合构建单元相连,用于针对所述第一SNP位点集合中的每一个SNP位点,分别确定预定碱基类型在所述预定物种中的物种出现频率;品种出现频率确定单元,所述品种出现频率确定单元与所述SNP位点集合构建单元相连,用于针对所述第二SNP位点集合中的每一个SNP位点,分别确定预定碱基类型在所述预定品种中的品种出现频率;纯种鉴定SNP位点集合确定单元,所述纯种鉴定SNP位点集合确定单元分别与所述物种出现频率确定单元和所述品种出现频率确定单元相连,用于基于所述品种出现频率与所述物种出现频率的差异,确定用于所述预定品种的纯种鉴定的SNP位点集合。根据本专利技术的实施例,利用该装置确定的SNP位点集合,能够有效用于预定物种的预定品种的纯种鉴定,并且,所得鉴定结果准确可靠。并且,该装置操作方便、成本低。在本专利技术的再一方面,本专利技术提供了一种用于针对预定物种的预定品种进行纯种鉴定的系统。根据本专利技术的实施例,该系统包括:前面所述的用于确定SNP位点集合的装置,所述用于确定SNP位点集合的装置适本文档来自技高网...

【技术保护点】
一种确定SNP位点集合的方法,其特征在于,所述SNP位点集合用于预定物种的预定品种的纯种鉴定,所述方法包括:/n(1)构建第一SNP位点集合和第二SNP位点集合,所述第一SNP位点集合中的每一个SNP位点均来源于所述预定物种的生物体,所述第二SNP位点集合中的每一个SNP位点均来源于所述预定品种的生物体;/n(2)针对所述第一SNP位点集合中的每一个SNP位点,分别确定预定碱基类型在所述预定物种中的物种出现频率;/n(3)针对所述第二SNP位点集合中的每一个SNP位点,分别确定预定碱基类型在所述预定品种中的品种出现频率;/n(4)基于所述品种出现频率与所述物种出现频率的差异,确定用于所述预定品种的纯种鉴定的SNP位点集合。/n

【技术特征摘要】
【国外来华专利技术】一种确定SNP位点集合的方法,其特征在于,所述SNP位点集合用于预定物种的预定品种的纯种鉴定,所述方法包括:
(1)构建第一SNP位点集合和第二SNP位点集合,所述第一SNP位点集合中的每一个SNP位点均来源于所述预定物种的生物体,所述第二SNP位点集合中的每一个SNP位点均来源于所述预定品种的生物体;
(2)针对所述第一SNP位点集合中的每一个SNP位点,分别确定预定碱基类型在所述预定物种中的物种出现频率;
(3)针对所述第二SNP位点集合中的每一个SNP位点,分别确定预定碱基类型在所述预定品种中的品种出现频率;
(4)基于所述品种出现频率与所述物种出现频率的差异,确定用于所述预定品种的纯种鉴定的SNP位点集合。


根据权利要求1所述的方法,其特征在于,在步骤(2)中,所述物种出现频率是通过下述公式确定的:
(特定SNP的预定碱基类型出现次数)/(构成所述第一SNP位点集合的生物体数目)×2。


根据权利要求1所述的方法,其特征在于,在步骤(3)中,所述品种出现频率是通过下述公式确定的:
(特定SNP的预定碱基类型出现次数)/(构成所述第二SNP位点集合的生物体数目)×2。


根据权利要求2或3所述的方法,其特征在于,在步骤(2)和(3)的至少之一中,基于以下原则确定特定SNP的预定碱基类型出现次数:
针对纯合型预定碱基类型,将所述预定碱基类型的出现次数记为2次;
针对杂合型预定碱基类型,将所述预定碱基类型的出现次数记为1次。


根据权利要求1所述的方法,其特征在于,所述预定碱基类型为野生型碱基。


根据权利要求1所述的方法,其特征在于,在步骤(4)中,基于所述品种出现频率与所述物种出现频率的差值绝对值,确定用于所述预定品种的纯种鉴定的SNP位点集合。


根据权利要求6所述的方法,其特征在于,选择所述品种出现频率与所述物种出现频率的差值绝对值最大的20个SNP位点,作为用于预定品种的纯种鉴定的SNP位点集合。


根据权利要求1所述的方法,其特征在于,进一步包括:
(5)对所述用于预定品种的纯种鉴定的SNP位点集合进行过滤,所述过滤是基于对所述SNP位点进行PCR引物设计实现的。


根据权利要求1所述的方法,其特征在于,进一步包括:
(a)构建第三SNP位点集合,所述第三SNP位点集合中的每一个SNP位点均来源于所述预定品种的至少一种近亲品种的生物体;

(b)针对所述第三SNP位点集合中的每一个SNP位点,确定预定碱基类型在所述预定品种的所述近亲品种中的近亲品种出现频率;
(c)基于所述品种出现频率与所述近亲品种出现频率的差异,确定补充SNP位点集合,并将所述补充SNP位点集合并入至所述用于预定物种的纯种鉴定的SNP位点集合。


根据权利要求9所述的方法,其特征在于,在步骤(b)中,所述近亲品种出现频率是通过下述公式确定的:
(特定SNP的预定碱基类型出现次数)/(构成所述第三SNP位点集合的生物体数目)×2。


根据权利要求9所述的方法,其特征在于,在步骤(c)中,基于所述品种出现频率与所述近亲品种出现频率的差值绝对值,确定所述补充SNP位点集合。


根据权利要求11所述的方法,其特征在于,针对每种所述近亲品种,选择所述品种出现频率与所述近亲品种出现频率的差值绝对值最大的5个SNP位点,构建所述补充SNP位点集合。


根据权利要求9所述的方法,其特征在于,在步骤(a)中,采用与所述预定品种最接近的两种近亲品种。


根据权利要求1所述的方法,其特征在于,所述预定物种为狗或猫。


一种SNP位点集合,其是通过权利要求1~14任一项所述的方法确定的。


一种SNP位点集合,其特征在于,由下表所示的30个SNP位点构成:








一种针对预定物种的预定品种进行纯种鉴定的方法,其特征在于,包括:
(I)针对所述预定品种选择用于进行纯种鉴定的SNP位点集合,所述用于进行纯种鉴定的SNP位点集合是基于权利要求1~14任一项所述的方法确定的,或者是如权利要求15或16所述的SNP位点集合;
(II)基于所述用于进行纯种鉴定的SNP位点集合,构建候选SNP位点集合,所述候选SNP位点集合是所述用于进行纯种鉴定的SNP位点集合的子集;
(III)针对所述候选SNP位点集合的每一个SNP位点,确定待鉴定生物体的SNP碱基类型,并按照下列公式确定所述待鉴定生物体的差异度D:



a是所述候选SNP位点集合中SNP位点的数目,
maf是基于多个预定品种的纯种生物体确定的所述候选SNP位点集合中每一个SNP位点的特定碱基类型的出现频率,所述特定碱基类型为每一个SNP位点的出现频率较高的碱基类型,
针对所述候选SNP位点集合中每一个SNP位点,Min(Test)是基于下列原则确定的:
当所述待鉴定生物体的SNP碱基类型是纯合的所述特定碱基类型,则Min(Test)为1,

当所述待鉴定生物体的SNP碱基类型是杂合的所述特定碱基类型,则Min(Test)为0.5,
当所述待鉴定生物体的SNP碱基类型不含有所述特定碱基类型,则Min(Test)为0;
(IV)基于所述待鉴定生物体的差异度D与预定阈值的比较,确定所述待鉴定生物体是否为所述预定品种的纯种生物体。


根据权利要求17所述的方法,其特征在于,所述预定阈值是基于多个预定品种的纯种生物体的所述差异度D确定的。


根据权利要求18所述的方法,其特征在于,所述预定阈值是通过下列步骤确定的:
(i)针对所述候选SNP位点集合,基于多个所述预定品种的纯种生物体,分别确定各纯种生物体的差异度D;
(ii)基于步骤(i)中获得的各纯种生物体的差异度D,确定所述多个预定品种的纯种生物体的差异度D的平均值E和标准偏差SD;
(iii)基于公式E+4*SD,确定所述预定阈值。


根据权利要求17所述的方法,其特征在于,所述预定物种为狗或猫。


根据权利要求17所述的方法,其特征在于,所述候选SNP集合是通过从用于进行纯种鉴定的SNP位点集合中减去所述待鉴定生物体中无法检测的SNP而确定的。


根据权利要求21所述的方法,其特征在于,所述候选SNP集合中SNP位点的数目比所述用于进行纯种鉴定的SNP位点集合少1~2个。


根据权利要求21所述的方法,其特征在于,所述候选SNP位点集合由下表所示的30个SNP位点构成:








根据权利要求17所述的方法,其特征在于,所述待鉴定生物体的差异度D小于所述预定阈值是所述待鉴定生物体为所述预定品种的纯种生物体的指示。


根据权利要求17所述的方法,其特征在于,所述预定品种为迷你贵宾犬,所述预定阈值为至多5.965449379。


一种用于确定SNP位点集合的装置,其特征在于,所述SNP位点集合用于预定物

种的预定品种的纯种鉴定,所述方法包括:
SNP位点集合构建单元,所述SNP位点集合构建单元用于构建第一SNP位点集合和第二SNP位点集合,所述第一SNP位点集合中的每一个SNP位点均来源于所...

【专利技术属性】
技术研发人员:郭瑞东贾超
申请(专利权)人:深圳华大生命科学研究院
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1