烟草品种的DNA指纹图谱库及其应用制造技术

技术编号:24882380 阅读:50 留言:0更新日期:2020-07-14 18:09
本发明专利技术公开了烟草品种的DNA指纹图谱库,所述DNA指纹图谱库包括101个特异性SNP位点;并且本发明专利技术还提供了采用所述DNA指纹图谱库在烟草品种鉴定中的应用。本发明专利技术提供的DNA指纹图谱库以及特定烟草品种的DNA指纹图谱基于简化基因组测序得到,用于烟草品种鉴定时,与传统的外观、评吸鉴定方法相比,可以提供更加客观、更加准确、更加可靠的鉴定结果。

【技术实现步骤摘要】
烟草品种的DNA指纹图谱库及其应用
本专利技术涉及分子生物学研究领域,具体而言,本专利技术涉及烟草品种的DNA指纹图谱库及其在烟草品种鉴定中的应用。
技术介绍
为了依法处理烟草原料的走私和违法销售,需要对依法罚没的烟草原料进行鉴别检验。目前在烟草原料的鉴别检验工作中,烟叶状的样品基本上是通过外观、评吸等主观手段进行。为了提升鉴别检验的准确性,已经进行了烟草DNA鉴别检验的研究。由于在DNA分子水平,不同物种间甚至是同一物种不同个体之间都能得到很好的区分,因此DNA分子技术作为物种分类鉴定的一种手段,已被广泛地应用于属间、种间、品种间的分类鉴定和亲缘关系研究中,几乎可以对所有的生物种类进行分类鉴定,在目前物种鉴定技术中发展最快,也最为热门。目前DNA分子鉴定技术已有数十种之多,如限制性片段长度多态性标记、随机扩增多态性标记、序列特异性扩增区域标记、内含子长度多态性标记、单核苷酸多态性、简单序列重复标记等。目前用于烟草鉴定的DNA分子技术主要就是SSR标记技术和SNP标记技术。SSR标记技术是目前应用最为广泛的DNA分子鉴定方法,但是由于SSR标记所承载的遗传信息有限,以SSR标记来进行鉴定,为了保障鉴定结果的可靠性,往往需要设计多达十几到二十多对的引物,引物的设计开发比较复杂,并需要大量的验证试验,这就造成前期引物设计周期长,实验验证工作量大,后期鉴定时操作比较繁琐,鉴定通量低,并且在稍复杂的鉴定中,还是需要测序来验证检验结果的准确性。SNP标记技术包括质谱法、芯片法等,质谱法所采用的质谱设备昂贵且检测通量低,芯片法成本较高,且需要进行基因芯片的定制,实验操作比较复杂。受益于当前测序技术的进步和成本的大幅度降低,以测序法进行烟草DNA鉴定成为可能。测序法主要包括简化基因组测序法和全基因组重测序法,这两种方法都能够比较全面的获取被检样品的遗传信息,区别在于简化基因组测序所需要的位点数较少,覆盖基因组的5%-10%即可,而全基因组重测序则需要获得整个基因组的遗传变异信息,需要的数据量大,成本高,结合烟草DNA鉴定的实际情况,简化基因组测序已经完全可以满足鉴定要求。开发烟草品种的新型DNA鉴定方法对于提升相关品种鉴定的准确性、对于推动烟草DNA鉴别检验工作的发展具有积极的意义。
技术实现思路
针对上述技术问题,本专利技术的目的是提供一种可用于鉴定烟草品种的DNA指纹图谱库,所述DNA指纹图谱库包括品种特异性的SNP位点。此外,中国烟草的两大类型为晾晒烟和烤烟,前者以宁乡晒烟为典型品种,后者以中烟103和云烟87为典型品种。在实际鉴定工作中这几类烟草的鉴定需求大,鉴定难度高,因此本专利技术的目的还在于提供这些特定烟草品种的DNA指纹图谱。本专利技术的技术方案如下。一方面,本专利技术提供一种烟草品种的DNA指纹图谱库,所述DNA指纹图谱库包括如下101个特异性SNP位点:另一方面,本专利技术还提供所述指纹图谱库的建立方法,包括以下步骤:(1)收集烟草品种种质共131个,见表1,取新鲜烟叶分别提取基因组DNA,然后以限制性内切酶SacI和MseI分别对基因组DNA进行酶切;(2)将步骤(1)得到的酶切片段与测序接头相连接后纯化,选择长度在320-420bp范围内的片段,富集扩增并测序,其中采用IlluminaNovaSeq测序系统,原始测序读长为Paired-end150bp,测序数据为FASTQ格式;(3)从ftp://ftp.solgenomics.net/genomes/Nicotiana_tabacum/edwards_et_al_2017/assembly/获得典型烟草品种的基因组,使用其scaffold水平作为参考基因组,选取长度≥1kb的scaffold,共371,419条,总长4.2Gb,用限制性内切酶SacI和MseI进行模拟酶切,选择片段双端分别为两个酶切位点且片段长度为200-600bp的片段,共获得片段355,695个;(4)将步骤(2)得到的原始reads使用软件FastQCv0.11.5进行质量统计,并使用软件Trimmomatic-0.38进行过滤,过滤参数如下:a.双末端测序前端去掉前5个碱基,双末端测序后端去掉前3个碱基;b.从头开始去掉质量小于20的碱基,直到出现质量大于20的碱基为止,从结尾开始去掉质量小于20的碱基,直到出现质量大于20的碱基为止;c.如果5个相连碱基平均质量小于20,则去掉此5个碱基;d.Read最小长50bp;e.Reads平均质量大于20;(5)进行DNA指纹图谱库的构建,包括:(5-1)用BWA+GATK流程检测步骤(4)得到的reads的变异,包括1,219,877个indel和2,222,588个SNP;(5-2)选择所述SNP,按照“QD<2.0||FS>60.0||MQ<40.0||MQRankSum<-12.5||ReadPosRankSum<-8.0||QUAL<40”对低质量的SNP进行过滤,得到978,426个高质量SNP;(5-3)使用vcftools过滤掉等位基因频率小于0.05、群体中缺失率大于20%的SNP,得到104,788个SNP;(5-4)计算每个SNP的多态性信息含量(PIC)值,选择PIC值大于0.35的SNP,得到65,582个SNP;(5-5)依据参考基因组Scaffold的数量及其长度,选择大于50Kb的Scaffold上的SNP,得到44,122个SNP;(5-6)对所述SNP进行注释,选择在基因编码区的SNP,得到746个SNP,过滤掉杂合度大于5%的SNP,得到101个SNP。另一方面,本专利技术还提供一种烟草品种的DNA指纹图谱的建立方法,所述建立方法包括:基于本专利技术提供的指纹图谱库,检测所述烟草的标准品种对应SNP位点上的特异性核苷酸,得到所述烟草品种的DNA指纹图谱。由此,再一方面,本专利技术还提供通过所述建立方法得到的DNA指纹图谱。以及,另一方面,本专利技术还提供所述DNA指纹图谱库或DNA指纹图谱在鉴定烟草品种中的应用。根据本专利技术的具体实施方式,本专利技术提供宁乡晒烟的DNA指纹图谱,所述DNA指纹图谱包括101个SNP位点,所述SNP位点及其上的特异性核苷酸如下:上述DNA指纹图谱可用于鉴定宁乡晒烟,因此本专利技术还提供所述DNA指纹图谱在鉴定宁乡晒烟中的应用。因此,本专利技术还提供一种宁乡晒烟的鉴定方法,所述鉴定方法包括以下步骤:检测待测烟草的基因组DNA中本专利技术所提供的DNA指纹图谱库中的101个SNP位点,并与宁乡晒烟DNA指纹图谱中所述位点上的特异性核苷酸相比较,符合率≥95%时将待测烟草鉴定为宁乡晒烟。其中优选地,从待测烟草的新鲜烟叶中获得所述基因组DNA。根据本专利技术的具体实施方式,本专利技术提供中烟103的DNA指纹图谱,所述DNA指纹图谱包括101个SNP位点,所述SNP位点及其上的特异本文档来自技高网
...

【技术保护点】
1.一种烟草品种的DNA指纹图谱库,所述DNA指纹图谱库包括如下101个特异性SNP位点:/n

【技术特征摘要】
1.一种烟草品种的DNA指纹图谱库,所述DNA指纹图谱库包括如下101个特异性SNP位点:








2.权利要求1所述的指纹图谱库的建立方法,所述建立方法包括以下步骤:
(1)收集烟草品种种质131个,见表1,取新鲜烟叶分别提取基因组DNA,然后以限制性内切酶SacI和MseI对基因组DNA进行酶切;
(2)将步骤(1)得到的酶切片段与测序接头相连接后纯化,选择长度在320-420bp范围内的片段,富集扩增并测序,其中采用IlluminaNovaSeq测序系统,原始测序读长为Paired-end150bp,测序数据为FASTQ格式;
(3)从ftp://ftp.solgenomics.net/genomes/Nicotiana_tabacum/edwards_et_al_2017/assembly/获得典型烟草品种的基因组,使用其scaffold水平作为参考基因组,选取长度≥1kb的scaffold,共371,419条,总长4.2Gb,用限制性内切酶SacI和MseI进行模拟酶切,选择片段双端分别为两个酶切位点且片段长度为200-600bp的片段,共获得片段355,695个;
(4)将步骤(2)得到的原始reads使用软件FastQCv0.11.5进行质量统计,并使用软件Trimmomatic-0.38进行过滤,过滤参数如下:a.双末端测序前端去掉前5个碱基,双末端测序后端去掉前3个碱基;b.从头开始去掉质量小于20的碱基,直到出现质量大于20的碱基为止,从结尾开始去掉质量小于20的碱基,直到出现质量大于20的碱基为止;c.如果5个相连碱基平均质量小于20,则去掉此5个碱基;d.Read最小长50bp;e.Reads平均质量大于20;
(5)进行DNA指纹图谱库的构建,包括:
(5-1)用BWA+GATK流程检测步骤(4)得到的reads的变异,包括1,219,877个indel和2,222,588个SNP;
(5-2)选择所述SNP,按照“QD<2.0||FS>60.0||MQ<40.0||MQRankSum<-12.5||ReadPosRankSum<-8.0||QUAL<40”对低质量的SNP进行过滤,得到978,426个高质量SNP;
(5-3)使用vcftools过滤掉等位基因频率小于0.05、群体中缺失率大于20%的SNP,得到104,788个SNP;
(5-4)计算每个SNP的多态性信息含量(PIC)值,选择PIC值大于0.35的SNP,得到65,582个SNP;
(5-5)依据参考基因组Scaffold的数量及其长度,选...

【专利技术属性】
技术研发人员:刘楠张威何声宝王英元罗安娜冯晓民张晓慧范月月
申请(专利权)人:国家烟草质量监督检验中心
类型:发明
国别省市:河南;41

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1