当前位置: 首页 > 专利查询>南京大学专利>正文

一种在植物基因组中检测体细胞突变的方法技术

技术编号:33462761 阅读:9 留言:0更新日期:2022-05-19 00:43
本发明专利技术公开了一种在植物基因组中检测体细胞突变的方法。所述方法包括(1)重测序数据的评估;(2)重测序数据的拼装;(3)突变位点的鉴定;(4)突变位点的评估;(5)突变位点的筛选;(6)候选突变位点的分类与标签化;(7)突变位点的人工检验。本发明专利技术提供的方法,可以在各种植物基因组中高效、全面的检测体细胞突变,包括单核苷酸变异位点(SNV)与插入缺失位点(INDEL),为评估植物体细胞突变率提供了有力分析工具,从而为研究体细胞突变对植物发育与进化的影响提供分子基础。进化的影响提供分子基础。进化的影响提供分子基础。

【技术实现步骤摘要】
一种在植物基因组中检测体细胞突变的方法


[0001]本专利技术涉及微生物
,具体地说,本专利技术涉及一种在植物基因组中检测体细胞突变的方法,具体涉及对植物原始基因组数据的拼接与评估及体细胞突变位点的识别与筛选鉴定。

技术介绍

[0002]植物基因组变异,包括突变与重组,是植物多样性产生的基础,也是植物适应性演化的内在驱动力。基因组变异如何产生、保留与遗传,受哪些因素的影响,一直是生命科学领域重要的科学问题。其中突变是经典遗传学长期关注的重要科学问题之一。随着重测序技术的发展,近年来关于突变的研究取得了巨大的进展。 目前关于突变的研究主要集中在三个方面:减数分裂突变率的评估,癌细胞的突变鉴定,体细胞突变的评估。其中体细胞的突变主要集中于细菌、真菌和动物中。
[0003]目前植物中用于检测体细胞突变的方法一般借用人类和小鼠中的研究方法,但是植物基因组具有独特的特征,动物中的检测方法无法完全适用于植物基因组。为了保证筛选出可靠的突变,已有的检测方法往往会先屏蔽基因组中的复杂序列,比如重复序列,转座元件等等,这样会导致大量的基因组信息被忽略。此外,现有的体细胞突变的检测方法虽然能有效的去除假阴性的结果,但无法有效的评估假阳性结果,因此鉴定出来的体细胞突变常常具有高假阳性率。综上,需要开发一种对植物基因组适用的,且能高效快速检测出可靠的体细胞突变的方法。

技术实现思路

[0004]针对现有技术的上述缺陷,本专利技术提供一种在植物基因组中检测体细胞突变的方法。
[0005]为了解决现有技术的问题,本专利技术提供了如下技术方案:本专利技术的一种在植物基因组中检测体细胞突变的方法,包括如下步骤:(1)重测序数据的评估:利用FastQC等软件对重测序数据进行质检和评估,过滤得到clean data;(2)重测序数据的拼装:使用BWA

mem的默认参数将clean data比对到参考基因组上,得到原始SAM文件,通过Picard的SortSam模块将SAM文件排序并转变为BAM格式;(3)突变位点的鉴定:利用GATK中识别变异的两种不同算法UG和HC,选用
ꢀ“‑
rf MappingQuality
ꢀ‑
mmq 20
”ꢀ
参数过滤比对质量mapping quality小于20的reads,获得包含所有原始变异位点的VCF文件;(4)突变位点的评估:选用samtools的mpileup模块与VarScan,统计候选单核苷酸变异位点SNV的实际比对reads数与比对质量信息;选用HC的joint

calling模式重新对插入缺失位点INDEL进行识别,进一步明确位点信息;(5)突变位点的筛选:基于各个样品对应的发育topology

based关系和等位位点
的出现频率frequency

based可以筛选出突变候选位点;(6)候选突变位点的分类与标签化:对所有候选突变的各种特征加上标签,特征包括但不限于:支持突变位点的reads数量、突变reads的测序链是否存在偏好、突变的碱基质量值、类突变位点在对照样本中的出现情况、区域测序质量、区域比对质量、附近是否存在插入缺失位点、位点在不同发育关系的样本中的分布状态、序列差异度,根据突变特征所指示的可靠程度进行排序和分级,降低假阳性和假阴性率;(7)突变位点的人工检验:使用IGV Integrative Genomics Viewer进行人工检验,排除一些程序未能正确添加标签的部分情况,例如外源性污染或者拼装错误而导致的一些假阳性结果。
[0006]进一步地,在步骤(1)中,通过MD5值校验,根据测序数据GC含量,测序深度等对重测序数据进行质检,去除reads接头,含N比例大于10%的reads,以及低质量碱基占reads数比例超过50%的reads,经过过滤之后得到clean data。
[0007]进一步地,在步骤(2)中,使用MarkDuplicates模块标记异常扩增的reads,并利用GATK的RealignerTargetCreator和IndelRealigner对插入与缺失区域进行重比对。
[0008]更进一步地,在步骤(5)中,对于体细胞突变,亲缘关系越近或物理位置越近的样品含有相同突变的可能性越大。
[0009]进一步地,在步骤(5)中,来自同一分支的叶片样品间常共享体细胞突变,而不同分支的叶片样品筛选的共同突变往往是假的,基于各个样品突变的拓扑topology

based关系可以筛选出更可靠的突变位点。
[0010]进一步地,在步骤(5)中,根据等位位点的频率frequency

based,所有样品中共有的突变或仅某个样品中包含的突变且reads数目<5,可以删除这些未固定的变异位点和存在显著偏态的位点,去除部分假阳性突变位点。
[0011]有益效果:本专利技术提供的方法,可以在各种植物基因组中高效、全面的检测体细胞突变,包括单核苷酸变异位点(SNV)与插入缺失位点(INDEL),为评估植物体细胞突变率提供了有力分析工具,从而为研究体细胞突变对植物发育与进化的影响提供分子基础。本专利技术可以在不同植物物种中进行体细胞突变的高效鉴定和筛选,不仅为评估植物体细胞的突变率提供了有力分析工具,从而为研究体细胞突变对植物发育与演化的影响提供分子基础;同时可以与动物中分析体细胞突变的方法进行类比,寻找异同点,优化整合体细胞突变的检测流程。
[0012]与现有技术相比,本专利技术具有如下优点:(1)本专利技术首次提供了植物中体细胞突变的检测方法。近年来,关于植物体细胞突变的研究越来越多,但是现有检测植物体细胞突变的方法一般借鉴人类和小鼠中。
[0013](2)因大多数植物基因组经历过基因组加倍事件(WGD),重复序列比较多,采用动物中分析方法不仅不准确,而且会丢失很多有效信息。而本专利技术的出现,很好的弥补了这一方面研究方法的缺失,为不同植物物种中体细胞突变的快速鉴定提供了非常好的途径。
[0014](3)突变体msh6突变位点的特征:与野生型相比,突变体msh6的单碱基替换突变率提高了6.46倍,插入与缺失突变率提高了12.09倍。此外,突变体msh6在颠换上的偏态更为显著,转换颠换之比约为0.12,颠换突变数量占总突变数的82.7%,其中又以C>A方向上的突变为主,占总突变的62.2%,反映了该基因可能存在对颠换突变修复的偏好性。
附图说明
[0015]图1为本专利技术的流程示意图。
[0016]图2为本专利技术的拟南芥突变体msh6取样示意图,图中虚线下方为莲座叶,上方为分支叶。
[0017]图3 为本专利技术利用IGV进行人工检验变异位点示意图。图中变异位点为Chr2: 14340548, 突变类型为C到 A的单碱基替换。
[0018]图4为本专利技术的拟南芥突变体msh6体细胞突变(单核苷酸变异位点)的系统进化树。本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种在植物基因组中检测体细胞突变的方法,其特征在于包括如下步骤:(1)重测序数据的评估:利用FastQC等软件对重测序数据进行质检和评估,过滤得到clean data;(2)重测序数据的拼装:使用BWA

mem的默认参数将clean data比对到参考基因组上,得到原始SAM文件,通过Picard的SortSam模块将SAM文件排序并转变为BAM格式;(3)突变位点的鉴定:利用GATK中识别变异的两种不同算法UG和HC,选用
ꢀ“‑
rf MappingQuality
ꢀ‑
mmq 20
”ꢀ
参数过滤比对质量mapping quality小于20的reads,获得包含所有原始变异位点的VCF文件;(4)突变位点的评估:选用samtools的mpileup模块与VarScan,统计候选单核苷酸变异位点SNV的实际比对reads数与比对质量信息;选用HC的joint

calling模式重新对插入缺失位点INDEL进行识别,进一步明确位点信息;(5)突变位点的筛选:基于各个样品对应的发育topology

based关系和等位位点的出现频率frequency

based可以筛选出突变候选位点;(6)候选突变位点的分类与标签化:对所有候选突变的各种特征加上标签,特征包括但不限于:支持突变位点的reads数量、突变reads的测序链是否存在偏好、突变的碱基质量值、类突变位点在对照样本中的出现情况、区域测序质量、区域比对质量、附近是否存在插入缺失位点、位点在不同发育关系的样本中的分布状态、序列差异度,根据突变特征所指示的可靠程度进行排序和分级,降低假阳...

【专利技术属性】
技术研发人员:杨四海季逸伦张小辉王龙
申请(专利权)人:南京大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1