The present invention involves using the 3K genome data based on whole genome sequencing to compare the variation information of different dimensions, including SNP, InDel, and SV, which are obtained by the reference genome Japan, and to produce a rice multi sample integration map containing more than 3000 samples of sample variation, OsMS IVMap1.0, by unified integration. The process of creating the map, on the one hand, is based on a variety of genomic mutation searching methods based on multiple samples; on the other hand, the variation information of different dimensions is formatted. This map can be used to analyze the important genetic variation of rice and to compare the distribution of different types of genomes efficiently. It is mainly applied to the research of genome variation detection, marker development and gene function in the model organisms represented by rice.
【技术实现步骤摘要】
水稻多样本变异整合图谱OsMS-IVMap1.0的创建
本专利技术涉及一种利用基于全基因组测序的多个样本所产生的高质量SNP、InDel和SV等变异信息,创建整合图谱。该方法及其创建的图谱OsMS-IVMap1.0,属于作物分子育种领域,适用于在以水稻为代表的模式生物中进行全基因组的变异检测、标记开发和基因功能等研究。
技术介绍
基因组技术与信息技术的结合,使得科研人员可以方便的获取所需要的海量的基因数据并深入的挖掘相关的遗传信息;如何从多样本高质量的测序数据中挖掘有用的变异信息,并把它们与已知的参考图谱进行有效的整合并提供相关领域的研究者们利用是一个重要的问题。基因组测序会产生海量数据,其中包含着不同维度的丰富变异信息,包括单个碱基的变异,如SNP,小片段的变异,如InDel,大片段的插入缺失,如SV等。SNP信息是基因组中多态性最好的分子标记之一,其在基因组中广泛存在,既可以出现在基因内区域,也可以出现在基因间区域。但是在实际利用中,SNP标记的直接检测还是有困难,需要利用芯片或者转化成CAPS或KASPR等其它标记,但是前者需要酶切,后者需要特定的反应系统。InDel相对来说比较容易直接转换成基于PCR扩增的分子标记,操作更为简便。SV则与很多重要基因组的变异有关。目前的水稻图谱,从最早的RFLP、到后来的SSR、单个样本的物理图谱、单个样本的序列图谱等,但是尚缺乏将多样本多维度的变异整合在同一个参考基因组上的多样本变异整合图谱。随着基因组测序技术飞速发展,伴随着测序成本的急剧下降和大量基因组数据的便于获取,如何将多样本的基因组数据与育种实践有效结合 ...
【技术保护点】
1.一种利用全基因组多样本多维度的变异信息创建变异整合图谱OsMS‑IVMap1.0的方法,按照如下步骤进行:1)通过基因组重测序获得候选样本的大量基因组reads信息,至少覆盖基因组长度10X以上;2)将上述reads通过常规的序列比对方法与参考基因组进行比对,获取reads的物理位置信息,并生成包含SNP和短片段InDel等变异信息的bam格式文件。3)从bam文件中提取SNP信息数据集;通过设置参数,过滤SNP信息,获得缺失数据最少的高质量SNP数据集;4)设置阈值,从bam文件中提取InDel信息,生成InDel数据集;5)利用NovoBreak或BreakDancer和Delly等软件将各样本基因组与日本晴比较,检测长度在100bp以上的大片段插入、缺失和倒位等结构变异即SV信息,生成SV数据集;6)统一SNP、InDel和SV这三个变异数据集的格式,生成如图1所示的格式;7)依据以上变异在参考基因组日本晴的物理位置信息,将上述变异位点分染色体进行线性排列,生成变异整合框架图,生成如图2所示的格式;8)对照框架图位置,将各个样本所包含的变异信息对照排列,空缺的部分用NA表示, ...
【技术特征摘要】
1.一种利用全基因组多样本多维度的变异信息创建变异整合图谱OsMS-IVMap1.0的方法,按照如下步骤进行:1)通过基因组重测序获得候选样本的大量基因组reads信息,至少覆盖基因组长度10X以上;2)将上述reads通过常规的序列比对方法与参考基因组进行比对,获取reads的物理位置信息,并生成包含SNP和短片段InDel等变异信息的bam格式文件。3)从bam文件中提取SNP信息数据集;通过设置参数,过滤SNP信息,获得缺失数据最少的高质量SNP数据集;4)设置阈值,从bam文件中提取InDel信息,生成InDel数据集;5)利用NovoBreak或BreakDancer和Dell...
【专利技术属性】
技术研发人员:郑天清,黎志康,徐建龙,王春超,王文生,赵秀琴,陈凯,
申请(专利权)人:中国农业科学院作物科学研究所,中国农业科学院深圳生物育种创新研究院,中国农业科学院深圳农业基因组研究所,
类型:发明
国别省市:北京,11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。