一种牦牛基因组测序数据的基因型填充方法技术

技术编号:32969801 阅读:43 留言:0更新日期:2022-04-09 11:33
本发明专利技术公开了一种牦牛基因组测序数据的基因型填充方法,根据牦牛深度基因组测序数据进行分子标记提取,低密度重测序分子标记数据的格式转换,基于聚类分析对牦牛群体进行归类分群;利用各分类群内部个体间的遗传关系及估计的遗传参数,以隐马尔科夫模型为基础建立基因型填充模型,估计缺失值的最佳可能性基因型,针对小群体进行宏观预测;最后整理得到整体大群牦牛基因组填充后的基因型数据。本发明专利技术利用牦牛小群体遗传结构强于整体遗传关系的背景,结合隐马尔科夫预测模型和逐轮填充技术提高牦牛基因组测序数据填充的准确率。提高牦牛基因组测序数据填充的准确率。提高牦牛基因组测序数据填充的准确率。

【技术实现步骤摘要】
一种牦牛基因组测序数据的基因型填充方法


[0001]本专利技术涉及基因组信息填充
,特别是一种牦牛基因组测序数据的基因型填充方法。

技术介绍

[0002]全基因组测序(Whole Genome Sequencing,WGS)是对细胞或生物体所有的基因组进行测序,获得完整的基因组信息。全基因组测序数据可以找到基因与表型之间的联系,在挖掘动植物重要经济性状相关的功能基因、分析遗传机制等方面有重要意义。
[0003]我国牦牛主要分布在青藏高原海拔3000米以上的高寒草原及高山峡谷区域,有着耐高寒和耐低氧的优良性状,是牧民生活依赖的重要生产资料。由于传统牦牛饲养方式造成的长期过度繁殖和近亲繁殖,家养牦牛的繁殖能力、生长速度、成年体型和产奶量下降,给当地畜牧业的发展造成了影响。对全基因组测序数据进行分析,可以找到与生长性状相关的候选基因,但是牦牛的全基因组测序数据一般有较多缺失值,需要利用基因型填充的方法填充缺失值。
[0004]基因型填充方法的基本原理是根据参考群体提供的基因型信息,构建出参考群体和目标群体之间共享的单倍型信息,比本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种牦牛基因组测序数据的基因型填充方法,其特征在于,包括以下步骤:1)根据已有的牦牛基因型数据对牦牛群体进行聚类和归类,以分类群体作为基础群体;2)利用隐马尔科夫模型和群体内部遗传结构关系及遗传参数,对每个分类群体内部的未知基因型可能性概率进行估计,最终以可能性最大的基因型作为最后的预测结果;3)整合各个分类群体的基因型数据,如果依然有未知基因型数据,继续重复步骤1)至步骤2),直至全部分类群体的基因型数据得到完全填充。2.根据权利要求1所述的牦牛基因组测序数据的基因型填充方法,其特征在于,所述步骤1)具体包括:将牦牛基因型数据的基因型多态数据SNP转换成Hapmap、bed或者numeric格式,利用现有的K

means和Cluster两种聚类方式综合判定牦牛个体的具体分类群体,即两种聚类方式同时认定个体属于同一类群,否则个体被归入...

【专利技术属性】
技术研发人员:王嘉博秦婕钟金城王会柴志欣王海波
申请(专利权)人:西南民族大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1