一种定位偏分离性状的方法、装置及存储介质制造方法及图纸

技术编号:28298253 阅读:25 留言:0更新日期:2021-04-30 16:24
本发明专利技术提供一种定位偏分离性状的方法、装置及存储介质,方法包括:导入遗传群体待定位表型数据、遗传群体父母本及子代的基因型变异信息和基因组参考信息,对参考信息进行数据窗口划分,在多个数据窗口内对变异信息进行偏分离程度分析处理,得到待比较偏分离程度信息,从变异信息中提取相对性状的偏分离效应去除变异文件和偏分离效应增加变异文件,对其进行偏分离程度分析处理,得到第一和第二偏分离程度信息,将第一和第二偏分离程度信息与待比较偏分离程度信息进行比较,根据比较结果得到偏分离性状定位区段。本发明专利技术能够快速且准确地得到偏分离性状定位区段,解决了偏分离的性状不能定位的问题。

【技术实现步骤摘要】
一种定位偏分离性状的方法、装置及存储介质
本专利技术主要涉及基因数据处理
,具体涉及一种定位偏分离性状的方法、装置及存储介质。
技术介绍
正向遗传学其中一个主要的方法是基于杂交群体,对控制性状的相关区段进行定位。针对单基因控制的质量性状,常常构建BC1测交分离群体以及F2自交分离群体,如果显性性状和隐性性状的分离比经过卡方检验在BC1群体子代中呈现1:1的分离,而在F2群体子代中呈现1:2:1的分离,通常对简单质量性状的定位方法有QTL定位,BSA定位,这一些方法能表现出良好的效果。但是定位一些可能影响子代存活率的性状则可能效果不显著,因为这些性状会影响子代表型的分离,即产生分离群体表型偏分离的现象,目前对于偏分离的性状不能定位的问题还没有相应的解决办法。
技术实现思路
本专利技术所要解决的技术问题是针对现有技术的不足,提供一种定位偏分离性状的方法、装置及存储介质。本专利技术解决上述技术问题的技术方案如下:一种定位偏分离性状的数据处理方法,包括如下步骤:导入遗传群体待定位表型数据、遗传群体父母本及子代的基因型变异信息和基因组参考信息;基于数据窗口划分法对所述基因组参考信息进行划分,得到多个数据窗口;在多个数据窗口内对所述基因型变异信息进行偏分离程度分析处理,得到待比较偏分离程度信息;将所述遗传群体待定位表型数据中的遗传群体子代划分为不同性状的亚群,以划分得到的亚群为标准从所述基因型变异信息中提取相对性状的偏分离效应去除变异文件和偏分离效应增加变异文件;通过多个所述数据窗口对所述偏分离效应去除变异文件进行偏分离程度分析处理,得到第一偏分离程度信息,并通过多个所述数据窗口对所述偏分离效应增加变异文件进行偏分离程度分析处理,得到第二偏分离程度信息;将所述第一偏分离程度信息和所述第二偏分离程度信息与所述待比较偏分离程度信息进行比较,根据比较结果得到偏分离性状定位区段。本专利技术解决上述技术问题的另一技术方案如下:一种定位偏分离性状的装置,包括:导入模块,用于导入遗传群体待定位表型数据、遗传群体父母本及子代的基因型变异信息和基因组参考信息;窗口划分模块,用于基于数据窗口划分法对所述基因组参考信息进行划分,得到多个数据窗口;处理模块,用于在多个数据窗口内对所述基因型变异信息B进行偏分离程度分析处理,得到偏分离程度信息;将所述遗传群体待定位表型数据中的遗传群体子代划分为至少两个不同性状的亚群,以划分得到的亚群为标准从所述基因型变异信息B中提取相对性状的偏分离效应去除变异文件和偏分离效应增加变异文件;通过多个所述数据窗口对所述偏分离效应去除变异文件进行偏分离程度分析处理,得到第一待比较偏分离程度信息,并通过多个所述数据窗口对所述偏分离效应增加变异文件进行偏分离程度分析处理,得到第二待比较偏分离程度信息;比较模块,用于分别将所述第一待比较偏分离程度信息和所述第二待比较偏分离程度信息与所述偏分离程度信息进行比较,得到第一比较结果和第二比较结果,将第一比较结果和第二比较结果进行交集处理,得到偏分离性状定位区段。本专利技术解决上述技术问题的另一技术方案如下:一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,当所述计算机程序被处理器执行时,实现如上所述的定位偏分离性状的方法。本专利技术解决上述技术问题的另一技术方案如下:一种计算机可读存储介质,所述计算机可读存储介质存储有计算机程序,当所述计算机程序被处理器执行时,实现如上所述的定位偏分离性状的方法。本专利技术的有益效果是:将基因组参考信息进行窗口划分,得到多个用于对初始的基因型变异信息及性状划分后的基因型变异信息进行偏分离程度分析处理的数据窗口,得到对应的待比较偏分离程度信息和第一偏分离程度信息以及第二偏分离程度信息,将其进行比较分析,从而确定偏分离性状定位区段。附图说明图1为本专利技术实施例提供的定位偏分离性状的数据处理方法的流程示意图;图2为本专利技术实施例提供的定位偏分离性状的装置的功能模块示意图。具体实施方式以下结合附图对本专利技术的原理和特征进行描述,所举实例只用于解释本专利技术,并非用于限定本专利技术的范围。图1为本专利技术实施例提供的定位偏分离性状的数据处理方法的流程示意图。实施例1:如图1所示,一种定位偏分离性状的数据处理方法,包括如下步骤:导入遗传群体待定位表型数据、遗传群体父母本及子代的基因型变异信息和基因组参考信息;基于数据窗口划分法对所述基因组参考信息进行划分,得到多个数据窗口;在多个所述数据窗口内对所述基因型变异信息进行偏分离程度分析处理,得到待比较偏分离程度信息;将所述遗传群体待定位表型数据中的遗传群体子代划分为不同性状的亚群,以划分得到的亚群为标准从所述基因型变异信息中提取相对性状的偏分离效应去除变异文件和偏分离效应增加变异文件;通过多个所述数据窗口对所述偏分离效应去除变异文件进行偏分离程度分析处理,得到第一偏分离程度信息,并通过多个所述数据窗口对所述偏分离效应增加变异文件进行偏分离程度分析处理,得到第二偏分离程度信息;将所述第一偏分离程度信息和所述第二偏分离程度信息与所述待比较偏分离程度信息进行比较,根据比较结果得到偏分离性状定位区段。应理解地,“遗传群体父母本及子代的基因型变异信息”中“基因型变异信息”涉及的是遗传群体父母本及子代的共同信息。上述实施例中,将基因组参考信息进行窗口划分,得到多个用于对初始的基因型变异信息及性状划分后的基因型变异信息进行偏分离程度分析处理的数据窗口,得到对应的待比较偏分离程度信息和第一偏分离程度信息以及第二偏分离程度信息,将其进行比较分析,从而确定偏分离性状定位区段。在实施例1的基础上,实施例2:所述对所述基因组参考信息进行窗口划分,得到多个数据窗口的过程包括:根据预设步长值对所述基因组参考信息进行窗口划分,得到多个数据窗口,其中,所述预设步长值为100kb的长度。上述实施例中,由于基因组参考信息的长度较长,需要将其进行等长度划分,便于对初始的基因型变异信息及性状划分后的基因型变异信息进行信息索引及偏分离程度分析处理。在实施例1的基础上,实施例3:在多个数据窗口内对所述基因型变异信息进行偏分离程度分析处理前,还包括对所述基因型变异信息进行优化处理步骤,其过程包括:过滤掉所述基因型变异信息中子代基因型的假阳性位点;根据预设孟德尔遗传理论模型对过滤后的基因型变异信息B进行变异类型筛选,得到孟德尔分离比。具体地,根据父母本标记类型推测子代可能的标记类型,当不符合子代理论基因型的个体数占总群体的比例超过5%的位点可认为假阳性位点,可以进行剔除。具体地,根据定位性状的推测模型进行变异类型筛选,例如建立BC1分离模型则选取父母本只有其中一个为杂合的位点,建立F2分离模型则选取父母本中两个均为杂合的位点。根据分离模型确定孟德尔分离比,依据此分离比进行卡方检本文档来自技高网...

【技术保护点】
1.一种定位偏分离性状的数据处理方法,其特征在于,包括如下步骤:/n导入遗传群体待定位表型数据、遗传群体父母本及子代的基因型变异信息和基因组参考信息;/n基于数据窗口划分法对所述基因组参考信息进行划分,得到多个数据窗口;/n在多个所述数据窗口内对所述基因型变异信息进行偏分离程度分析处理,得到待比较偏分离程度信息;/n将所述遗传群体待定位表型数据中的遗传群体子代划分为不同性状的亚群,以划分得到的亚群为标准从所述基因型变异信息中提取相对性状的偏分离效应去除变异文件和偏分离效应增加变异文件;/n通过多个所述数据窗口对所述偏分离效应去除变异文件进行偏分离程度分析处理,得到第一偏分离程度信息,并通过多个所述数据窗口对所述偏分离效应增加变异文件进行偏分离程度分析处理,得到第二偏分离程度信息;/n将所述第一偏分离程度信息和所述第二偏分离程度信息与所述待比较偏分离程度信息进行比较,根据比较结果得到偏分离性状定位区段。/n

【技术特征摘要】
1.一种定位偏分离性状的数据处理方法,其特征在于,包括如下步骤:
导入遗传群体待定位表型数据、遗传群体父母本及子代的基因型变异信息和基因组参考信息;
基于数据窗口划分法对所述基因组参考信息进行划分,得到多个数据窗口;
在多个所述数据窗口内对所述基因型变异信息进行偏分离程度分析处理,得到待比较偏分离程度信息;
将所述遗传群体待定位表型数据中的遗传群体子代划分为不同性状的亚群,以划分得到的亚群为标准从所述基因型变异信息中提取相对性状的偏分离效应去除变异文件和偏分离效应增加变异文件;
通过多个所述数据窗口对所述偏分离效应去除变异文件进行偏分离程度分析处理,得到第一偏分离程度信息,并通过多个所述数据窗口对所述偏分离效应增加变异文件进行偏分离程度分析处理,得到第二偏分离程度信息;
将所述第一偏分离程度信息和所述第二偏分离程度信息与所述待比较偏分离程度信息进行比较,根据比较结果得到偏分离性状定位区段。


2.根据权利要求1所述的定位偏分离性状的方法,其特征在于,所述基于数据窗口划分法对所述基因组参考信息进行划分,得到多个数据窗口的过程包括:
根据预设步长值对所述基因组参考信息进行窗口划分,得到多个数据窗口,其中,所述预设步长值为100kb的长度。


3.根据权利要求1所述的定位偏分离性状的方法,其特征在于,在多个数据窗口内对所述基因型变异信息进行偏分离程度分析处理前,还包括对所述基因型变异信息进行优化处理步骤,其过程包括:
过滤掉所述基因型变异信息中子代基因型的假阳性位点;
根据预设孟德尔遗传理论模型对过滤后的基因型变异信息进行变异类型筛选,得到孟德尔分离比;
所述在多个数据窗口内对所述基因型变异信息进行偏分离程度分析处理,得到偏分离程度信息的过程包括:
在各个数据窗口中统计所述基因型变异信息在偏分离位点上的频数,根据所述频数得到偏分离位点个数;
对所述孟德尔分离比进行卡方检验,根据卡方检验结果的p值为标准得到偏分离位点变异信息,其中,所述p值小于0.001;
将所述偏分离位点个数和所述偏分离位点变异信息作为偏分离程度信息。


4.根据权利要求1所述的定位偏分离性状的方法,其特征在于,所述将所述遗传群体待定位表型数据中的遗传群体子代划分为至少两个不同性状的亚群,以划分得到的亚群为标准从所述基因型变异信息中提取相对性状的偏分离效应去除变异文件和偏分离效应增加变异文件的过程包括:
通过所述遗传群体待定位表型数据构建偏分离效应去除类群和构建偏分离效应增加类群;
以所述偏分离效应去除类群和所述偏分离效应增加类群为标准从所述基因型变异信息中提取相对性状的偏分离效应去...

【专利技术属性】
技术研发人员:邓秀新王楠宋谢天周银胡健兵谢源源叶俊丽
申请(专利权)人:华中农业大学
类型:发明
国别省市:湖北;42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1