一种基于全基因组选择烟草有害成分预测方法及应用技术

技术编号:26224718 阅读:68 留言:0更新日期:2020-11-04 10:59
本发明专利技术属于生物技术领域,具体涉及一种基于全基因组选择烟草有害成分预测方法及应用。本发明专利技术通过所述的方法步骤:获取候选预测模型中烟草全基因组数据;实时筛选优化烟草全基因组数据;生成烟草有害成分预测数据。可以实现烟草苗期(早期)的基因型数据预测获得烟草叶片中各种化学有害成分含量表型值数据,并且操作方便、快捷、高效、科学且结果精准可靠的特性。也就是说,通过本发明专利技术方案可以实现利用烟草苗期(早期)的基因型数据来计算或模拟出2年后经过繁杂检测而获得的烟草叶片中各种化学成分含量表型值的模型(方法),这种模型或方法具有方便、快捷、高效、科学且结果精准可靠的特性。

【技术实现步骤摘要】
一种基于全基因组选择烟草有害成分预测方法及应用
本专利技术属于生物
,具体涉及一种基于全基因组选择烟草有害成分预测方法及应用。
技术介绍
烟草是一种被广泛种植的叶用嗜好性经济作物,因其品质是由其内在化学成分的种类和含量决定的;其次,烟草及烟草制品的质量直接影响其经济价值,而烟草的化学成分则是决定烟草品质的内在关键因素。烟草叶片中的化学成分十分复杂,主要包含无机成分和天然有机成分两大类,研究表明,烟草烟叶和烟气中化学成分的总数高达5868种之多,其中烟草烟叶专有的成1872种,烟草烟叶和烟气共有的成1172种。随着技术和检测手段的不断创新发展,上述数字仍在不断增长,目前,针对烟草烟叶研究检测的化学有害成分指标也有数十种之多,且它们之间的关系十分复杂,既相互联系又相互对立,绝大部分化学有害成分性状属于多基因控制的复杂数量性状。此外,针对烟草烟叶中特异的有害成分尤其是经烘烤后叶片中有害成分的测定十分繁杂、耗时耗工、效率低、准确度低且不稳定。传统模式,倘若获得较准确的烟草烟叶有害成分值,需经过一个完整而漫长的烟草田间生育期,成熟后需进一步的分期分批采摘叶片、烘烤、分级、制样(研磨)、前处理后,需针对不同的检测物质(化学有害成分)而采用不同的检测仪器及相应的检测方法,其操作过程繁琐、效率低下、通量小且耗时较长。
技术实现思路
针对以上目前对检测物质(化学有害成分)而采用多种检测仪器及相应的检测方法,操作过程繁琐、效率低下、通量小、准确度低、不稳定且耗时较长的技术问题及缺陷,本专利技术提供一种基于全基因组选择烟草有害成分预测方法及应用,实现基于烟草苗期(早期)的基因型数据预测获得烟草叶片中各种化学有害成分含量表型值数据。本专利技术具体通过以下技术方案实现:一种基于全基因组选择烟草有害成分预测方法,所述的方法具体包括如下步骤:获取候选预测模型中烟草全基因组数据;实时筛选优化烟草全基因组数据;生成烟草有害成分预测数据。进一步地,于步骤获取候选预测模型中烟草全基因组数据之中,还包括如下步骤:设定候选预测模型的核心参数;建立候选预测模型;通过所述的候选预测模型,结合所述的核心参数,初步筛选所述的烟草全基因组数据。进一步地,于步骤实时筛选优化烟草全基因组数据之中,还包括如下步骤:建立全基因组选择模型;验证烟草候选预测模型的核心参数;通过所述的全基因组选择模型,结合所述的核心参数,实时二次筛选烟草全基因组数据。进一步地,所述的核心参数包括:分子标记数量、训练群体规模、训练群体与测试群体比例、模型预测精度值。进一步地,所述的全基因组选择模型包括:果胶全基因组选择模型、半纤维素全基因组选择模型、纤维素全基因组选择模型和木质素全基因组选择模型。进一步地,所述的烟草有害成分预测数据包括:果胶含量值数据、半纤维素含量值数据、纤维素含量值数据和木质素含量值数据;所述的烟草有害成分预测数据具体为烟草有害成分前体物含量值数据。进一步地,所述的果胶含量值数据的计算公式为:所述的半纤维素含量值数据的计算公式为:所述的纤维素含量值数据的计算公式为:所述的木质素含量值数据的计算公式为:其中,BayesBPEC果胶含量值全基因组选择模型,PEC为果胶,BayesB为候选预测模型,BayesAhCEL为半纤维素含量值全基因组选择模型,hCEL为半纤维素,BayesA为候选预测模型,BayesCCEL为纤维素含量值全基因组选择模型,CEL为纤维素,BayesC为候选预测模型,BayesCLIG为木质素含量值全基因组选择模型,LIG为木质素,n1为分子标记数量,n2为训练群体规模,n3为训练群体与测试群体比例,n4为模型预测精度值。为实现上述目的,本专利技术还提供一种基于全基因组选择烟草有害成分预测方法的应用,所述的基于全基因组选择烟草有害成分预测方法,应用于分析烟草群体苗期的基因型数据,并于全基因组范围内,预测出所述烟草群体中各烟草植株成熟烘烤后叶片中有害成分前体物含量的表型值数据;应用于分析烟草群体或烟草品种的基因型数据,通过在全基因组范围内,预测烟草成熟并烘烤后叶片中有害成分前体物含量值数据,于烟草苗期时,获取成熟并烘烤后叶片中有害成分前体物含量的表型值数据。为实现上述目的,本专利技术还提供一种基于全基因组选择烟草有害成分预测系统,所述的系统具体包括:获取单元,用于获取候选预测模型中烟草全基因组数据;筛选单元,用于实时筛选优化烟草全基因组数据;生成单元,用于生成烟草有害成分预测数据;所述的获取单元,还包括:设定模块,用于设定候选预测模型的核心参数;第一建模模块,用于建立候选预测模型;第一筛选模块,用于通过所述的候选预测模型,结合所述的核心参数,初步筛选所述的烟草全基因组数据;所述的筛选单元,还包括:第二建模模块,用于建立全基因组选择模型;验证模块,用于验证烟草候选预测模型的核心参数;第二筛选模块,通过所述的全基因组选择模型,结合所述的核心参数,实时二次筛选烟草全基因组数据。为实现上述目的,本专利技术还提供一种基于全基因组选择烟草有害成分预测平台,包括:处理器、存储器以及基于全基因组选择烟草有害成分预测平台控制程序;其中在所述的处理器执行所述的基于全基因组选择烟草有害成分预测平台控制程序,所述的基于全基因组选择烟草有害成分预测平台控制程序被存储在所述存储器中,所述的基于全基因组选择烟草有害成分预测平台控制程序,实现所述的基于全基因组选择烟草有害成分预测方法步骤。为实现上述目的,本专利技术还提供一种计算机可读取存储介质,所述计算机可读取存储介质存储有基于全基因组选择烟草有害成分预测平台控制程序,所述的基于全基因组选择烟草有害成分预测平台控制程序,实现所述的基于全基因组选择烟草有害成分预测方法步骤。为实现上述目的,本专利技术还提供一种芯片系统,所述芯片系统包括至少一个处理器,当程序指令在所述至少一个处理器中执行时,使得所述芯片系统执行所述的基于全基因组选择烟草有害成分预测方法步骤。与现有技术相比,本专利技术具有以下有益效果:本专利技术通过一种基于全基因组选择烟草有害成分预测方法及应用、系统、平台、存储介质,可以实现烟草苗期(早期)的基因型数据预测获得烟草叶片中各种化学有害成分含量表型值数据,并且操作方便、快捷、高效、科学且结果精准可靠的特性。也就是说,通过本专利技术方案可以实现利用烟草苗期(早期)的基因型数据来计算或模拟出2年后经过繁杂检测而获得的烟草叶片中各种化学成分含量表型值数据,通过本专利技术的方法或模型具有方便、快捷、高效、科学且结果精准可靠的特性。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术一种基于全基因组选择烟草有害成分预测方法流程架构示意图;<本文档来自技高网...

【技术保护点】
1.一种基于全基因组选择烟草有害成分预测方法,其特征在于,所述的方法具体包括如下步骤:/n获取候选预测模型中烟草全基因组数据;/n实时筛选优化烟草全基因组数据;/n生成烟草有害成分预测数据。/n

【技术特征摘要】
1.一种基于全基因组选择烟草有害成分预测方法,其特征在于,所述的方法具体包括如下步骤:
获取候选预测模型中烟草全基因组数据;
实时筛选优化烟草全基因组数据;
生成烟草有害成分预测数据。


2.根据权利要求1所述的一种基于全基因组选择烟草有害成分预测方法,其特征在于,于步骤获取候选预测模型中烟草全基因组数据之中,还包括如下步骤:
设定候选预测模型的核心参数;
建立候选预测模型;
通过所述的候选预测模型,结合所述的核心参数,初步筛选所述的烟草全基因组数据。


3.根据权利要求1所述的一种基于全基因组选择烟草有害成分预测方法,其特征在于,于步骤实时筛选优化烟草全基因组数据之中,还包括如下步骤:
建立全基因组选择模型;
验证烟草候选预测模型的核心参数;
通过所述的全基因组选择模型,结合所述的核心参数,实时二次筛选烟草全基因组数据。


4.据权利要求2或3所述的一种基于全基因组选择烟草有害成分预测方法,其特征在于,所述的核心参数包括:分子标记数量、训练群体规模、训练群体与测试群体比例、模型预测精度值。


5.根据权利要求3所述的一种基于全基因组选择烟草有害成分预测方法,其特征在于,所述的全基因组选择模型包括:
果胶全基因组选择模型、半纤维素全基因组选择模型、纤维素全基因组选择模型和木质素全基因组选择模型。


6.根据权利要求1所述的一种基于全基因组选择烟草有害成分预测方法,其特征在于,所述的烟草有害成分预测数据包括:果胶含量值数据、半纤维素含量值数据、纤维素含量值数据和木质素含量值数据;
所述的烟草有害成分预测数据具体为烟草有害成分前体物含量值数据。


7.根据权利要求6所述的一种基于全基因组选择烟草有害成分预测方法,其特征在于,所述的果胶含量值数据的计算公式为:



所述的半纤维素含量值数据的计算公式为:



所述的纤维素含量值数据的计算公式为:



所述的木质素含量值数据的计算公式为:



其中,BayeSBPEC果胶含量值全基因组选择模型,PEC为果胶,BayesB为候选...

【专利技术属性】
技术研发人员:童治军肖炳光方敦煌陈学军曾建敏焦芳婵吴兴富
申请(专利权)人:云南省烟草农业科学研究院
类型:发明
国别省市:云南;53

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1