基于多组学数据和深度学习的育种方法、装置、设备制造方法及图纸

技术编号:34138546 阅读:29 留言:0更新日期:2022-07-14 17:14
本发明专利技术实施例公开了基于多组学数据和深度学习的育种方法、装置、设备,能够提高表型预测的准确度。其中,育种方法包括获取目标物种的生物遗传信息;其中,所述生物遗传信息包括多组学数据,所述多组学数据包括目标物种的表观基因组数据、转录组数据、基因功能注释数据中的至少一种、基因型数据和表型数据;根据所述生物遗传信息获取基于深度学习的基因组选择模型;根据所述基因组选择模型获取与目标物种的待测基因型信息对应的表型信息,以用于育种。种。种。

Breeding methods, devices and equipment based on multi omics data and deep learning

【技术实现步骤摘要】
基于多组学数据和深度学习的育种方法、装置、设备


[0001]本专利技术涉及生物
更具体地说,本专利技术涉及基于多组学数据和深度学习的育种方法、装置、设备和介质。

技术介绍

[0002]生物表型性状的预测在生物
具有广泛的应用,例如选择性育种、疾病控制等。以育种为例,选择性育种作为现代农业产业链中的重要环节,是获取优良农业品种的重要途径之一。在数字化信息时代背景下,传统经验育种模式逐渐发展成为更加精密的,依赖于高密度分子遗传标记的基因组选择(genomic selection,GS)辅助育种体系,在当前选择性育种领域中占据重要地位。该育种策略本质上是一门预测的科学,根据高通量测序的全基因组分子标记,依托表型预测模型辅助品种选择,实现了育种的精细化、信息化、定量化。
[0003]虽然基因组选择理论体系日渐成熟,在实践中取得了巨大的成就,然而当前关注的重点多集中于单一的基因组数据。由遗传信息传递到最终的表型还包括表观修饰、转录、翻译等多个中间过程,每一个中间过程都代表着一个模糊了遗传信息和性状之间联系的额外复杂水平,这表明当前的本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.基于多组学数据和深度学习的育种方法,其特征在于,包括:获取目标物种的生物遗传信息;其中,所述生物遗传信息包括多组学数据,所述多组学数据包括目标物种的表观基因组数据、转录组数据、基因功能注释数据中的至少一种、基因型数据和表型数据;根据所述生物遗传信息获取基于深度学习的基因组选择模型;根据所述基因组选择模型获取与目标物种的待测基因型信息对应的表型信息,以用于育种。2.根据权利要求1所述的育种方法,其特征在于,所述生物遗传信息还包括:根据所述多组学数据获取的组学背景信息、功能背景信息、功能调控网络信息中的至少一种;其中,所述组学背景信息包括非编码区序列的调控模式信息、编码区基因的表达模式信息和编码区基因的功能信息中的至少一种;所述功能背景信息包括单核苷酸多态性在非编码区的功能信息和单核苷酸多态性在编码区的功能信息;所述调控网络信息包括根据单核苷酸多态性、基因调控元件、基因、基因功能形成的调控信息。3.根据权利要求1所述的育种方法,其特征在于,所述生物遗传信息还包括组学背景信息、功能背景信息、功能调控网络信息;所述获取目标物种的生物遗传信息,包括:根据目标物种的样本群体信息获取所述多组学数据;根据所述表观基因组数据、所述转录组数据、所述基因功能注释数据获取所述组学背景信息;根据所述组学背景信息获取所述功能背景信息;根据所述功能背景信息获取所述功能调控网络信息。4.根据权利要求1所述的育种方法,其特征在于,根据所述生物遗传信息对选取的深度学习模型进行训练,获得所述基因组选择模型,包括:获取深度学习模型,所述深度学习模型包括输入层、输出层以及位于所述输入层和所述输出层之间的至少一个中间可见层和至少一个中间隐藏层;对所述深度学习模型各层的超参数进行优化,确定最优超参数,得到优化的深度学习模型;其中,所述超参数包括核函数、节点数、激活函数、丢弃率、正则化类型中的至少一种;根据所述生物遗传信息对所述优化的深度学习模型进行训练,得到所述基因组选择模型。5.根据权利要求4所述的育种方法,其特征在于,所述至少一个中间可见层包括第一中间可见层、第二中间可见层、第三中间可见层,所述至少一个隐藏层包括第一中间隐藏层、第二中间隐藏层、第三中间隐藏层;所述输入层、所述第一中间可见层、所述第二中间可见层、所述第三中间可见层、所述第一中间隐藏层、所述第二中间隐藏层、所述第三中间隐藏层、所述输出层依次连接;所述输入层的输入数据包括所述基因型数据;所述第一中间可见层的输入数据包括所述功能背景信息;所述第二中间可见层的输入数据包括所述组学背景信息;
所述第三中间可见层的输入数据包括所述调控网络信息;所述输出层的输入数据包括所述表型数据。6.根据权利要求1所述的育种方法,其特征在于,所述获取目标物种的生物遗传信息,包括:获取目标物种的样本群体信息;根据所述样本群体信息中的个...

【专利技术属性】
技术研发人员:刘毓文马文龙王超郑伟刚李奎唐中林
申请(专利权)人:中国农业科学院农业基因组研究所
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1