基于自动化CNN模型的小麦非生物胁迫性状SNP预测方法技术

技术编号:44315510 阅读:22 留言:0更新日期:2025-02-18 20:28
本发明专利技术涉及人工智能技术领域,具体是基于自动化CNN模型的小麦非生物胁迫性状SNP预测方法,该方法从GWAS Atlas数据库收集了与小麦相关的GWAS数据,并构建了一个高质量的突变位点数据集;使用DNA原始序列、基于文本的特征以及基于结构的特征对数据集进行特征提取,使用SHAP方法对输入特征的重要性进行排序并辅助特征选择,解释预测模型的结果;然后构建了一个自动架构搜索框架,采用自动神经架构搜索,使模型在指定的搜索空间内进化,在验证集上实现最佳性能,并在测试集上评估模型的精确度、AUPR和AUC。本发明专利技术提供了一种高效、准确且可解释的深度学习框架,用于预测小麦生物胁迫相关的SNP,从而推动小麦抗逆育种和基因组学研究的发展。

【技术实现步骤摘要】

本专利技术涉及人工智能,具体是基于自动化cnn模型的小麦非生物胁迫性状snp预测方法。


技术介绍

1、单核苷酸多态性(snp)是基因组中最常见的变异类型,与作物的多种性状相关,包括抗病性和抗逆性。全基因组关联研究(gwas)是识别与特定性状相关的snp的主要方法之一。然而,尽管gwas在识别与生物胁迫抗性相关的主要数量性状位点(qtls)方面取得了显著进展,但仍有许多次要基因控制的snp未被识别。此外,高质量基因型数据的缺乏限制了gwas的进一步应用。

2、近年来,深度学习(dl)技术在生物信息学和基因组学领域取得了显著进展。dl方法,特别是卷积神经网络(cnn),在从dna序列中提取结构和局部特征方面表现出色,已被用于预测功能位点、识别遗传变异和预测复杂表型。例如,pau bellot等人使用dl预测人类基因组区域中的功能位点,swat-cnn使用dl识别与表型相关的snp,tlvar使用深度迁移学习模型预测人类基因组序列中的功能非编码变异。尽管这些方法在人类疾病预测中取得了成功,但它们在小麦基因型-表型研究中的应用仍然有限。

3本文档来自技高网...

【技术保护点】

1.基于自动化CNN模型的小麦非生物胁迫性状SNP预测方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于自动化CNN模型的小麦非生物胁迫性状SNP预测方法,其特征在于,在所述高质量数据集的构建中,包括:

3.根据权利要求2所述的基于自动化CNN模型的小麦非生物胁迫性状SNP预测方法,其特征在于,在所述使用随机森林模型计算每个特征的SHAP值的过程中,采用下式计算SHAP值:

4.根据权利要求3所述的基于自动化CNN模型的小麦非生物胁迫性状SNP预测方法,其特征在于,所述初始化搜索空间与参数,基于控制器生成子模型架构的步骤,包括:

...

【技术特征摘要】

1.基于自动化cnn模型的小麦非生物胁迫性状snp预测方法,其特征在于,包括以下步骤:

2.根据权利要求1所述的基于自动化cnn模型的小麦非生物胁迫性状snp预测方法,其特征在于,在所述高质量数据集的构建中,包括:

3.根据权利要求2所述的基于自动化cnn模型的小麦非生物胁迫性状snp预测方法,其特征在于,在所述使用随机森林模型计算每个特征的shap值的过程中,采用下式计算shap值:

4.根据权利要求3所述的基于自动化cnn模型的小麦非生物胁迫性状snp预测方法,其特征在于,所述初始化搜索空间与参数,基于控制器生成子模型架构的步骤,包括:

5.根据权利要求4所述的基...

【专利技术属性】
技术研发人员:蔡梦杰岳振宇高羽佳桂健峰鲁全高乐
申请(专利权)人:安徽农业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1