System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 基于深度学习和异构网络的可解释基因组选择方法及系统技术方案_技高网

基于深度学习和异构网络的可解释基因组选择方法及系统技术方案

技术编号:41289585 阅读:8 留言:0更新日期:2024-05-11 09:38
本公开涉及数据信息处理技术领域,提出了一种基于深度学习和异构网络的可解释基因组选择方法及系统,利用DTInet和DeepR2cov方法,构建异构网络,解释基因组、环境和性状之间的相互作用和关联。然后引入基于Transformer编码器的网络嵌入,将基因组和性状数据嵌入到低维向量中。利用得到的矩阵嵌入,基于深度学习的全基因组选择,采用神经网络层来捕捉基因之间的关系,并通过全连接层进行性状预测,根据基因与性状的关系挑选出对性状预测具有影响的基因;我们使用了RATE事后解释方法,使模型具有可解释性。本公开大大提高性状预测的准确性,并对基因型数据与性状的重要性进行度量。

【技术实现步骤摘要】

本公开涉及数据信息处理相关,具体地说,是涉及一种基于深度学习和异构网络的可解释基因组选择方法及系统


技术介绍

1、本部分的陈述仅仅是提供了与本公开相关的
技术介绍
信息,并不必然构成在先技术。

2、基因组选择是一种标记辅助选择,它在线性回归模型中结合了整个基因组的密集分子标记,然后通过已知基因型和性状信息的个体构建预测模型。基因组选择可以进行早期个体性状的预测和选择,从而加快育种进程,节约大量时间成本。近年来,基因组选择已经彻底改变了世界范围内的育种计划。然而,由于动植物育种的复杂性,现有的基因组选择方法在部分性状预测任务上表现不佳,因此开发更好的基因组选择模型是一项重要的任务。

3、在早期,heslot等人将机器学习应用在基因组选择,比较了小麦、大麦、拟南芥和玉米数据集中的许多基因组选择方法的表现。然而,基因组数据包含数百万个基因和变异位点,且其中只有一小部分与性状相关,导致现有基因组选择方法表现不佳。因此,如何准确地选择和提取与目标性状相关的特征是一个具有挑战性的问题。

4、专利技术人在研究中发现,近年来基于深度学习的基因组选择受到了研究者的关注。然而,由于现有的深度学习模型的层数不足以表示基因组数据中复杂的环境和性状特征,存在环境和性状特征提取不足的问题。因此,需要进一步优化特征提取方法,以全面考虑环境和性状对基因组选择的影响。其次,异构网络中的节点语义特征也没有有效地利用,最后,深度学习的“黑匣子”性质导致无法对遗传变异和性状之间的关系进行解释,无法准确地解释为什么某个遗传变异会对某个性状产生影响,也无法确定哪些遗传变异是重要的。


技术实现思路

1、本公开为了解决上述问题,提出了一种基于深度学习和异构网络的可解释基因组选择方法及系统,能够自动构建异构网络,大大提高性状预测的准确性,并对基因型数据与性状的重要性进行度量。

2、为了实现上述目的,本公开采用如下技术方案:

3、本公开第一方面提供了基于深度学习和异构网络的可解释基因组选择方法,包括如下步骤:

4、获取基因组、性状和环境数据,利用dtinet和deepr2cov构建异构网络,通过异构网络表示基因组、性状和环境数据之间的关系;

5、针对异构网络提取的基因、环境和性状的特征信息,进行特征信息的矩阵嵌入,得到基因组和环境的嵌入表示;

6、利用得到的矩阵嵌入,基于深度学习的全基因组选择,采用神经网络层来捕捉基因之间的关系,并通过全连接层进行性状预测,根据基因与性状的关系挑选出对性状预测具有影响的基因;

7、利用rate的事后可解释方法对遗传变异与性状之间的关系进行解释,筛选出关键基因。

8、在一种可能的实施方式中,利用先进的dtinet和deepr2cov方法构建一个复杂的异构网络,所述dtinet用于学习异构网络中每个节点的特征的低维向量表示,基于学习后得到的低维向量表示,通过向量空间投影方案预测新的关联路径;deepr2cov从异构网络中提取元路径,提取的元路径用于传输至编码器,学习得到异构网络节点的低维表示向量。

9、在一种可能的实施方式中,异构网络由多个不同类型的网络组成的网络结构,它可以用来表示基因组、环境和性状之间的关系。利用异构网络表示六种关联:基因性状关联、基因环境关联、性状环境关联、基因相互作用、性状相互作用和环境相互作用关联。然后将这6种网络联合起来,构建总异构网络g=(v,e),其中v和e表示异构网络的节点集和边集。

10、在一种可能的实施方式中,引入基于transformer编码器的网络嵌入模块,将基因组和性状数据嵌入到低维向量中,进行数据降维和特征提取。

11、在一种可能的实施方式中,利用基于深度学习的全基因组选择和可解释方法融合基因组、性状和环境信息,使用rate事后解释方法,计算遗传关联,并使用rate作为重要性度量,以解释遗传变异与性状之间的关系,使模型具有可解释性。

12、本公开第二方面提供基于深度学习和异构网络的可解释基因组选择系统,包括:

13、异构网络构建模块,被配置为用于获取基因组、性状和环境数据,利用dtinet和deepr2cov构建异构网络,通过异构网络表示基因组、性状和环境数据之间的关系;

14、网络嵌入模块,被配置为针对异构网络提取的基因、环境和性状的特征信息,进行特征信息的矩阵嵌入,得到基因组和环境的嵌入表示;

15、全基因组选择模块,被配置为利用得到的矩阵嵌入,基于深度学习的全基因组选择,采用神经网络层来捕捉基因之间的关系,并通过全连接层进行性状预测,根据基因与性状的关系挑选出对性状预测具有影响的基因;

16、事后可解释方法模块,被配置为利用rate的事后可解释方法对遗传变异与性状之间的关系进行解释,筛选出关键基因。

17、本公开第三方面提供一种电子设备,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成上述的基于深度学习和异构网络的可解释基因组选择方法中的步骤。

18、本公开第四方面提供一种计算机可读存储介质,用于存储计算机指令,所述计算机指令被处理器执行时,完成上述的基于深度学习和异构网络的可解释基因组选择方法中的步骤。

19、与现有技术相比,本公开的有益效果为:

20、本公开提供了一种基于深度学习和异构网络的可解释基因组选择方法及系统,该方法利用基于深度学习的全基因组选择和可解释方法融合基因组、性状和环境信息,更有效地进行性状预测。在异构网络构建模块,基于dtinet和deepr2cov整合关联关系来构建异构网络,整合了基因组、性状和环境的关联效应。此外,还利用transformer模型提取不同级别的特征,并进行网络嵌入。然后,采用神经网络层来捕捉基因之间的关系,并通过全连接层进行性状预测。最后,引入rate事后解释方法解释遗传变异和性状之间的关系,使模型具有可解释性。

21、本公开的优点以及附加方面的优点将在下面的具体实施例中进行详细说明。

本文档来自技高网...

【技术保护点】

1.基于深度学习和异构网络的可解释基因组选择方法,其特征在于,包括如下步骤:

2.如权利要求1所述的基于深度学习和异构网络的可解释基因组选择方法,其特征在于:

3.如权利要求2所述的基于深度学习和异构网络的可解释基因组选择方法,其特征在于:关联关系包括基因-性状关联、基因-环境关联、性状-环境关联、基因相互作用关联、性状相互作用关联和环境相互作用关联。

4.如权利要求1所述的基于深度学习和异构网络的可解释基因组选择方法,其特征在于:进行特征信息的矩阵嵌入,采用基于Transformer编码器的网络嵌入。

5.如权利要求4所述的基于深度学习和异构网络的可解释基因组选择方法,其特征在于:Transformer编码器包括两个子层,多头自注意力子层和全连接的前馈网络子层;

6.如权利要求1所述的基于深度学习和异构网络的可解释基因组选择方法,其特征在于:全基因组选择,过程如下:

7.如权利要求1所述的基于深度学习和异构网络的可解释基因组选择方法,其特征在于:

8.基于深度学习和异构网络的可解释基因组选择系统,其特征在于,包括:

9.一种电子设备,其特征在于,包括存储器和处理器以及存储在存储器上并在处理器上运行的计算机指令,所述计算机指令被处理器运行时,完成权利要求1-7任一项所述的基于深度学习和异构网络的可解释基因组选择方法中的步骤。

10.一种计算机可读存储介质,其特征在于,用于存储计算机指令,所述计算机指令被处理器执行时,完成权利要求1-7任一项所述的基于深度学习和异构网络的可解释基因组选择方法中的步骤。

...

【技术特征摘要】

1.基于深度学习和异构网络的可解释基因组选择方法,其特征在于,包括如下步骤:

2.如权利要求1所述的基于深度学习和异构网络的可解释基因组选择方法,其特征在于:

3.如权利要求2所述的基于深度学习和异构网络的可解释基因组选择方法,其特征在于:关联关系包括基因-性状关联、基因-环境关联、性状-环境关联、基因相互作用关联、性状相互作用关联和环境相互作用关联。

4.如权利要求1所述的基于深度学习和异构网络的可解释基因组选择方法,其特征在于:进行特征信息的矩阵嵌入,采用基于transformer编码器的网络嵌入。

5.如权利要求4所述的基于深度学习和异构网络的可解释基因组选择方法,其特征在于:transformer编码器包括两个子层,多头自注意力子层和全连接的前馈网络...

【专利技术属性】
技术研发人员:孔鲁粤张树段启龙吕莎翟洪生巩玲宋玮
申请(专利权)人:山东医学高等专科学校
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1