当前位置: 首页 > 专利查询>山东大学专利>正文

基于组织特异性的玉米可变剪接异构体功能预测系统技术方案

技术编号:34431619 阅读:11 留言:0更新日期:2022-08-06 16:09
本发明专利技术提供了一种基于组织特异性的玉米可变剪接异构体功能预测系统,通过对isoform在各个组织上的表达数据进行处理,构造多个组织的isoform共表达网络,并通过自适应权重来将各个组织的isoform共表达网络进行整合,可以得到高质量的isoform组织特异性关联网络;通过利用isoform序列数据构造isoform序列相似度网络,并将其与isoform组织特异性关联网络进行融合,可以得到更好的isoform功能关联网络;通过非负矩阵分解进行多示例学习,同时使用isoform功能关联网络来指导非负矩阵分解,从而实现了isoform的更精准和更全面功能预测。预测。预测。

【技术实现步骤摘要】
基于组织特异性的玉米可变剪接异构体功能预测系统


[0001]本专利技术涉及可变剪接异构体功能预测
,特别涉及一种基于组织特异性的玉米可变剪接异构体功能预测系统。

技术介绍

[0002]本部分的陈述仅仅是提供了与本专利技术相关的
技术介绍
,并不必然构成现有技术。
[0003]随着生物学的发展,与基因相关的研究对玉米育种改良、提高玉米品种质量起到了推动作用。基因功能预测在生物学中具有重要的地位,并且目前已经得到了广泛研究,而近年来,转录组方面的研究逐渐引起了重视,可变剪接异构体(isoform)是转录组的重要组成部分,准确地预测isoform的功能,对玉米育种、蛋白质变种功能研究都有着十分重要的意义。
[0004]专利技术人发现,目前已有许多方案利用isoform的组织特异性数据通过机器学习模型对isoform的功能进行预测;但是,这些现有isoform功能预测方法具有一定的局限性,这些预测方法往往只是简单地使用RNA

seq数据得到isoform在不同玉米组织上的差异表达特征构成的特征向量,而并没有做到充分地利用组织特异性数据来提升isoform功能预测性能。

技术实现思路

[0005]为了解决现有技术的不足,本专利技术提供了一种基于组织特异性的玉米可变剪接异构体功能预测系统,通过在多个玉米组织层面构建多个isoform关联网络,并对这些网络进行融合来得到isoform功能关联网络,做到对isoform组织特异性的充分利用;通过基于多示例学习的非负矩阵分解技术,利用已有基因与isoform关联和isoform潜在功能注释,将isoform功能聚合到基因层面,并向已知基因功能注释对齐,进而实现了对玉米isoform功能的更准确预测。
[0006]为了实现上述目的,本专利技术采用如下技术方案:
[0007]本专利技术第一方面提供了一种基于组织特异性的玉米可变剪接异构体功能预测系统。
[0008]一种基于组织特异性的玉米可变剪接异构体功能预测系统,包括:
[0009]数据获取模块,被配置为:获取待预测isoform在不同玉米组织上的RNA

seq数据、isoform序列数据、isoform与其从属基因的关联矩阵以及isoform从属基因的已知功能注释;
[0010]组织特异性提取模块,被配置为:根据isoform在不同玉米组织上的RNA

seq数据,构造各个组织的isoform共表达网络,根据自适应权重来进行加权整合,得到整合的isoform组织特异性关联网络;
[0011]多组学数据融合模块,被配置为:根据isoform的序列数据构造序列相似度关联网络,并与isoform组织特异性关联网络进行融合,得到isoform功能关联网络;
[0012]功能预测模块,被配置为:通过非负矩阵分解技术进行多示例学习,将已知isoform从属基因的已知功能注释进行分解,对isoform功能进行预测,同时使用isoform功能关联网络指导矩阵分解过程,将isoform层面的潜在功能注释聚合到基因层面,并将基因层面的功能注释向已知的功能注释对齐,最终学习得到isoform的功能预测结果。
[0013]本专利技术第二方面提供了一种计算机可读存储介质,其上存储有程序,该程序被处理器执行时实现如下步骤:
[0014]获取待预测isoform在不同玉米组织上的RNA

seq数据、isoform序列数据、isoform与其从属基因的关联矩阵以及isoform从属基因的已知功能注释;
[0015]根据isoform在不同玉米组织上的RNA

seq数据,构造各个组织的isoform共表达网络,根据自适应权重来进行加权整合,得到整合的isoform组织特异性关联网络;
[0016]根据isoform的序列数据构造序列相似度关联网络,并与isoform组织特异性关联网络进行融合,得到isoform功能关联网络;
[0017]通过非负矩阵分解技术进行多示例学习,将已知isoform从属基因的已知功能注释进行分解,对isoform功能进行预测,同时使用isoform功能关联网络指导矩阵分解过程,将isoform层面的潜在功能注释聚合到基因层面,并将基因层面的功能注释向已知的功能注释对齐,最终学习得到isoform的功能预测结果。
[0018]本专利技术第三方面提供了一种电子设备,包括存储器、处理器及存储在存储器上并可在处理器上运行的程序,所述处理器执行所述程序时实现如下步骤:
[0019]获取待预测isoform在不同玉米组织上的RNA

seq数据、isoform序列数据、isoform与其从属基因的关联矩阵以及isoform从属基因的已知功能注释;
[0020]根据isoform在不同玉米组织上的RNA

seq数据,构造各个组织的isoform共表达网络,根据自适应权重来进行加权整合,得到整合的isoform组织特异性关联网络;
[0021]根据isoform的序列数据构造序列相似度关联网络,并与isoform组织特异性关联网络进行融合,得到isoform功能关联网络;
[0022]通过非负矩阵分解技术进行多示例学习,将已知isoform从属基因的已知功能注释进行分解,对isoform功能进行预测,同时使用isoform功能关联网络指导矩阵分解过程,将isoform层面的潜在功能注释聚合到基因层面,并将基因层面的功能注释向已知的功能注释对齐,最终学习得到isoform的功能预测结果。
[0023]与现有技术相比,本专利技术的有益效果是:
[0024]1、本专利技术所述的基于组织特异性的玉米可变剪接异构体功能预测系统,处理并整合了isoform在不同玉米组织上的表达数据,做到了对isoform所具有的组织特异性的充分利用,有效提升了isoform功能预测效果;综合利用了isoform的多组学数据,提升了isoform功能预测的准确性。
[0025]2、本专利技术所述的基于组织特异性的玉米可变剪接异构体功能预测系统,使用了非负矩阵分解技术进行多示例学习,建模基因与isoform的多示例关系,利用已知基因功能注释来对isoform功能进行预测,实现了isoform功能的更精准和更全面预测。
[0026]本专利技术附加方面的优点将在下面的描述中部分给出,部分将从下面的描述中变得明显,或通过本专利技术的实践了解到。
附图说明
[0027]构成本专利技术的一部分的说明书附图用来提供对本专利技术的进一步理解,本专利技术的示意性实施例及其说明用于解释本专利技术,并不构成对本专利技术的不当限定。
[0028]图1为本专利技术实施例1提供的基于组织特异性的玉米可变剪接异构体功能预测系统的结构示意图。
具体实施方式
[0029]下面结合附图与实施例对本专利技术作进一步说明。
[0030]应该指出,以下详细说明本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种基于组织特异性的玉米可变剪接异构体功能预测系统,其特征在于:包括:数据获取模块,被配置为:获取待预测isoform在不同玉米组织上的RNA

seq数据、isoform序列数据、isoform与其从属基因的关联矩阵以及isoform从属基因的已知功能注释;组织特异性提取模块,被配置为:根据isoform在不同玉米组织上的RNA

seq数据,构造各个组织的isoform共表达网络,根据自适应权重来进行加权整合,得到整合的isoform组织特异性关联网络;多组学数据融合模块,被配置为:根据isoform的序列数据构造序列相似度关联网络,并与isoform组织特异性关联网络进行融合,得到isoform功能关联网络;功能预测模块,被配置为:通过非负矩阵分解技术进行多示例学习,将已知isoform从属基因的已知功能注释进行分解,对isoform功能进行预测,同时使用isoform功能关联网络指导矩阵分解过程,将isoform层面的潜在功能注释聚合到基因层面,并将基因层面的功能注释向已知的功能注释对齐,最终学习得到isoform的功能预测结果。2.如权利要求1所述的基于组织特异性的玉米可变剪接异构体功能预测系统,其特征在于:从属基因的已知功能注释,包括:所需预测的isoform所属基因对于功能标签的注释情况,每一个基因具有一个功能注释向量,向量的长度为所有功能标签的数目,当基因具有第i个功能时,其注释向量的第i个元素为1,并且功能标签i在层次有向无环图中的所有祖先标签在该基因注释向量所对应的位置也为1;若不具有第i个功能时,其注释向量的第i个元素为0。3.如权利要求1所述的基于组织特异性的玉米可变剪接异构体功能预测系统,其特征在于:根据isoform在不同玉米组织上的表达数据,构造各个组织的isoform共表达网络,根据自适应权重来进行加权整合,得到整合的isoform组织特异性关联网络,包括:获取待预测isoform的在不同玉米组织上的表达谱向量;构造isoform在不同玉米组织上的isoform共表达网络;对不同玉米组织的isoform共表达网络进行融合,得到isoform功能关联网络。4.如权利要求3所述的基于组织特异性的玉米可变剪接异构体功能预测系统,其特征在于:获取待预测isoform在每个玉米组织中所有样本RNA

seq数据中的FPKM值,对于每个组织,将每个isoform在所有样本上的FPKM值进行拼接,得到isoform在各个玉米组织上的表达谱向量;对于每个组织,计算任意两个isoform的表达谱向量的皮尔逊相关系数,得到每个玉米组织上的isoform的共表达网络矩阵;对每个组织上的isoform共表达网络赋予一个权重,并根据权重进行加权求和,进而得到整合的isoform组织特异性关联网络,其中,每个组织的isoform共表达网络权重将在训练中进行自适应学习。对每个组织isoform共表达网络进行整合,得到isoform组织特异性关联网络。
5.如权利要求1所述的基于组织特异性的玉米可变剪接异构体功能预测系统,其特征在于:根据isoform的序列数据构造序列相似度关联网络,并与isoform组织特异性关联网络进行融合,得到isoform功能关联网络,包括:对任意两个isoform所翻译的氨基酸序列计算序列相似度,得到isoform序列相似度网络;通过融合isoform组织特异性关联网络和isoform序列相似度网络,构造isoform的功能关联网络。6.如权利要求5所述的基于组织特异性的玉米可变剪接异构体功能预测系统,其特征在于:对任意两个isoform组织特异性关联网络矩阵对应值和isoform所翻译的氨基酸序列相似度网络矩阵对应值取最大值来得到isoform的功能关联网络矩阵,构造isoform的...

【专利技术属性】
技术研发人员:余国先邱思超王峻闫中敏崔立真
申请(专利权)人:山东大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1