【技术实现步骤摘要】
基于组织特异性的玉米可变剪接异构体功能预测系统
[0001]本专利技术涉及可变剪接异构体功能预测
,特别涉及一种基于组织特异性的玉米可变剪接异构体功能预测系统。
技术介绍
[0002]本部分的陈述仅仅是提供了与本专利技术相关的
技术介绍
,并不必然构成现有技术。
[0003]随着生物学的发展,与基因相关的研究对玉米育种改良、提高玉米品种质量起到了推动作用。基因功能预测在生物学中具有重要的地位,并且目前已经得到了广泛研究,而近年来,转录组方面的研究逐渐引起了重视,可变剪接异构体(isoform)是转录组的重要组成部分,准确地预测isoform的功能,对玉米育种、蛋白质变种功能研究都有着十分重要的意义。
[0004]专利技术人发现,目前已有许多方案利用isoform的组织特异性数据通过机器学习模型对isoform的功能进行预测;但是,这些现有isoform功能预测方法具有一定的局限性,这些预测方法往往只是简单地使用RNA
‑
seq数据得到isoform在不同玉米组织上的差异表达特征构成的特征向量,而并没有做到充分地利用组织特异性数据来提升isoform功能预测性能。
技术实现思路
[0005]为了解决现有技术的不足,本专利技术提供了一种基于组织特异性的玉米可变剪接异构体功能预测系统,通过在多个玉米组织层面构建多个isoform关联网络,并对这些网络进行融合来得到isoform功能关联网络,做到对isoform组织特异性的充分利用;通过基于多示例学习的非负矩阵分解技术,利 ...
【技术保护点】
【技术特征摘要】
1.一种基于组织特异性的玉米可变剪接异构体功能预测系统,其特征在于:包括:数据获取模块,被配置为:获取待预测isoform在不同玉米组织上的RNA
‑
seq数据、isoform序列数据、isoform与其从属基因的关联矩阵以及isoform从属基因的已知功能注释;组织特异性提取模块,被配置为:根据isoform在不同玉米组织上的RNA
‑
seq数据,构造各个组织的isoform共表达网络,根据自适应权重来进行加权整合,得到整合的isoform组织特异性关联网络;多组学数据融合模块,被配置为:根据isoform的序列数据构造序列相似度关联网络,并与isoform组织特异性关联网络进行融合,得到isoform功能关联网络;功能预测模块,被配置为:通过非负矩阵分解技术进行多示例学习,将已知isoform从属基因的已知功能注释进行分解,对isoform功能进行预测,同时使用isoform功能关联网络指导矩阵分解过程,将isoform层面的潜在功能注释聚合到基因层面,并将基因层面的功能注释向已知的功能注释对齐,最终学习得到isoform的功能预测结果。2.如权利要求1所述的基于组织特异性的玉米可变剪接异构体功能预测系统,其特征在于:从属基因的已知功能注释,包括:所需预测的isoform所属基因对于功能标签的注释情况,每一个基因具有一个功能注释向量,向量的长度为所有功能标签的数目,当基因具有第i个功能时,其注释向量的第i个元素为1,并且功能标签i在层次有向无环图中的所有祖先标签在该基因注释向量所对应的位置也为1;若不具有第i个功能时,其注释向量的第i个元素为0。3.如权利要求1所述的基于组织特异性的玉米可变剪接异构体功能预测系统,其特征在于:根据isoform在不同玉米组织上的表达数据,构造各个组织的isoform共表达网络,根据自适应权重来进行加权整合,得到整合的isoform组织特异性关联网络,包括:获取待预测isoform的在不同玉米组织上的表达谱向量;构造isoform在不同玉米组织上的isoform共表达网络;对不同玉米组织的isoform共表达网络进行融合,得到isoform功能关联网络。4.如权利要求3所述的基于组织特异性的玉米可变剪接异构体功能预测系统,其特征在于:获取待预测isoform在每个玉米组织中所有样本RNA
‑
seq数据中的FPKM值,对于每个组织,将每个isoform在所有样本上的FPKM值进行拼接,得到isoform在各个玉米组织上的表达谱向量;对于每个组织,计算任意两个isoform的表达谱向量的皮尔逊相关系数,得到每个玉米组织上的isoform的共表达网络矩阵;对每个组织上的isoform共表达网络赋予一个权重,并根据权重进行加权求和,进而得到整合的isoform组织特异性关联网络,其中,每个组织的isoform共表达网络权重将在训练中进行自适应学习。对每个组织isoform共表达网络进行整合,得到isoform组织特异性关联网络。
5.如权利要求1所述的基于组织特异性的玉米可变剪接异构体功能预测系统,其特征在于:根据isoform的序列数据构造序列相似度关联网络,并与isoform组织特异性关联网络进行融合,得到isoform功能关联网络,包括:对任意两个isoform所翻译的氨基酸序列计算序列相似度,得到isoform序列相似度网络;通过融合isoform组织特异性关联网络和isoform序列相似度网络,构造isoform的功能关联网络。6.如权利要求5所述的基于组织特异性的玉米可变剪接异构体功能预测系统,其特征在于:对任意两个isoform组织特异性关联网络矩阵对应值和isoform所翻译的氨基酸序列相似度网络矩阵对应值取最大值来得到isoform的功能关联网络矩阵,构造isoform的...
【专利技术属性】
技术研发人员:余国先,邱思超,王峻,闫中敏,崔立真,
申请(专利权)人:山东大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。