当前位置: 首页 > 专利查询>同济大学专利>正文

一种基于深度学习算法预测pre-mRNA剪切的方法及系统技术方案

技术编号:43803919 阅读:56 留言:0更新日期:2024-12-27 13:22
本申请涉及RNA剪切与深度学习技术领域,具体而言,涉及一种基于深度学习算法预测pre‑mRNA剪切的方法及系统,一定程度上可以解决现有方法,对于隐性的非经典的剪切位点预测能力较弱,在真实数据集上的准确率并不理想,预测速度较慢的问题。方法包括:基于公共数据库及RNA‑seq测序数据集,获取pre‑mRNA序列数据,同时标定pre‑mRNA序列数据中的剪切位点及非剪切位点;对pre‑mRNA序列数据进行预处理,得到生成模型所需的数据集,数据集包括训练集、验证集及测试集;搭建卷积神经网络与自注意力机制结合的神经网络模型,并使用训练集及验证集训练神经网络模型,得到最优神经网络模型;采用最优神经网络模型对测试集进行三分类预测,得到供/受体剪切位点及非剪切位点的概率。

【技术实现步骤摘要】

本申请涉及rna剪切与深度学习,具体而言,涉及一种基于深度学习算法预测pre-mrna剪切的方法及系统。


技术介绍

1、rna剪切(splicing)是一个复杂的生物学过程,主要是指从以一条dna模板链转录出的pre-mrna中将内含子去除,并将外显子拼接起来,最终生成mrna的过程。转录得到的产物,经过翻译形成相对应的蛋白质,发挥其特定的功能。由此可见,rna的正确剪切在基因表达调控过程中发挥了关键作用。rna的精准剪切主要依赖于在外显子和内含子交界处存在的有规律的碱基序列,一般为处于剪切供体(donor,内含子5端起始)处的二联碱基gu以及剪切受体(acceptor,内含子3’端起始)处的二联碱基ag。除此之外,位于pre-mrna上的其他motif如剪切分支点(branch point)、多嘧啶束(polypyrimidine tract)以及剪切沉默子和增强子(splicing silencer and enhancer)都会参与整个rna剪切的发生过程,如图9所示。

2、rna剪切是基因转录调控过程中关键的步骤,rna剪切是指编码蛋白本文档来自技高网...

【技术保护点】

1.一种基于深度学习算法预测pre-mRNA剪切的方法,其特征在于,包括:

2.如权利要求1所述的基于深度学习算法预测pre-mRNA剪切的方法,其特征在于,所述基于所述公共数据库及RNA-seq测序数据集,获取pre-mRNA序列数据,同时标定所述pre-mRNA序列数据中的剪切位点及非剪切位点,包括:

3.如权利要求2所述的基于深度学习算法预测pre-mRNA剪切的方法,其特征在于,所述对所述pre-mRNA序列数据进行预处理,得到生成模型所需的数据集,包括:

4.如权利要求3所述的基于深度学习算法预测pre-mRNA剪切的方法,其特征在于,所述对...

【技术特征摘要】

1.一种基于深度学习算法预测pre-mrna剪切的方法,其特征在于,包括:

2.如权利要求1所述的基于深度学习算法预测pre-mrna剪切的方法,其特征在于,所述基于所述公共数据库及rna-seq测序数据集,获取pre-mrna序列数据,同时标定所述pre-mrna序列数据中的剪切位点及非剪切位点,包括:

3.如权利要求2所述的基于深度学习算法预测pre-mrna剪切的方法,其特征在于,所述对所述pre-mrna序列数据进行预处理,得到生成模型所需的数据集,包括:

4.如权利要求3所述的基于深度学习算法预测pre-mrna剪切的方法,其特征在于,所述对所述剪切位点的位置信息中的每一位点的数据制作标签,包括:

5.如权利要求1所述的基于深度学习算法预测pre-mrna剪切的方法,...

【专利技术属性】
技术研发人员:张明唐雪琳余文迪
申请(专利权)人:同济大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1