RNA制造技术

技术编号:39670860 阅读:18 留言:0更新日期:2023-12-11 18:36
一种

【技术实现步骤摘要】
RNA甲基化修饰位点的鉴定及模型的生成方法和相关设备


[0001]本专利技术涉及生物信息处理
,尤其涉及一种
RNA
甲基化修饰位点的鉴定及模型的生成方法和相关设备


技术介绍

[0002]核糖核酸
(Ribonucleic Acid

RNA)
,由核糖核苷酸经磷酸二酯键缩合而成长链状分子,其存在于生物细胞以及部分病毒

类病毒中,用于作为遗传信息载体

[0003]随着科学技术的不断发展,人们发现
RNA
中存在着多种化学修饰

以甲基化修饰为例,目前已知的有5‑
甲胞嘧啶
(m5C)、N1

甲基腺嘌呤
(m1A)、N6

甲基腺嘌呤
(m6A)、
假尿嘧啶
(
ψ
)
以及5‑
羟甲基胞嘧啶
(hm5C)
等多种甲基化修饰的碱基
。m6A
是真核细胞
mRNA
最为常见的转录后
RNA
甲基化修饰,其广泛存在于动植物

细菌和病毒之中,且在多个生物过程中均有着重要作用,如
mRNA
剪切和转录

蛋白质翻译

维持基因组稳定等过程,其动态变化可以调节基因表达,影响信号通路,决定细胞命运

[0004]但是,目前<br/>RNA
甲基化修饰位点的鉴定准确性仍有待提高


技术实现思路

[0005]本专利技术解决的问题是提供一种
RNA
甲基化修饰位点的鉴定及模型的生成方法和相关设备,能够提高
RNA
甲基化修饰位点预测的准确性

[0006]为解决上述问题,本专利技术提供了一种
RNA
甲基化修饰位点鉴定模型的生成方法,包括:
[0007]获取参考基因组数据
、RNA
修饰位点数据和直接
RNA
测序数据;
[0008]从所述直接
RNA
测序数据中获取多个
RNA
片段;
[0009]基于所获取的
RNA
片段

所述参考基因组数据和所述
RNA
修饰位点数据,生成特征训练数据集;
[0010]采用所述特征训练数据集进行深度学习训练,获取
RNA
甲基化修饰位点鉴定模型

[0011]可选地,所述从所述直接
RNA
测序数据中获取多个
RNA
片段,包括:
[0012]采用预设的滑动窗口以预设步长在所述直接
RNA
测序数据中滑动,获取多个
RNA
片段

[0013]可选地,所述滑动窗口的长度为5‑
10
个核苷酸的长度,所述预设步长为1‑4个核苷酸的长度

[0014]可选地,所述基于所获取的
RNA
片段

所述参考基因组数据和所述
RNA
修饰位点数据,生成特征训练数据集,包括:
[0015]分别获取所述
RNA
片段在参考基因组中的定位特征

所述
RNA
片段的电信号特征

所述
RNA
片段的序列特征和所述
RNA
片段的结构特征,作为所述
RNA
片段对应的训练数据;多个
RNA
片段对应的训练数据,形成所述特征训练数据集

[0016]可选地,所述
RNA
片段在参考基因组中的定位特征包括:所述
RNA
片段在参考基因
组中的区域参数

修饰状态和转录参数

[0017]可选地,所述区域参数包括
3'UTR、5'UTR、Exon、Intron

CDS
中至少一项

[0018]可选地,所述修饰状态包括
m1A

m6A。
[0019]可选地,所述转录参数包括转录起始位点和转录终止位点

[0020]可选地,所述
RNA
片段的电信号特征包括所述
RNA
片段的电信号的信号强度

离散度和时间长度中至少一项

[0021]可选地,所述
RNA
片段的序列特征包括核苷酸序列

核苷酸组成

二核苷酸组成

三核苷酸组成
、k

spaced
核苷酸组成

累积核苷酸频率

位置特异性三核苷酸倾向性

伪二核苷酸组成

核苷酸化学性质

电离子相互作用赝势

三核苷酸电离子相互作用赝势

核苷酸物理性质

二核苷酸的自协方差

二核苷酸的互协方差

二核苷酸的自互协方差

三核苷酸的自协方差

三核苷酸的互协方差和三核苷酸的自互协方差中至少一项

[0022]可选地,所述核苷酸序列包括腺嘌呤

胞嘧啶

鸟嘌呤和尿嘧啶中至少一项

[0023]可选地,所述
RNA
片段的结构特征包括
RNA
甲基化酶复合物的结合特征
、RNA
二级结构特征和
RNA
三级结构特征中至少一项

[0024]可选地,所述
RNA
甲基化酶复合物的结合特征包括
RNA m6A
甲基化酶
METTL3

METTL14

RNA
底物结合的结构模型中的氢键相互作用

疏水相互作用

静电势能

盐桥和结合自由能中至少一项

[0025]可选地,所述
RNA
二级结构特征包括熔解温度

最低自由能

最低自由能构象的频率

热力学集合的自由能

热力学集合的多样性和最低自由能结构中至少一项

[0026]可选地,所述
RNA
甲基化修饰位点鉴定模型包括依次耦接的卷积层

本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种
RNA
甲基化修饰位点鉴定模型的生成方法,其特征在于,包括:获取参考基因组数据
、RNA
修饰位点数据和直接
RNA
测序数据;从所述直接
RNA
测序数据中获取多个
RNA
片段;基于所获取的
RNA
片段

所述参考基因组数据和所述
RNA
修饰位点数据,生成特征训练数据集;采用所述特征训练数据集进行深度学习训练,获取
RNA
甲基化修饰位点鉴定模型
。2.
根据权利要求1所述的
RNA
甲基化修饰位点鉴定模型的生成方法,其特征在于,所述从所述直接
RNA
测序数据中获取多个
RNA
片段,包括:采用预设长度的滑动窗口以预设步长在所述直接
RNA
测序数据中的
RNA
链上进行滑动,获取所述
RNA
链的多个子集,作为所述多个
RNA
片段
。3.
根据权利要求2所述的
RNA
甲基化修饰位点鉴定模型的生成方法,其特征在于,所述滑动窗口的长度为5‑
10
个核苷酸的长度,所述预设步长为1‑4个核苷酸的长度
。4.
根据权利要求1所述的
RNA
甲基化修饰位点鉴定模型的生成方法,其特征在于,所述基于所获取的
RNA
片段

所述参考基因组数据和所述
RNA
修饰位点数据,生成特征训练数据集,包括:获取所述
RNA
片段在参考基因组中的定位特征

所述
RNA
片段的电信号特征

所述
RNA
片段的序列特征和所述
RNA
片段的结构特征,作为所述
RNA
片段对应的训练数据;多个
RNA
片段对应的训练数据,形成所述特征训练数据集
。5.
根据权利要求4所述的
RNA
甲基化修饰位点鉴定模型的生成方法,其特征在于,所述
RNA
片段在参考基因组中的定位特征包括:所述
RNA
片段在参考基因组中的区域参数

修饰状态和转录参数
。6.
根据权利要求5所述的
RNA
甲基化修饰位点鉴定模型的生成方法,其特征在于,所述区域参数包括
3'UTR、5'UTR、Exon、Intron

CDS
中至少一项
。7.
根据权利要求5所述的
RNA
甲基化修饰位点鉴定模型的生成方法,其特征在于,所述修饰状态包括
m1A

m6A。8.
根据权利要求5所述的
RNA
甲基化修饰位点鉴定模型的生成方法,其特征在于,所述转录参数包括转录起始位点和转录终止位点
。9.
根据权利要求4所述的
RNA
甲基化修饰位点鉴定模型的生成方法,其特征在于,所述
RNA
片段的电信号特征包括所述
RNA
片段的电信号的信号强度

离散度和时间长度中至少一项
。10.
根据权利要求4所述的
RNA
甲基化修饰位点鉴定模型的生成方法,其特征在于,所述
RNA
片段的序列特征包括核苷酸序列

核苷酸组成

二核苷酸组成

三核苷酸组成
、k

spaced
核苷酸组成

累积核苷酸频率

位置特异性三核苷酸倾向性

伪二核苷酸组成

核苷酸化学性质

电离子相互作用赝势

三核苷酸电离子相互作用赝势

核苷酸物理性质

二核苷酸的自协方差

二核苷酸的互协方差

二核苷酸的自互协方差

三核苷酸的自协方差

三核苷酸的互协方差和三核苷酸的自互协方差中至少一项
。11...

【专利技术属性】
技术研发人员:王莹王靖方彭程
申请(专利权)人:苏州湃芮生物科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1