【技术实现步骤摘要】
RNA甲基化修饰位点的鉴定及模型的生成方法和相关设备
[0001]本专利技术涉及生物信息处理
,尤其涉及一种
RNA
甲基化修饰位点的鉴定及模型的生成方法和相关设备
。
技术介绍
[0002]核糖核酸
(Ribonucleic Acid
,
RNA)
,由核糖核苷酸经磷酸二酯键缩合而成长链状分子,其存在于生物细胞以及部分病毒
、
类病毒中,用于作为遗传信息载体
。
[0003]随着科学技术的不断发展,人们发现
RNA
中存在着多种化学修饰
。
以甲基化修饰为例,目前已知的有5‑
甲胞嘧啶
(m5C)、N1
‑
甲基腺嘌呤
(m1A)、N6
‑
甲基腺嘌呤
(m6A)、
假尿嘧啶
(
ψ
)
以及5‑
羟甲基胞嘧啶
(hm5C)
等多种甲基化修饰的碱基
。m6A
是真核细胞
mRNA
最为常见的转录后
RNA
甲基化修饰,其广泛存在于动植物
、
细菌和病毒之中,且在多个生物过程中均有着重要作用,如
mRNA
剪切和转录
、
蛋白质翻译
、
维持基因组稳定等过程,其动态变化可以调节基因表达,影响信号通路,决定细胞命运
。
[0004]但是,目前< ...
【技术保护点】
【技术特征摘要】
1.
一种
RNA
甲基化修饰位点鉴定模型的生成方法,其特征在于,包括:获取参考基因组数据
、RNA
修饰位点数据和直接
RNA
测序数据;从所述直接
RNA
测序数据中获取多个
RNA
片段;基于所获取的
RNA
片段
、
所述参考基因组数据和所述
RNA
修饰位点数据,生成特征训练数据集;采用所述特征训练数据集进行深度学习训练,获取
RNA
甲基化修饰位点鉴定模型
。2.
根据权利要求1所述的
RNA
甲基化修饰位点鉴定模型的生成方法,其特征在于,所述从所述直接
RNA
测序数据中获取多个
RNA
片段,包括:采用预设长度的滑动窗口以预设步长在所述直接
RNA
测序数据中的
RNA
链上进行滑动,获取所述
RNA
链的多个子集,作为所述多个
RNA
片段
。3.
根据权利要求2所述的
RNA
甲基化修饰位点鉴定模型的生成方法,其特征在于,所述滑动窗口的长度为5‑
10
个核苷酸的长度,所述预设步长为1‑4个核苷酸的长度
。4.
根据权利要求1所述的
RNA
甲基化修饰位点鉴定模型的生成方法,其特征在于,所述基于所获取的
RNA
片段
、
所述参考基因组数据和所述
RNA
修饰位点数据,生成特征训练数据集,包括:获取所述
RNA
片段在参考基因组中的定位特征
、
所述
RNA
片段的电信号特征
、
所述
RNA
片段的序列特征和所述
RNA
片段的结构特征,作为所述
RNA
片段对应的训练数据;多个
RNA
片段对应的训练数据,形成所述特征训练数据集
。5.
根据权利要求4所述的
RNA
甲基化修饰位点鉴定模型的生成方法,其特征在于,所述
RNA
片段在参考基因组中的定位特征包括:所述
RNA
片段在参考基因组中的区域参数
、
修饰状态和转录参数
。6.
根据权利要求5所述的
RNA
甲基化修饰位点鉴定模型的生成方法,其特征在于,所述区域参数包括
3'UTR、5'UTR、Exon、Intron
和
CDS
中至少一项
。7.
根据权利要求5所述的
RNA
甲基化修饰位点鉴定模型的生成方法,其特征在于,所述修饰状态包括
m1A
和
m6A。8.
根据权利要求5所述的
RNA
甲基化修饰位点鉴定模型的生成方法,其特征在于,所述转录参数包括转录起始位点和转录终止位点
。9.
根据权利要求4所述的
RNA
甲基化修饰位点鉴定模型的生成方法,其特征在于,所述
RNA
片段的电信号特征包括所述
RNA
片段的电信号的信号强度
、
离散度和时间长度中至少一项
。10.
根据权利要求4所述的
RNA
甲基化修饰位点鉴定模型的生成方法,其特征在于,所述
RNA
片段的序列特征包括核苷酸序列
、
核苷酸组成
、
二核苷酸组成
、
三核苷酸组成
、k
‑
spaced
核苷酸组成
、
累积核苷酸频率
、
位置特异性三核苷酸倾向性
、
伪二核苷酸组成
、
核苷酸化学性质
、
电离子相互作用赝势
、
三核苷酸电离子相互作用赝势
、
核苷酸物理性质
、
二核苷酸的自协方差
、
二核苷酸的互协方差
、
二核苷酸的自互协方差
、
三核苷酸的自协方差
、
三核苷酸的互协方差和三核苷酸的自互协方差中至少一项
。11...
【专利技术属性】
技术研发人员:王莹,王靖方,彭程,
申请(专利权)人:苏州湃芮生物科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。