一种化学修饰制造技术

技术编号:39732707 阅读:5 留言:0更新日期:2023-12-17 23:35
本发明专利技术公开了一种化学修饰

【技术实现步骤摘要】
一种化学修饰siRNA活性预测方法、装置及设备


[0001]本专利技术涉及
siRNA
活性预测
,尤其涉及一种化学修饰
siRNA
活性预测方法

装置及设备


技术介绍

[0002]小干扰
RNA(Small interfering RNA,siRNA)
是一种长度为
21

23
个碱基的双链非编码
RNA。
在生物体中,
siRNA
介导的
RNA
干扰通路
(RNA interference pathway,RNAi pathway)
可特异性降解
mRNA
,沉默基因

因此
siRNA
被设计成核苷酸药物,特异性地靶向致病基因,在
mRNA
水平上实现对疾病的治疗

传统药物主要为两大类,小分子和抗体药物,均是通过靶向蛋白发挥治疗效果

但目前获批的靶点蛋白不足
700
种,传统药物研发受到极大限制

与传统药物相比,
siRNA
药物具有靶标广泛

特异性强

研发周期短等优势

近年来已有5种
siRNA
药物上市,还有其他几种疗法正处于临床试验阶段

尽管
siRNA
药物具有重要的社会和战略意义,但药物递送,脱靶效应以及免疫毒性等问题,严重影响了药物活性,限制了药物开发及临床应用

[0003]RNA
修饰
(RNAmodification)

RNA
上的化学修饰,越来越多的证据表明对
siRNA
的磷酸

核糖或碱基添加化学修饰可改善
siRNA
药物的稳定性

特异性和安全性,进而提升
siRNA
药物活性

因此,合理的
siRNA
化学修饰是保障
siRNA
成药性的关键

早期依赖药物研发人员先验知识设计的化学修饰模版在实际应用中失败率较高,在时间和经济上消耗巨大

利用机器学习等方法设计高性能模型辅助化学修饰
siRNA
药物活性预测成为了药物研发的现实需求

[0004]目前已开发了许多不同的方法来预测或设计化学修饰
siRNA
药物活性,根据所采用的具体模型和策略,现有的方法主要分为两类
(
如图1所示
)

(1)
基于规则的化学修饰
siRNA
药物活性预测方法;
(2)
基于机器学习的化学修饰
siRNA
药物活性预测方法

基于规则的
siRNA
修饰设计主要包括标准模板化学
(Standard template chemistry,STC)
,增强的模板化学
(Enhanced stabilization chemistry,ESC)
等,这些修饰模版是研究人员依据从实验数据上观测到的修饰规则设计而来,并在临床验证后不断的优化更新
(Friedrich,M.et al.,BioDrugs 2022,36,549

571)。
这类遵循先验规则的方法,具有较高的靶向性和特异性,使得
siRNA
分子的合成更加简单和高效

但是基于规则的设计方案需要经过复杂的计算和分析,对研究人员的技术水平要求较高;同时观测到的化学修饰规则具有细胞或组织偏性,在实际应用中失败率较高,需要大量的实验和分析

[0005]基于机器学习的
siRNA
化学修饰预测方法目前只有两个,分别是基于支持向量机
(Support vectormachine,SVM)

SMEpred(Dar,S.Aet al.,RNABiol2016,13,1144

1151)
和基于偏最小二乘
(Partial least square,PLS)
回归的
Dong et al.(Dong et al.,Molecules 2022,27)。
这些方法基于已知的
siRNA
分子数据来学习其与药物活性
(
即沉默效率
)
之间的关系,然后用于预测新
siRNA
分子的沉默效率

这类机器学习方法灵活性高,不受规则限制;可自动化设计,提高了研究的效率;数据集包含不同组织和细胞的实验数据,模
型有较高的鲁棒性

但是
SMEpred

Dong et al.
都采用了特征提取的方式对
siRNA
的反义链进行数据表征,并作为模型的初始输入层
。SMEpred

Dong et al.
在特征提取过程中只考虑一组有限的特征,忽略
RNA
序列信息等影响药物活性的特征,因此,相应模型提取的信息缺乏多样性,模型效能受限于研究者对特征的选择;同时缺少模型可解释性,无法捕捉潜在的
siRNA
序列内在特性

[0006]综上,现有的预测模型无法精准地提供稳定,高效且安全的
siRNA
药物生产方案

基于规则的方法研究成本较高,需要大规模,多来源的湿实验来分析和验证;基于机器学习的方法尚处于起步阶段,在特征编码

机器学习算法的使用和搭建以及模型可解释性方面仍存在局限性


技术实现思路

[0007]本专利技术的目的在于克服现有基于机器学习的
siRNA
活性预测方法在构建模型时仅考虑单一特征,导致模型可解释性不足

准确度不足的问题,提供一种化学修饰
siRNA
活性预测方法

装置及设备,本专利技术通过获取
siRNA
的多维度特征,并基于预先建立的预测模型进行多维度特征融合与联合预测,显著提高了模型对化学修饰
siRNA
数据的表征能力,提高预测准确性

[0008]为了实现上述专利技术目的,本专利技术提供了以下技术方案:
[0009]一种化学修饰
siRNA
活性预测方法,包括:
[0010]获取目标
siRNA
的原始碱基序列与化学修饰信息,并基于所述本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.
一种化学修饰
siRNA
活性预测方法,其特征在于,包括:获取目标
siRNA
的原始碱基序列与化学修饰信息,并基于所述原始碱基序列检索所述目标
siRNA
的理化性质;对所述原始碱基序列

化学修饰信息与所述理化性质进行特征编码,采用预先构建的预测模型根据编码后的特征生成所述目标
siRNA
的沉默效率预测结果;其中,所述预先构建的预测模型,包括:特征融合子模型与分类子模型;所述特征融合子模型用于基于跨注意力机制对编码后的特征进行特征融合;所述分类子模型用于根据融合特征生成沉默效率预测结果
。2.
如权利要求1所述的化学修饰
siRNA
活性预测方法,其特征在于,所述化学修饰信息包括:正义链化学修饰信息与反义链化学修饰信息
。3.
如权利要求1所述的化学修饰
siRNA
活性预测方法,其特征在于,所述理化性质包括:分子量,
XLogP3
,氢键供体数,氢键受体数,精确质量,单一同位素质量,拓扑表面积,重原子数,复杂度,定义键立体中心计数
。4.
如权利要求1所述的化学修饰
siRNA
活性预测方法,其特征在于,所述分类子模型为两层卷积神经网络,包括:两层卷积子网络

两个全连接层与输出层
。5.
如权利要求4所述的化学修饰
siRNA
活性预测方法,其特征在于,每层所述卷积子网络包括:卷积层
、ReLU
激活函数和最大池化层
。6.
如权利要求5所述的化学修饰
siRNA
活性预测方法,其特征在于,所述卷积层采用
3x3
的卷积核,步长为1,并采用了1像素的填充
。7.
如权利要求1~6任一所述的化学修饰
siRNA
活性预测方法,其特征在于,通过以下方法预先构建所述预测模型,包括:建立所述预测模型的初始模型...

【专利技术属性】
技术研发人员:罗德伦张杨刘天元
申请(专利权)人:成都景润泽基因科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1