当前位置: 首页 > 专利查询>北京大学专利>正文

基于氨基酸序列的密码子优化在mRNA疫苗研发中的应用制造技术

技术编号:37494967 阅读:30 留言:0更新日期:2023-05-07 09:32
本发明专利技术公开了基于氨基酸序列的密码子优化在mRNA疫苗研发中的应用。基于目标抗原蛋白的氨基酸序列,对其CDS在密码子适应指数(CAI)水平上进行优化得到HighestCAI序列,在最小折叠自由能(MFE)水平上进行优化得到LowestMFE序列,再以HighestCAI序列作为祖先序列进行MFE的定向优化,在某一个或某几个世代分别取MFE值最低的序列作为兼顾翻译效率和mRNA稳定性的优化序列,最终将这些序列通过细胞水平的蛋白表达验证,获得稳定高表达的CDS序列应用于mRNA疫苗的设计。本发明专利技术采用不同方式的密码子优化策略以提高mRNA疫苗转导机体后产生有效抗原量,为进一步优化疫苗生产提供了指导。为进一步优化疫苗生产提供了指导。为进一步优化疫苗生产提供了指导。

【技术实现步骤摘要】
基于氨基酸序列的密码子优化在mRNA疫苗研发中的应用


[0001]本专利技术属于生物
,涉及mRNA疫苗的制备,具体涉及一种通过优化密码子设计mRNA疫苗的方法。

技术介绍

[0002]群体免疫或社区免疫已被提议作为一项保护弱势群体的战略,可以通过过去感染或接种疫苗的免疫来建立。现有的针对高致病性新型冠状病毒SARS

CoV

2(severe acute respiratory syndrome coronavirus

2)的疫苗主要有传统的灭活疫苗(Sinopharm

BBIBP

CorV,Sinovac

CoronaVac,Covaxin

BBV152),为针对整个病毒经过灭活处理后的疫苗;同时也有蛋白疫苗(Novavax

NVX

CoV2373)以及病毒载体疫苗(Johnson&Johnson Janssen

Ad26.COV2.S,Oxford

AstraZeneca

AZD1222/ChAdOx1,Sputnik V

Gam

COVID

Vac

rAd26/rAd5)等,这些主要是针对病毒的刺突蛋白(spike protein,S蛋白)全长或受体结合域(RBD);还有mRNA疫苗(Pfizer

BioNTech Comirnaty

BNT162b2&Moderna

mRNA

1273),此类疫苗是通过一定的技术手段,将体外转录编码特定蛋白的mRNA或编码某一病原的特定基因的RNA导入体内,在体内翻译表达蛋白,作为抗原激活集体的免疫,此类疫苗显示出较优越的免疫效果以及应用前景。此外,现有的研究数据表明,由于SARS

CoV

2S蛋白分布在病毒表面,且具有较高的免疫原性,以上提及的疫苗接种后产生的中和抗体主要是针对S蛋白,故S蛋白在疫苗生产制备中尤为关键。
[0003]到目前为止,SARS

CoV

2已经发生了多次突变,产生了若干变种。世卫组织将SARS

CoV

2变种分为两类:VOC(variants of concern)和VOI(variants of interest)。其中备受关注的VOC包括Alpha(B.1.1.7)、Beta(B.1.351)、Gamma(P.1)、Delta(B.1.617.2)、Omicron(B.1.1.529);被监测的VOI包括Epsilon(B.1.427/B.1.429)、Zeta(P.2)、Eta(B.1.525)、Theta(P.3)、Iota(B.1.526/B.1.526.1)、Kappa(B.1.617)、Delta Plus(B.1.617.2.1)、Lambda(C.37)和Mu(B.1.621)。SARS

CoV

2变种的出现进一步限制了疫苗的成功和自然免疫,因为它们包含基因组改变,特别是S蛋白编码区,与以前流行的毒株相比,这些改变增加了它们的适应能力。SARS

CoV

2S蛋白是4种主要的病毒结构蛋白之一,由S1和S2两个亚基组成。N端S1亚基包含物种特异性的受体结合域(receptor binding domain,RBD),在流行的变种中观察到的大多数增强适合性的氨基酸突变都在该结构域内,它们的出现可能通过逃避自然免疫和疫苗诱导免疫而影响病毒的传播能力、毒性和再感染率。因此,研究针对SARS

CoV

2变种S蛋白的疫苗有助于更新改进疫苗配方和治疗方案,以遏制病毒的传播。

技术实现思路

[0004]针对目前现有mRNA疫苗技术中存在的蛋白表达水平不是很高的现象,本专利技术采用不同方式的密码子优化的策略,以提高mRNA疫苗转导机体后产生有效抗原量,为进一步优化疫苗生产提供指导。
[0005]密码子的选择是设计mRNA疫苗的一个重要考虑因素,因为不同的密码子使用会影响mRNA翻译效率和mRNA稳定性,从而影响抗原的表达。在本专利技术的实施例中,基于新冠病毒的S蛋白,尝试对其CDS的密码子适应指数(codon adaptation index,CAI)以及最小折叠自由能(minimum folding energy,MFE)进行优化,最终得到了稳定高表达的CDS序列应用于mRNA疫苗的设计。
[0006](一)CAI水平的优化
[0007]mRNA翻译效率的提升意味着细胞可以通过合成更少的mRNA就可以维持原有的蛋白表达水平。基因的翻译延伸速率是决定基因翻译效率的重要因素之一。在翻译延伸的过程中,A

site上tRNA的结合是主要的限速步骤。由于不同密码子对应的tRNA胞内浓度不同,所以不同密码子解码所需要的时间也存在较大差异。一般认为,生物体内的基因往往经历了较强的翻译效率选择,所以其编码序列(CDS)上的密码子往往与细胞内的tRNA存在共演化关系,共演化的结果即CDS上的不同密码子的使用频率与胞内tRNA的供给相符合。所以我们通过对密码子使用水平的分析就可以找出较高翻译效率的密码子用于后续的优化设计。
[0008]同义密码子相对使用频率(relative synonymous codon usage,RSCU)可以用于反映氨基酸所对应的同义密码子的相对使用情况。计算过程如下:
[0009][0010]其中,RSCU
ij
代表第i个氨基酸的第j种密码子的相对使用频率,X
ij
代表第i个氨基酸的第j种密码子的出现次数,n
i
为第i个氨基酸所对应的密码子的数目。根据RSCU值我们可以计算得到每个密码子对应的相对适应度w
ij
,即当前密码子对应的RSCU值与氨基酸所对应的使用频率最高的密码子的比值:
[0011][0012]w
ij
值在0与1之间,越接近1表示密码子适应性越高。结合基因的mRNA水平表达量,我们可以估计细胞内所有mRNA的密码子使用频率,再根据上述过程计算w
ij
值。具体计算如下:
[0013][0014]其中,Codon
ln
代表某一密码子l在第n个基因上的出现次数,TPM
n
代表该基因在宿主组织或细胞中的mRNA表达水平,m为基因的总数。TPM(Transcripts Per Kilobase of exon model per Million mapped reads)为每本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种mRNA疫苗的设计方法,其特征在于,基于氨基酸序列通过优化密码子设计mRNA疫苗序列,包括:1)基于目标抗原蛋白的氨基酸序列,对其编码序列CDS进行密码子适应指数CAI优化,得到HighestCAI序列,其中在统计密码子数目时引入基因表达量TPM对每条转录本进行加权,即:其中,X
ij
代表第i个氨基酸的第j种密码子的出现次数,Codon
ln
代表某一密码子l在第n个基因上的出现次数,TPM
n
代表该基因在宿主组织或细胞中的mRNA表达水平,m为基因的总数;之后根据X
ij
计算同义密码子相对使用频率RSCU:其中,RSCU
ij
代表第i个氨基酸的第j种密码子的相对使用频率,n
i
为第i个氨基酸所对应的密码子的数目;根据RSCU值计算得到每个密码子对应的相对适应度w
ij
,即当前密码子对应的RSCU值与氨基酸所对应的使用频率最高的密码子的比值:w
ij
值在0与1之间,越接近1表示密码子适应性越高;基因的CAI值即为CDS上各个密码子所对应的w
ij
的几何平均数,选取CAI值最高即密码子适应性最优的HighestCAI序列;2)通过MFE遗传优化算法对目标抗原蛋白序列的CDS组成进行优化迭代以提高其mRNA的稳定性,获得最小折叠自由能MFE最低的LowestMFE序列,步骤如下:2a)根据目的抗原蛋白的氨基酸序列,随机生成N条对应的CDS序列作为祖先群体;2b)对群体中的每条序列分别生成M个子序列,每个子序列中随机引入m个同义突变;2c)计算群体中所有序列对应的MFE值,并保留MFE值最低的N条,完成群体的一次世代演替;2d)将步骤2b)至2c)循环T次,或者最近的50轮演替中群体序列的最低MFE值没有发生改变,输出最后的群体序列...

【专利技术属性】
技术研发人员:钱朝晖陆剑昝富文吴鑫凯单科家
申请(专利权)人:北京大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1