【技术实现步骤摘要】
【国外来华专利技术】用于基因编辑的AAV载体
[0001]相关申请的交叉引用
[0002]本申请要求
2020
年
12
月9日提交的美国临时专利申请号
63/123,112
和
2021
年8月
20
日提交的美国临时专利申请号
63/235,638
的优先权,其内容全文以引用方式并入本文
。
[0003]以引用方式并入序列表
[0004]本序列表段落申请包含序列表,该序列表通过
EFS
‑
WEB
以
ASCII
格式提交并且据此全文以引用方式并入
。
所述
ASCII
副本创建于
2021
年
12
月9日,名称为
SCRB
‑
028_02WO_SeqList_ST25.txt
,并且大小为
13MB。
技术介绍
[0005]基因编辑非常有希望用于治疗或预防许多遗传疾病
。
然而,将
CRISPR
基因编辑机制安全且靶向递送至期望的细胞中是实现治疗性有益效果所必需的
。
本领域仍需要在体外和
/
或体内将
CRISPR
基因编辑机制递送至细胞的组合物和方法
。
技术实现思路
[0006]本公开涉及用于将
CRISPR
核酸酶递送至细胞以修饰靶核酸的 />AAV
载体
。
[0007]在一些实施方案中,本公开提供了用于生产
AAV
转基因
(
例如转基因质粒
)
以及用于生产重组腺相关病毒
(AAV)
载体的多核苷酸
。
在一些实施方案中,本公开提供了编码第一腺相关病毒
(AAV)5'
反向末端重复
(ITR)
序列
、
第二
AAV 3'ITR
序列
、CRISPR
核酸酶
、
第一向导
RNA(gRNA)、
一个或多个启动子和任选的辅助元件的多核苷酸;所有这些都包含在能够掺入到单个
AAV
颗粒中的单个表达盒中
。
在其它实施方案中,多核苷酸包含编码第一
5'AAV ITR
序列
、
第二
3'AAV ITR
序列
、CRISPR
核酸酶
、
第一
gRNA、
第一启动子
、
第二启动子和任选的一种或多种辅助元件的序列
。
在另一些实施方案中,多核苷酸包含编码第一
5'AAV ITR
序列
、
第二
3'AAV ITR
序列
、CRISPR
核酸酶
、
第一
gRNA、
第二
gRNA、
第一启动子
、
第二启动子
、
第三启动子和任选的一种或多种辅助元件的序列
。
[0008]在一些实施方案中,编码
CRISPR
蛋白的序列和
gRNA
序列的组合长度小于约
3100
个
、
小于约
3090
个
、
小于约
3080
个
、
小于约
3070
个
、
小于约
3060
个
、
小于约
3050
个或小于约
3040
个核苷酸
。
在其它实施方案中,编码
CRISPR
蛋白序列和
gRNA
序列的多核苷酸的组合长度小于约
3040
个至约
3100
个核苷酸
。
[0009]在一些实施方案中,第一启动子和至少一种辅助元件的多核苷酸序列的组合长度大于至少约
1300
个
、
至少约
1350
个
、
至少约
1360
个
、
至少约
1370
个
、
至少约
1380
个
、
至少约
1390
个
、
至少约
1400
个
、
至少约
1500
个
、
至少约
1600
个核苷酸
、
至少
1650
个
、
至少约
1700
个
、
至少约
1750
个
、
至少约
1800
个
、
至少约
1850
个或至少约
1900
个核苷酸
。
在其它实施方案中,第一启动子
、
第二启动子和两种或更多种辅助元件的多核苷酸序列的组合长度大于至少约
1300
个至至少约
1900
个核苷酸
。
在一些实施方案中,第一启动子
、
第二启动子和两种或更多种辅助元件的多核苷酸序列的组合长度大于
1314
个核苷酸
。
在其它实施方案中,第一启动子
、
第二启动子和两种或更多种辅助元件的多核苷酸序列的组合长度大于
1381
个核苷酸
。
在一个实施方案中,第一启动子
、
第二启动子和两种或更多种辅助元件的多核苷酸序列占总多核苷酸序列长度的至少
25
%
、26
%
、27
%
、28
%
、29
%
、30
%
、31
%
、32
%
、33
%
、34
%或至少
35
%或更多
。
[0010]在一些实施方案中,多核苷酸的辅助元件选自聚
(A)
信号
、
基因增强子元件
、
内含子
、
转录后调控元件
、
核定位信号
(NLS)、
脱氨酶
、DNA
糖基化酶抑制剂
、CRISPR
介导的同源定向修复的刺激物和转录的激活因子或阻遏蛋白
。
在一些实施方案中,与不存在所述辅助元件的
CRISPR<本文档来自技高网...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.
一种多核苷酸,所述多核苷酸包含下列组分序列:
a.
第一
AAV
反向末端重复
(ITR)
序列;
b.
第二
AAV ITR
序列;
c.
第一启动子序列;
d.
编码
CRISPR
蛋白的序列;
e.
编码第一向导
RNA(gRNA)
的序列;和,
f.
任选地,至少一种辅助元件序列,其中所述多核苷酸被配置用于掺入重组腺相关病毒
(AAV)
中
。2.
根据权利要求1所述的多核苷酸,其中编码所述
CRISPR
蛋白和所述第一
gRNA
的所述序列的组合长度小于约
3100
个
、
小于约
3090
个
、
小于约
3080
个
、
小于约
3070
个
、
小于约
3060
个
、
小于约
3050
个或小于约
3040
个核苷酸
。3.
根据权利要求1或2所述的多核苷酸,其中所述第一启动子和所述至少一种辅助元件的所述序列具有大于至少约
1300
个
、
至少约
1350
个
、
至少约
1360
个
、
至少约
1370
个
、
至少约
1380
个
、
至少约
1390
个
、
至少约
1400
个
、
至少约
1500
个
、
至少约
1600
个核苷酸
、
至少
1650
个
、
至少约
1700
个
、
至少约
1750
个
、
至少约
1800
个
、
至少约
1850
个或至少约
1900
个核苷酸的组合长度
。4.
根据权利要求1或2所述的多核苷酸,其中所述第一启动子和所述至少一种辅助元件的所述序列具有大于
1314
个核苷酸的组合长度
。5.
根据权利要求1或2所述的多核苷酸,其中所述第一启动子和所述至少一种辅助元件的所述序列具有大于
1381
个核苷酸的组合长度
。6.
根据权利要求1至5中任一项所述的多核苷酸,其中所述第一启动子序列和编码所述
CRISPR
蛋白的所述序列可操作地连接
。7.
根据权利要求6所述的多核苷酸,其中所述第一启动子是
pol II
启动子
。8.
根据权利要求6或权利要求7所述的多核苷酸,其中所述第一启动子选自:聚泛素
C(UBC)
启动子
、
细胞巨化病毒
(CMV)
启动子
、
猿猴病毒
40(SV40)
启动子
、
鸡
β
‑
肌动蛋白启动子和兔
β
‑
珠蛋白剪接受体位点融合体
(CAG)、
具有细胞巨化病毒增强子的鸡
β
‑
肌动蛋白启动子
(CB7)、PGK
启动子
、Jens Tornoe(JeT)
启动子
、GUSB
启动子
、CBA
杂交体
(CBh)
启动子
、
延伸因子
‑1α
(EF
‑1α
)
启动子
、
β
‑
肌动蛋白启动子
、
劳斯肉瘤病毒
(RSV)
启动子
、
易沉默的脾脏病灶形成病毒
(SFFV)
启动子
、CMVd1
启动子
、
截短的人
CMV(tCMVd2)、
最小
CMV
启动子
、hepB
启动子
、
鸡
β
‑
肌动蛋白启动子
、HSV TK
启动子
、Mini
‑
TK
启动子
、
最小
IL
‑2启动子
、GRP94
启动子
、
超核心启动子
1、
超核心启动子
2、
超核心启动子
3、
腺病毒主要晚期
(AdML)
启动子
、MLC
启动子
、MCK
启动子
、GRK1
蛋白启动子
、Rho
启动子
、CAR
蛋白启动子
、hSyn
启动子
、U1a
启动子
、
核糖体蛋白大亚基
30(Rpl30)
启动子
、
核糖体蛋白小亚基
18(Rps18)
启动子
、CMV53
启动子
、
最小
SV40
启动子
、CMV53
启动子
、SFCp
启动子
、Mecp2
启动子
、pJB42CAT5
启动子
、MLP
启动子
、EFS
启动子
、MeP426
启动子
、MecP2
启动子
、MHCK7
启动子
、
β
‑
葡糖醛酸酶
(GUSB)
启动子
、CK7
启动子和
CK8e
启动子
。9.
根据权利要求8所述的多核苷酸,其中所述第一启动子是所述
UBC、CMV、SV40、CAG、CB7、PGK、JeT、GUSB、CB、EF
‑1α
、
β
‑
肌动蛋白
、RSV、SFFV、CMVd1、tCMVd2、
最小
CMV、
鸡
β
‑
肌动蛋白
、HSV TK、Mini
‑
TK、
最小
IL
‑
2、GRP94、
超核心启动子
1、
超核心启动子
2、MLC、MCK、GRK1
蛋白
Rho、CAR
蛋白
、hSyn、U1a、
核糖体蛋白大亚基
30(Rpl30)、
核糖体蛋白小亚基
18(Rps18)、CMV53、
最小
SV40、CMV53、SFCp、pJB42CAT5、MLP、EFS、MeP426、MecP2、MHCK7、CK7
或
CK8e
启动子的截短变体
。10.
根据权利要求7或权利要求8所述的多核苷酸,其中所述第一启动子序列具有少于约
400
个核苷酸
、
少于约
350
个核苷酸
、
少于约
300
个核苷酸
、
少于约
200
个核苷酸
、
少于约
150
个核苷酸
、
少于约
100
个核苷酸
、
少于约
80
个核苷酸或少于约
40
个核苷酸
。11.
根据权利要求7或权利要求8所述的多核苷酸,其中所述第一启动子序列具有约
40
个至约
585
个核苷酸
、
约
100
个至约
400
个核苷酸或约
150
个至约
300
个核苷酸
。12.
根据权利要求1至
11
中任一项所述的多核苷酸,其中所述第一启动子选自如表8中所示的
SEQ ID NO:40370
‑
40400
,或与其具有至少
85
%
、
至少
90
%
、
至少
95
%
、
至少
95
%
、
至少
96
%
、
至少
97
%
、
至少
98
%或至少
99
%同一性的序列
。13.
根据权利要求1至
12
中任一项所述的多核苷酸,其中所述第一启动子选自如表
24
中所示的
SEQ ID NO:41030
‑
41044
,或与其具有至少
85
%
、
至少
90
%
、
至少
95
%
、
至少
95
%
、
至少
96
%
、
至少
97
%
、
至少
98
%或至少
99
%同一性的序列
。14.
根据权利要求1至
13
中任一项所述的多核苷酸,其中所述至少一种辅助元件与编码所述
CRISPR
蛋白的所述序列可操作地连接
。15.
根据权利要求1至
14
中任一项所述的多核苷酸,所述多核苷酸还包含第二启动子
。16.
根据权利要求
15
所述的多核苷酸,其中所述第二启动子序列和编码所述第一
gRNA
的所述序列可操作地连接
。17.
根据权利要求
15
或权利要求
16
所述的多核苷酸,其中所述第二启动子是
pol III
启动子
。18.
根据权利要求
15
至
17
中任一项所述的多核苷酸,其中所述第二启动子选自
U6、mini U61、mini U62、mini U63、BiH1(
双向
H1
启动子
)、BiU6(
双向
U6
启动子
)、
大猩猩
U6、
恒河猴
U6、
人
7sk
和人
H1
启动子
。19.
根据权利要求
18
所述的多核苷酸,其中所述第二启动子是所述
U6、mini U61、mini U62、mini U63、BiH1、BiU6、
大猩猩
U6、
恒河猴
U6、
人
7sk
或人
H1
启动子的截短变体
。20.
根据权利要求
18
或权利要求
19
所述的多核苷酸,其中所述第二启动子序列具有少于约
250
个核苷酸
、
少于约
220
个核苷酸
、
少于约
200
个核苷酸
、
少于约
160
个核苷酸
、
少于约
140
个核苷酸
、
少于约
130
个核苷酸
、
少于约
120
个核苷酸
、
少于约
100
个核苷酸
、
少于约
80
个核苷酸或少于约
70
个核苷酸
。21.
根据权利要求
18
或权利要求
19
所述的多核苷酸,其中所述第二启动子序列具有约
70
个至约
245
个核苷酸
、
约
100
个至约
220
个核苷酸或约
120
个至约
160
个核苷酸
。22.
根据权利要求
15
至
21
中任一项所述的多核苷酸,其中所述第二启动子序列选自如表9中所示的
SEQ ID NO:40401
‑
40420
和
41010
‑
41029
,或与其具有至少
85
%
、
至少
90
%
、
至少
95
%
、
至少
95
%
、
至少
96
%
、
至少
97
%
、
至少
98
%或至少
99
%同一性的序列
。23.
根据权利要求
15
至
22
中任一项所述的多核苷酸,其中所述第二启动子增强所述第一
gRNA
的转录
。24.
根据权利要求
15
至
23
中任一项所述的多核苷酸,其中所述第一启动子和所述第二启动子的所述序列的组合长度大于至少约
1300
个
、
至少约
1350
个
、
至少约
1360
个
、
至少约
类
CRISPR
蛋白
。37.
根据权利要求
36
所述的多核苷酸,其中所述经编码的
CRISPR
蛋白是2类
V
型
CRISPR
蛋白
。38.
根据权利要求
37
所述的多核苷酸,其中所述经编码的2类
V
型
CRISPR
蛋白包含:
a.NTSB
结构域,所述
NTSB
结构域包含
QPASKKIDQNKLKPEMDEKGNLTTAGFACSQCGQPLFVYKLEQVSEKGKAYTNYFGRCNVAEHEKLILLAQLKPEKDSDEAVTYSLGKFGQ
的序列
(SEQ ID NO:41818)
或与其具有至少
80
%
、
至少
90
%
、
至少
95
%
、
至少
96
%
、
至少
97
%
、
至少
98
%或至少
99
%同一性的序列;
b.
螺旋
I
‑
II
结构域,所述螺旋
I
‑
II
结构域包含
RALDFYSIHVTKESTHPVKPLAQIAGNRYASGPVGKALSDACMGTIASFLSKYQDIIIEHQKVVKGNQKRLESLRELAGKENLEYPSVTLPPQPHTKEGVDAYNEVIARVRMWVNLNLWQKLKLSRDDAKPLLRLKGFPSF
的序列
(SEQ ID NO:41819)
或与其具有至少
80
%
、
至少
90
%
、
至少
95
%
、
至少
96
%
、
至少
97
%
、
至少
98
%或至少
99
%同一性的序列;
c.
螺旋
II
结构域,所述螺旋
II
结构域包含
PLVERQANEVDWWDMVCNVKKLINEKKEDGKVFWQNLAGYKRQEALRPYLSSEEDRKKGKKFARYQLGDLLLHLEKKHGEDWGKVYDEAWERIDKKVEGLSKHIKLEEERRSEDAQSKAALTDWLRAKASFVIEGLKEADKDEFCRCELKLQKWYGDLRGKPFAIEAE
的序列
(SEQ ID NO:41820)
或与其具有至少
80
%
、
至少
90
%
、
至少
95
%
、
至少
96
%
、
至少
97
%
、
至少
98
%或至少
99
%同一性的序列;和
d.RuvC
‑
I
结构域,所述
RuvC
‑
I
结构域包含
SSNIKPMNLIGVDRGENIPAVIALTDPEGCPLSRFKDSLGNPTHILRIGESYKEKQRTIQAKKEVEQRRAGGYSRKYASKAKNLADDMVRNTARDLLYYAVTQDAMLIFENLSRGFGRQGKRTFMAER6QYTRMEDWLTAKLAYEGLPSKTYLSKTLAQYTSKTC
的序列
(SEQ ID NO:41821)
或与其具有至少
80
%
、
至少
90
%
、
至少
95
%
、
至少
96
%
、
至少
97
%
、
至少
98
%或至少
99
%同一性的序列
。39.
根据权利要求
38
所述的多核苷酸,其中所述经编码的2类
V
型
CRISPR
蛋白包含
OBD
‑
I
结构域,所述
OBD
‑
I
结构域包含
QEIKRINKIRRRLVKDSNTKKAGKTGPMKTLLVRVMTPDLRERLENLRKKPENIPQ
的序列
(SEQ ID NO:41822)
或与其具有至少
80
%
、
至少
90
%
、
至少
95
%
、
至少
96
%
、
至少
97
%
、
至少
98
%或至少
99
%同一性的序列
。40.
根据权利要求
38
或权利要求
39
所述的多核苷酸,其中所述经编码的2类
V
型
CRISPR
蛋白包含
OBD
‑
II
结构域,所述
OBD
‑
II
结构域包含
NSILDISGFSKQYNCAFIWQKDGVKKLNLYLIINYFKGGKLRFKKIKPEAFEANRFYTVINKKSGEIVPMEVNFNFDDPNLIILPLAFGKRQGREFIWNDLLSLETGSLKLANGRVIEKTLYNRRTRQDEPALFVALTFERREVLD
的序列
(SEQ ID NO:41823)
或与其具有至少
80
%
、
至少
90
%
、
至少
95
%
、
至少
96
%
、
至少
97
%
、
至少
98
%或至少
99
%同一性的序列
。
41.
根据权利要求
38
至
40
中任一项所述的多核苷酸,其中所述经编码的2类
V
型
CRISPR
蛋白包含螺旋
I
‑
I
结构域,所述螺旋
I
‑
I
结构域包含
PISNTSRANLNKLLTDYTEMKKAILHVYWEEFQKDPVGLMSRVA
的序列
(SEQ ID NO:41824)
或与其具有至少
80
%
、
至少
90
%
、
至少
95
%
、
至少
96
%
、
至少
97
%
、
至少
98
%或至少
99
%同一性的序列
。42.
根据权利要求
38
至
41
中任一项所述的多核苷酸,其中所述经编码的2类
V
型
CRISPR
蛋白包含
TSL
结构域,所述
TSL
结构域包含
SNCGFTITSADYDRVLEKLKKTATGWMTTINGKELKVEGQITYYNRYKRQNVVKDLSVELDRLSEESVNNDISSWTKGRSGEALSLLKKRFSHRPVQEKFVCLNCGFETH
的序列
(SEQ ID NO:41825)
或与其具有至少
80
%
、
至少
90
%
、
至少
95
%
、
至少
96
%
、
至少
97
%
、
至少
98
%或至少
99
%同一性的序列
。43.
根据权利要求
38
至
42
中任一项所述的多核苷酸,其中所述经编码的2类
V
型
CRISPR
蛋白包含
RuvC
‑
II
结构域,所述
RuvC
‑
II
结构域包含
ADEQAALNIARSWLFLRSQEYKKYQTNKTTGNTDKRAFVETWQSFYRKKLKEVWKPAV
的序列
(SEQ ID NO:41826)
或与其具有至少
80
%
、
至少
90
%
、
至少
95
%
、
至少
96
%
、
至少
97
%
、
至少
98
%或至少
99
%同一性的序列
。44.
根据权利要求
38
至
43
中任一项所述的多核苷酸,其中所述经编码的2类
V
型
CRISPR
蛋白包含
SEQ ID NO:145
的序列,或与其具有至少
80
%
、
至少
90
%
、
至少
95
%
、
至少
96
%
、
至少
97
%
、
至少
98
%或至少
99
%同一性的序列
。45.
根据权利要求
38
至
44
中任一项所述的多核苷酸,其中所述经编码的2类
V
型
CRISPR
蛋白在一个或多个结构域中包含至少一个修饰
。46.
根据权利要求
45
所述的多核苷酸,其中所述至少一个修饰包括:
a.
在结构域中的至少一个氨基酸取代;
b.
在结构域中的至少一个氨基酸缺失;
c.
在结构域中的至少一个氨基酸插入;或
d.(a)
至
(c)
的任何组合
。47.
根据权利要求
45
或权利要求
46
所述的多核苷酸,所述多核苷酸包含相对于
SEQ ID NO:41818
在所述
NTSB
结构域中的一个或多个氨基酸位置处的修饰,所述修饰选自
P2、S4、Q9、E15、G20、G33、L41、Y51、F55、L68、A70、E75、K88
和
G90。48.
根据权利要求
47
所述的多核苷酸,其中相对于
SEQ ID NO:41818
,在所述
NTSB
结构域中的一个或多个氨基酸位置处的所述一个或多个修饰选自位置2处
G
的插入
、
位置4处
I
的插入
、
位置4处
L
的插入
、Q9P、E15S、G20D、
位置
30
处
S
的缺失
、G33T、L41A、Y51T、F55V、L68D、L68E、L68K、A70Y、A70S、E75A、E75D、E75P、K88Q
和
G90Q。49.
根据权利要求
45
至
48
中任一项所述的多核苷酸,所述多核苷酸相对于
SEQ ID NO:41819
包含在所述螺旋
I
‑
II
结构域中的一个或多个氨基酸位置处的修饰,所述修饰选自
I24、A25、Y29 G32、G44、S48、S51、Q54、I56、V63、S73、L74、K97、V100、M112、L116、G137、F138
和
S140。50.
根据权利要求
49
所述的多核苷酸,其中相对于
SEQ ID NO:41819
,在所述螺旋
I
‑
II
结构域中的一个或多个氨基酸位置处的所述一个或多个修饰选自位置
24
处
T
的插入
、
位置
25
处
C
的插入
、Y29F、G32Y、G32N、G32H、G32S、G32T、G32A、G32V、
位置
32
处
G
的缺失
、G32S、G32T、G44L、G44H、S48H、S48T、S51T、Q54H、I56T、V63T、S73H、L74Y、K97G、K97S、K97D、K97E、V100L、M112T、M112W、M112R、M112K、L116K、G137R、G137K、G137N、
位置
138
处
Q
的插入和
S140Q。51.
根据权利要求
45
至
50
中任一项所述的多核苷酸,所述多核苷酸相对于
SEQ ID NO:41820
包含在所述螺旋
II
结构域中的一个或多个氨基酸位置处的修饰,所述修饰选自
L2、V3、E4、R5、Q6、A7、E9、V10、D11、W12、W13、D14、M15、V16、C17、N18、V19、K20、L22、I23、E25、K26、K31、Q35、L37、A38、K41、R 42、Q43、E44、L46、K57、Y65、G68、L70、L71、L72、E75、G79、D81、W82、K84、V85、Y86、D87、I93、K95、K96、E98、L100、K102、I104、K105、E109、R110、D114、K118、A120、L121、W124、L125、R126、A127、A129、I133、E134、G135、L136、E138、D140、K141、D142、E143、F144、C145、C147、E148、L149、K150、L151、Q152、K153、L158、E166
和
A167。52.
根据权利要求
51
所述的多核苷酸,其中相对于
SEQ ID NO:41820
,在所述螺旋
II
结构域中的一个或多个氨基酸位置处的所述一个或多个修饰选自位置2处
A
的插入
、
位置2处
H
的插入
、
位置2处
L
的缺失和位置3处
V
的缺失
、V3E、V3Q、V3F、
位置3处
V
的缺失
、
位置3处
D
的插入
、V3P、E4P、
位置4处
E
的缺失
、E4D、E4L、E4R、R5N、Q6V、
位置6处
Q
的插入
、
位置7处
G
的插入
、
位置9处
H
的插入
、
位置9处
A
的插入
、VD10、
位置0处
T1
的插入
、
位置
10
处
V
的缺失
、
位置
10
处
F
的插入
、
位置
11
处
D
的插入
、
位置
11
处
D
的缺失
、D11S、
位置
12
处
W
的缺失
、W12T、W12H、
位置
12
处
P
的插入
、
位置
13
处
Q
的插入
、
位置
12
处
G
的插入
、
位置
13
处
R
的插入
、W13P、W13D、
位置
13
处
D
的插入
、W13L、
位置
14
处
P
的插入
、
位置
14
处
D
的插入
、
位置
14
处
D
的缺失和位置
15
处
M
的缺失
、
位置
15
处
M
的缺失
、
位置
16
处
T
的插入
、
位置
17
处
P
的插入
、N18I、V19N、V19H、K20D、L22D、I23S、E25C、E25P、
位置
25
处
G
的插入
、K26T、K27E、K31L、K31Y、Q35D、Q35P、
位置
37
处
S
的插入
、
位置
37
处
L
的缺失和位置
38
处
A
的缺失
、K41L、
位置
42
处
R
的插入
、
位置
43
处
Q
的缺失和位置
44
处
E
的缺失
、L46N、K57Q、Y65T、G68M、L70V、L71C、L72D、L72N、L72W、L72Y、E75F、E75L、E75Y、G79P、
位置
79
处
E
的插入
、
位置
81
处
T
的插入
、
位置
81
处
R
的插入
、
位置
81
处
W
的插入
、
位置
81
处
Y
的插入
、
位置
82
处
W
的插入
、
位置
82
处
Y
的插入
、W82G、W82R、K84D、K84H、K84P、K84T、V85L、V85A、
位置
85
处
L
的插入
、Y86C、D87G、D87M、D87P、I93C、K95T、K96R、E98G、L100A、K102H、I104T、I104S、I104Q、K105D、
位置
109
处
K
的插入
、E109L、R110D、
位置
110
处
R
的缺失
、D114E、
位置
114
处
D
的插入
、K118P、A120R、L121T、W124L、L125C、R126D、A127E、A127L、A129T、A129K、I133E、
位置
133
处
C
的插入
、
位置
134
处
S
的插入
、
位置
134
处
G
的插入
、
位置
135
处
R
的插入
、G135P、L136K、L136D、L136S、L136H、
位置
138
处
E
的缺失
、D140R、
位置
140
处
D
的插入
、
位置
141
处
P
的插入
、
位置
142
处
D
的插入
、
位置
143
处
E
的缺失
+
位置
144
处
F
的缺失
、
位置
143
处
Q
的插入
、F144K、
位置
144
处
F
的缺失
、
位置
144
处
F
的缺失和位置
145
处
C
的缺失
、C145R、
位置
145
处
G
的插入
、C145K、C147D、
位置
148
处
V
的插入
、E148D、
位置
149
处
H
的插入
、L149R、K150R、L151H、Q152C、K153P、L158S、E166L
和位置
167
处
F
的插入
。53.
根据权利要求
45
至
52
中任一项所述的多核苷酸,所述多核苷酸相对于
SEQ ID NO:41821
包含在所述
RuvC
‑
I
结构域中的一个或多个氨基酸位置处的修饰,所述修饰选自
I4、K5、P6、M7、N8、L9、V12、G49、K63、K80、N83、R90、M125
和
L146。54.
根据权利要求
53
所述的多核苷酸,其中相对于
SEQ ID NO:41821
,在所述
RuvC
‑
I
结构域中的一个或多个氨基酸位置处的所述一个或多个修饰选自位置4处
I
的插入
、
位置5处
S
的插入
、
位置6处
T
的插入
、
位置6处
N
的插入
、
位置7处
R
的插入
、
位置7处
K
的插入
、
位置8处
H
的插入
、
位置8处
S
的插入
、V12L、G49W、G49R、S51R、S51K、K62S、K62T、K62E、V65A、K80E、N83G、R90H、R90G、M125S、M125A、L137Y、
位置
137
处
P
的插入
、
位置
141
处
L
的缺失
、L141R、L141D、
位
置
142
处
Q
的插入
、
位置
143
处
R
的插入
、
位置
143
处
N
的插入
、E144N、
位置
146
处
P
的插入
、L146F、P147A、K149Q、T150V、
位置
152
处
R
的插入
、H153
的插入
、T155Q、
位置
155
处
H
的插入
、
位置
155
处
R
的插入
、
位置
156
处
L
的插入
、
位置
156
处
L
的缺失
、
位置
156
处
W
的插入
、
位置
157
处
A
的插入
、
位置
157
处
F
的插入
、A157S、Q158K、
位置
159
处
Y
的缺失
、T160Y、T160F、
位置
161
处
I
的插入
、S161P、T163P、
位置
163
处
N
的插入
、C164K
和
C164M。55.
根据权利要求
45
至
54
中任一项所述的多核苷酸,所述多核苷酸相对于
SEQ ID NO:41822
包含在所述
OBD
‑
I
结构域中的一个或多个氨基酸位置处的修饰,所述修饰选自
I3、K4、R5、I6、N7、K8、K15、D16、N18、P27、M28、V33、R34、M36、R41、L47、R48、E52、P55
和
Q56。56.
根据权利要求
55
所述的多核苷酸,其中相对于
SEQ ID NO:41822
,在所述
OBD
‑
I
结构域中的一个或多个氨基酸位置处的所述一个或多个修饰选自位置3处
G
的插入
、I3G、I3E、
位置4处
G
的插入
、K4G、K4P、K4S、K4W、K4W、R5P、
位置5处
P
的插入
、
位置5处
G
的插入
、R5S、
位置5处
S
的插入
、R5A、R5P、R5G、R5L、I6A、I6L、
位置6处
G
的插入
、N7Q、N7L、N7S、K8G、K15F、D16W、
位置
16
处
F
的插入
、F18
的插入
、
位置
27
处
P
的插入
、M28P、M28H、V33T、R34P、M36Y、R41P、L47P、
位置
48
处
P
的插入
、E52P、
位置
55
处
P
的插入
、
位置
55
处
P
的缺失和位置
56
处
Q
的缺失
、Q56S、Q56P、
位置
56
处
D
的插入
、
位置
56
处
T
的插入和
Q56P。57.
根据权利要求
45
至
56
中任一项所述的多核苷酸,所述多核苷酸相对于
SEQ ID NO:41823
包含在所述
OBD
‑
II
结构域中的一个或多个氨基酸位置处的修饰,所述修饰选自
S2、I3、L4、K11、V24、K37、R42、A53、T58、K63、M70、I82、Q92、G93、K110、L121、R124、R141、E143、V144
和
L145。58.
根据权利要求
57
所述的多核苷酸,其中相对于
SEQ ID NO:41823
,在所述
OBD
‑
II
结构域中的一个或多个氨基酸位置处的所述一个或多个修饰选自位置2处
S
的缺失
、I3R、I3K、
位置3处
I
的缺失和
L4
的缺失
、
位置4处
L
的缺失
、K11T、
位置
24
处
P
的插入
、K37G、R42E、
位置
53
处
S
的插入
、
位置
58
处
R
的插入
、
位置
63
处
K
的缺失
、M70T、I82T、Q92I、Q92F、Q92V、Q92A、
位置
93
处
A
的插入
、K110Q、R115Q、L121T、
位置
124
处
A
的插入
、
位置
141
处
R
的插入
、
位置
143
处
D
的插入
、
位置
143
处
A
的插入
、
位置
144
处
W
的插入和位置
145
处
A
的插入
。59.
根据权利要求
45
至
58
中任一项所述的多核苷酸,所述多核苷酸相对于
SEQ ID NO:41825
包含在所述
TSL
结构域中的一个或多个氨基酸位置处的修饰,所述修饰选自
S1、N2、C3、G4、F5、I7、K18、V58、S67、T76、G78、S80、G81、E82、S85、V96
和
E98。60.
根据权利要求
59
所述的多核苷酸,其中相对于
SEQ ID NO:41825
,在所述
OBD
‑
II
结构域中的一个或多个氨基酸位置处的所述一个或多个修饰选自位置1处
M
的插入
、
位置2处
N
的缺失
、
位置2处
V
的插入
、C3S、
位置4处
G
的插入
、
位置4处
W
的插入
、F5P、
位置7处
W
的插入
、K18G、V58D、
位置
67
处
A
的插入
、T76E、T76D、T76N、G78D、
位置
80
处
S
的缺失
、
位置
81
处
G
的缺失
、
位置
82
处
E
的插入
、
位置
82
处
N
的插入
、S85I、V96C、V96T
和
E98D。61.
根据权利要求
45
至
60
中任一项所述的多核苷酸,其中所表达的2类
V
型
CRISPR
蛋白相对于
SEQ ID NO:2
或
SEQ ID NO:145
表现出改善的特征,其中所述改善的特征包括增加的对
gRNA
的结合亲和力
、
增加的对所述靶核酸的结合亲和力
、
改善的在所述靶核酸的所述编辑中利用更广谱的
PAM
序列的能力
、
改善的所述靶核酸的解旋
、
增加的编辑活性
、
改善的编辑效率
、
改善的对所述靶核酸的切割的编辑特异性
、
减少的对所述靶核酸的脱靶编辑或切割
、
增加的可编辑的真核基因组的百分比
、
增加的所述核酸酶的活性
、
增加的用于双链切割
的靶链加载
、
减少的用于单链切口的靶链加载
、
增加的
DNA
的非靶链的结合
、
改善的蛋白质稳定性
、
增加的蛋白质
:gRNA(RNP)
复合物稳定性和改善的融合特征
。62.
根据权利要求
61
所述的多核苷酸,其中所述改善的特征包括在包含
TTC、ATC、GTC
或
CTC PAM
序列的靶核酸序列处增加的切割活性
。63.
根据权利要求
62
所述的多核苷酸,其中所述改善的特征包括相对于
SEQ ID NO:145
的序列的切割活性,在包含
ATC
或
CTC PAM
序列的靶核酸序列处增加的切割活性
。64.
根据权利要求
63
所述的多核苷酸,其中在体外测定中,所述改善的切割活性是与
SEQ ID NO:145
的序列的得分相比高至少约
1.5、
至少约
2.0、
至少约
2.5、
至少约
3、
至少约
3.5、
至少约
4、
至少约
4.5、
至少约
5、
至少约
6、
至少约
7、
至少约8或更多的富集得分
(log2)。65.
根据权利要求
63
所述的多核苷酸,其中所述改善的特征包括与
SEQID NO:145
的序列相比,对包含
CTC PAM
序列的靶核酸序列的增加的切割活性
。66.
根据权利要求
65
所述的多核苷酸,其中所述改善的切割活性是在体外测定中与
SEQ ID NO:145
的序列的得分相比高至少约
2、
至少约
2.5、
至少约
3、
至少约
3.5、
至少约
4、
至少约
4.5、
至少约
5、
或至少约6或更多的富集得分
(log2)。67.
根据权利要求
62
所述的多核苷酸,其中所述改善的特征包括与
SEQID NO:145
的序列相比,对包含
TTC PAM
序列的靶核酸序列的增加的切割活性
。68.
根据权利要求
67
所述的多核苷酸,其中所述改善的切割活性是在体外测定中与
SEQ ID NO:145
的序列相比高至少约
1.5、
至少约
2.0、
至少约
2.5、
至少约
3、
至少约
3.5、
至少约
4、
至少约
4.5、
至少约5或至少约
6log2或更多的富集得分
。69.
根据权利要求
61
所述的多核苷酸,其中所述改善的特征包括相对于
SEQ ID NO:145
的序列,增加的对所述靶核酸序列的切割的特异性
。70.
根据权利要求
69
所述的多核苷酸,其中所述增加的特异性是在体外测定中与
SEQ ID NO:145
的序列相比高至少约
2.0、
至少约
2.5、
...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。