【技术实现步骤摘要】
【国外来华专利技术】用于指导RNA设计和使用的方法和系统
交叉引用
[0001]本申请要求2018年5月16日提交的美国临时申请号62/672,437的权益,该临时申请通过引用并入本文。
技术介绍
[0002]设计用于靶向和操作特定DNA序列的工程化核酸酶技术正在迅速用作许多不同应用的有用技术,这些应用包括细胞和整个生物体的遗传操作、靶向的基因删除、替换和修复,以及外源序列(转基因)向基因组中的插入。基因组编辑技术的示例包括锌指、转录激活因子样效应物(TALE)和成簇的规律间隔的短回文重复序列(CRISPR)/CRISPR相关的(Cas)(“CRISPR/Cas”)系统。
[0003]CRISPR/Cas系统可以用作多种不同生物体中的基因编辑工具,用于在靶位点产生断裂,随后在基因座引入突变。基因编辑过程可能需要两个主要组分:核酸内切酶(例如Cas酶)和识别特定DNA靶序列的短RNA分子。CRISPR/Cas系统可以依靠定制的短RNA分子将Cas酶募集到新的DNA靶位点上,而不是为每个DNA靶标设计核酸酶。Cas酶的实例包括Cas9和Cpf1。r/>[0004]C本文档来自技高网...
【技术保护点】
【技术特征摘要】
【国外来华专利技术】1.一种用于鉴定可与基因组中的目标基因组区域杂交的指导RNA(gRNA)集的方法,所述方法包括:设计gRNA集,其中所述gRNA集中的每个gRNA可与来自所述目标基因组区域内的多个靶位点中的靶位点杂交,所述靶位点与来自所述指导RNA集的至少一个其他指导RNA的多个靶位点中的不同靶位点相距至少30个碱基。2.根据权利要求1所述的方法,所述靶位点与所述不同靶位点相距最多170个碱基。3.根据权利要求1所述的方法,其中所述gRNA集中至少一个gRNA的序列与所述目标基因组区域互补。4.根据权利要求1所述的方法,其中所述gRNA集中至少一个gRNA的序列与所述目标基因组区域部分互补。5.根据权利要求4所述的方法,其中所述gRNA集中与所述目标基因组区域部分互补的所述至少一个gRNA的序列相对于所述目标基因组区域包含1个、2个、3个、4个、5个或大于5个错配。6.根据权利要求1所述的方法,其中所述gRNA集中的每个gRNA的长度为约17个至约42个碱基。7.根据权利要求2所述的方法,其中所述gRNA集中的每个gRNA的长度为约20个碱基。8.根据权利要求1所述的方法,其中所述gRNA集中的每个gRNA包含约20个碱基的指导序列,并且还包含长度为约22个至约80个碱基的恒定区。9.根据权利要求8所述的方法,其中所述gRNA集中的每个gRNA的所述指导序列选择性地与所述目标基因组区域杂交。10.根据权利要求1所述的方法,其中初始gRNA集中的每个gRNA的长度为约100个碱基。11.根据权利要求1所述的方法,其中所述目标基因组区域包含基因的编码区域。12.根据权利要求11所述的方法,其中所述目标基因组区域包含基因的外显子。13.根据权利要求1所述的方法,其中所述目标基因组区域包含基因家族。14.根据权利要求13所述的方法,其中所述目标基因组区域包含来自所述基因家族的一个或多个编码区域。15.根据权利要求1所述的方法,其中所述目标基因组区域包含所述基因组的非编码区域。16.根据权利要求15所述的方法,其中所述非编码区域是调控元件。17.根据权利要求16所述的方法,其中所述调控元件是顺式调控元件或反式调控元件。18.根据权利要求17所述的方法,其中所述顺式调控元件选自:启动子、增强子和沉默子。19.根据权利要求13所述的方法,其中所述目标基因组区域跨越大于5kb、大于10kb、大于15kb、大于20kb、大于50kb或大于100kb。20.根据权利要求1所述的方法,其中所述gRNA集包含至少2个、至少3个或至少4个gRNA。21.根据权利要求1所述的方法,其中来自所述指导RNA集的至少一个gRNA包含修饰。22.根据权利要求21所述的方法,其中所述修饰选自:2
’‑
O
‑
C1‑4烷基如2
’‑
O
‑
甲基(2
’‑
OMe)、2
’‑
脱氧基(2
’‑
H)、2
’‑
O
‑
C1‑3烷基
‑
O
‑
C1‑3烷基如2
’‑
甲氧基乙基(2
’‑
MOE)、2
’‑
氟(2
’‑
F)、2
’‑
氨基(2
’‑
NH2)、2
’‑
阿拉伯糖(2
’‑
阿糖)核苷酸、2
’‑
F
‑
阿拉伯糖(2
’‑
F
‑
阿糖)核苷酸、2
’
锁核酸(LNA)核苷酸、2
’
解锁核酸(ULNA)核苷酸、L型糖(L
‑
糖)和4
’‑
硫代核糖核苷酸。23.根据权利要求21所述的方法,其中所述修饰是选自硫代磷酸酯、膦基羧酸酯、硫代膦基羧酸酯、烷基膦酸酯和二硫代磷酸酯的核苷酸间键修饰。24.根据权利要求21所述的方法,其中所述修饰选自:2
‑
硫尿嘧啶(2
‑
硫U)、2
‑
硫胞嘧啶(2
‑
硫C)、4
‑
硫尿嘧啶(4
‑
硫U)、6
‑
硫鸟嘌呤(6
‑
硫G)、2
‑
氨基腺嘌呤(2
‑
氨基A)、2
‑
氨基嘌呤、假尿嘧啶、次黄嘌呤、7
‑
脱氮鸟嘌呤、7
‑
脱氮
‑8‑
氮杂鸟嘌呤、7
‑
脱氮腺嘌呤、7
‑
脱氮
‑8‑
氮杂腺嘌呤、5
‑
甲基胞嘧啶(5
‑
甲基C)、5
‑
甲基尿嘧啶(5
‑
甲基U)、5
‑
羟甲基胞嘧啶、5
‑
羟甲基尿嘧啶、5,6
‑
脱氢尿嘧啶、5
‑
丙炔基胞嘧啶、5
‑
丙炔基尿嘧啶、5
‑
乙炔基胞嘧啶、5
‑
乙炔基尿嘧啶、5
‑
烯丙基尿嘧啶(5
‑
烯丙基U)、5
‑
烯丙基胞嘧啶(5
‑
烯丙基C)、5
‑
氨基烯丙基尿嘧啶(5
‑
氨基烯丙基U)、5
‑
氨基烯丙基胞嘧啶(5
‑
氨基烯丙基C)、无碱基核苷酸、Z碱基、P碱基、非结构化核酸(UNA)、异鸟嘌呤(异G)、异胞嘧啶(异C)和5
‑
甲基
‑2‑
嘧啶。25.根据权利要求1所述的方法,其中所述多个靶位点中的靶位点与用于核酸酶的PAM位点相邻,所述核酸酶选自:Cas9、C2c1、C2c3和Cpf1。26.根据权利要求25所述的方法,其中所述核酸酶是Cas9。27.根据权利要求25所述的方法,其中所述核酸酶是失活的Cas9。28.根据权利要求25所述的方法,其中将所述gRNA集设计为敲除细胞中的所述目标基因组区域中的基因。29.根据权利要求28所述的方法,其中所述细胞选自:人类原代细胞、人类永生化细胞、人类诱导的多能干细胞、小鼠胚胎干细胞和中国仓鼠卵巢细胞。30.根据权利要求1所述的方法,其中所述设计是由计算机执行的。31.一种试剂盒,所述试剂盒包含指导RNA(gRNA)集,所述gRNA集中的每个gRNA均通过权利要求1
‑
29中任一项所述的方法设计。32.一种试剂盒,所述试剂盒包含可与基因组中目标基因组区域杂交的gRNA集,其中所述gRNA集中的每个gRNA:可与来自所述目标基因组区域内的多个靶位点中的靶位点杂交,所述靶位点与来自所述指导RNA集的至少一个其他指导RNA的多个靶位点中的不同靶位点相距至少30个碱基。33.根据权利要求32所述的试剂盒,其中所述靶位点与所述不同靶位点相距最多170个碱基。34.根据权利要求32所述的试剂盒,其中所述gRNA集包含至少2个、至少3个或至少4个gRNA。35.根据权利要求32所述的试剂盒,所述试剂盒还包含一种或多种选自Cas9、C2cl、C2c3和Cpf1的核酸酶。36.根据权利要求32所述的试剂盒,所述试剂盒还包含多个gRNA集,每个gRNA集可与所述基因组中不同的目标基因组区域杂交。37.根据权利要求35所述的试剂盒,其中将所述一种或多种核酸酶与至少一种gRNA偶联。38.一种用于选择一个或多个指导RNA(gRNA)来与物种的基因组基因杂交的方法,所述方法包括:
对于与所述基因杂交的初始指导RNA集的多个指导RNA中的每一个,通过列举与所述基因组中潜在的指导RNA杂交位点的错配数目来计算脱靶值。39.根据权利要求38所述的方法,其中所述多个gRNA中的每个gRNA的长度为100个碱基。40.根据权利要求39所述的方法,其中所述多个gRNA中的每个gRNA的约20个碱基与目标基因组区域内的不同靶位点杂交。41.根据权利要求38所述的方法,其中所述错配数目是0。42.根据权利要求38所述的方法,其中所述错配数目是1。43.根据权利要求39所述的方法,其中所述错配数目是2。44.根据权利要求43所述的方法,其中所述错配数目是3。45.根据权利要求38所述的方法,其中所述计算列举了所述初始指导RNA集中的每个gRNA的错配数目的累计总和。46.根据权利要求38所述的方法,其中所述计算将所述错配数目组织成分片。47.根据权利要求38所述的方法,其中相对于参考基因组计算所述脱靶值。48.根据权利要求47所述的方法,其中所述参考基因组是人类参考基因组。49.根据权利要求47所述的方法,其中所述参考基因组选自:智人、小家鼠、黑线仓鼠、褐家鼠、斑马鱼和秀丽隐杆线虫。50.根据权利要求38所述的方法,其中所述脱靶值是在参考基因组的1,000,000bp或整个参考基因组上确定的。51.根据权利要求38所述的方法,其中所述脱靶值是相对于核酸酶结合位点数据库计算的。52.根据权利要求51所述的方法,其中所述核酸酶选自:Cas9、C2c1、C2c3和Cpf1。53.根据权利要求52所述的方法,其中所述核酸酶是Cas9。54.根据权利要求51所述的方法,其中所述数据库包含多于10,000个、多于50,000个、多于100,000个、多于150,000个、多于200,000个、多于250,000个、多于300,000个、多于350,000个、多于400,000个、多于450,000个、多于500,000个、多于550,000个、多于600,000个、多于650,000个、多于700,000个、多于750,000个、多于800,000个、多于850,000个、多于900,000个、多于950,000个或多于1,000,000个核酸酶结合位点。55.根据权利要求51所述的方法,其中所述核酸酶结合位点数据库包含多于2500万个、多于5000万个、多于7500万个、多于1亿个、多于1.25亿个、多于1.5亿个、多于1.75亿个、多于2亿个、多于2.25亿个、多于2.5亿个、多于2.75亿个或多于3亿个核酸酶结合位点。56.根据权利要求38所述的方法,其中通过列举所述错配数目来计算所述脱靶值是由计算机执行的。57.一种用于设计用于与物种的基因组基因杂交的一个或多个指导RNA(gRNA)的方法,所述方法包括:从所述基因的多个转录物中选择转录物;以及鉴定初始gRNA集,其中所述初始gRNA集中的每个gRNA与所述选择的转录物的基因中的不同靶位点杂交。58.根据权利要求57所述的方法,其中所述初始gRNA集中的每个gRNA的长度为约17个
至约42个碱基。59.根据权利要求58所述的方法,其中所述初始gRNA集中的每个gRNA的长度为约20个碱基。60.根据权利要求57所述的方法,其中所述初始gRNA集中的每个gRNA包含约20个碱基的指导序列和长度为约22个至约80个碱基的恒定区。61.根据权利要求60所述的方法,其中所述初始gRNA集中的每个gRNA的所述指导序列选择性地与靶位点杂交。62.根据权利要求57所述的方法,其中所述初始gRNA集中的...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。