一种设计和构建猪全基因组CRISPR/Cas9敲除文库的方法技术

技术编号:20124200 阅读:440 留言:0更新日期:2019-01-16 13:19
本发明专利技术提供了一种设计和构建猪全基因组CRISPR/Cas9敲除文库的方法。具体地,本发明专利技术首次开发一种针对猪全基因组水平蛋白编码基因、lincRNA和miRNA设计特异性sgRNA,并由此构建CRISPR/Cas9的慢病毒敲除文库的方法,可利用该策略实现高通量筛选猪的功能基因。

A method for designing and constructing porcine genomic CRISPR/Cas9 knockout Library

The invention provides a method for designing and constructing a pig genomic CRISPR/Cas9 knockout library. Specifically, the invention first develops a method for designing a specific lentivirus knockout Library Based on the whole genome level protein coding gene, lincRNA and miRNA of the pig genome and constructing CRISPR/Cas9 specific sgRNA.

【技术实现步骤摘要】
一种设计和构建猪全基因组CRISPR/Cas9敲除文库的方法
本专利技术涉及生物
,具体地,涉及一种设计和构建猪全基因组CRISPR/Cas9敲除文库的方法。
技术介绍
利用功能缺失型(Loss-of-function)或者功能获得型(Gain-of-function)策略高通量筛选功能基因,是快速寻找调控特定表型的重要或关键基因的主要方法。传统采用RNA干扰(RNAinterference,RNAi)文库进行遗传筛选方法因操作简单、成本相对较低等优势,尽管已经得到了广泛的应用,然而其抑制效果不完全、脱靶效应明显等劣势依然存在。近年来兴起的CRISPR/Cas9技术能快速、简便、准确地实现基因组敲除等编辑功能,因而成为一种强大的遗传筛选工具。在各种细胞系、人和小鼠及斑马鱼等多种模式动物中,大规模运用该方法筛选功能基因已经取得了一些巨大成功。然而,目前猪的全基因组CRISPR/Cas9敲除文库未见报道。因此,本领域迫切需要开发一种针对猪全基因组水平蛋白编码基因、lincRNA和miRNA设计sgRNA,由此构建CRISPR/Cas9的慢病毒敲除文库,即可利用该策略实现高通量筛选猪的功能基因的方法。
技术实现思路
本专利技术的目的在于提供一种针对猪全基因组水平蛋白编码基因、lincRNA和miRNA设计sgRNA,由此构建CRISPR/Cas9的慢病毒敲除文库,即可利用该策略实现高通量筛选猪的功能基因的方法。本专利技术第一方面提供了一种猪全基因组特异性sgRNA文库,所述文库包括:(i)N种表达猪特异性sgRNA的载体,其中N为≥20000的正整数,所述的猪特异性sgRNA是针对猪全基因组的靶基因,并且所述的靶基因选自下组:(a)蛋白编码基因、(b)lincRNA基因、(c)miRNA基因、(d)上述(a)、(b)和(c)的组合;并且,所述的猪特异性sgRNA具有以下结构特征:(1)sgRNA所针对的靶基因位点中含有的PAM为NGG(N为A、T、C、G任意碱基);(2)sgRNA长度为19或20nt;(3)sgRNA的GC含量选择40-60%;(4)sgRNA的全基因组脱靶评估选择不含1和2个碱基错配脱靶位点,且相比较其它sgRNA,选择脱靶数量相对较少的sgRNA;(5)对于靶向蛋白编码基因的猪特异性sgRNA,其结合位置位于所述编码基因的起始密码子ATG下游500bp区域内;对于靶向lincRNA基因的猪特异性sgRNA,其结合位置位于所述lincRNA转录起始点下游的500bp区域内;对于靶向miRNA基因的猪特异性sgRNA,其结合位置为miRNA前体序列或成熟序列;以及(ii)任选的M种阴性对照载体,所述的阴性对照载体为表达无关sgRNA(无义sgRNA)的载体,其中M为正整数。在另一优选例中,所述sgRNA的序列特征为N20NGG(N为A、T、C、G任意碱基)。在另一优选例中,N为30000-150000,较佳地40000-100000,更佳地60000-90000。在另一优选例中,M为10-10000,较佳地50-5000,更佳地200-3000,最佳地500-2000。在另一优选例中,所述文库中,所述的N种猪特异性sgRNA靶向≥90%(较佳地≥95%,更佳地96-100%或96-99%)的猪蛋白编码基因。在另一优选例中,所述文库中,所述的N种猪特异性sgRNA靶向≥90%(较佳地≥95%,更佳地96-100%或96-99%)的猪lincRNA基因。在另一优选例中,所述文库中,所述的N种猪特异性sgRNA靶向≥90%(较佳地≥95%,更佳地96-100%或96-99%)的猪miRNA基因。在另一优选例中,对于猪全基因组的全部基因而言,所述猪特异性sgRNA的平均覆盖深度D1为2-10,较佳地2-6,更佳地为2-4(即,平均而言,每个基因有3种(或3条)针对该基因的猪特异性sgRNA。在另一优选例中,所述的载体包括表达载体。在另一优选例中,所述的载体选自下组:质粒、病毒载体、或其组合。在另一优选例中,所述的病毒载体包括:慢病毒表达载体、腺病毒表达载体、转座子表达载体、或其组合。在另一优选例中,所述的表达载体除了含有表达Cas9或sgRNA的元件外,还含有表达慢病毒、腺病毒、转座子的元件。在另一优选例中,所述表达载体含有一表达猪sgRNA的表达盒,所述表达盒具有式I所示的从5’至3’的结构:Z0-Z1-Z2(I)式中,Z0为第一启动子;Z1为AL-N20-AR,其中AL为位于猪特异性sgRNA的编码序列上游的左臂序列N20为猪特异性sgRNA的编码序列,而AR为位于猪特异性sgRNA的编码序列下游的右臂序列;Z2为sgRNAscaffold序列。在另一优选例中,所述表达盒具有式II所示的从5’至3’的结构:Z0-Z1-Z2-L-Z3-Z4(II)式中,Z0、Z1、和Z2如上所述,L为任选的间隔序列;Z3为第二启动子;Z4为报告基因。在另一优选例中,所述AL为额外添加的含有限制性内切酶位点的正向引物结合序列。在另一优选例中,所述AL为表达sgRNA载体通过限制性内切酶线性化后,其紧邻限制性内切酶酶切位点上游的左侧同源载体序列。在另一优选例中,所述AR为额外添加的含有限制性内切酶位点的反向引物结合序列。在另一优选例中,所述AR为表达sgRNA载体通过限制性内切酶线性化后,其紧邻限制性内切酶酶切位点下游的右侧同源载体序列。在另一优选例中,所述AL的长度为25-40bp,较佳地25-35bp。在另一优选例中,所述N20的长度为20nt。在另一优选例中,所述AR的长度为25-40bp,较佳地28-35bp。在另一优选例中,所述第一启动子为启动sgRNA表达的启动子。在另一优选例中,所述第一启动子选自下组:U6启动子、药物诱导型启动子(如Teton/off系统)、或其组合。在另一优选例中,所述第二启动子选自下组:CMV启动子、CAG启动子、CBh启动子、组织特异启动子、或其组合。在另一优选例中,所述报告基因选自下组:Neomycin、Puromycin、RFP、EGFP、mCherry、Blasticidin、或其组合。在另一优选例中,所述的表达载体选自下组:PX330、lenti-sgRNA-EGFP、Ad-sgRNA、PB(piggyBac)-sgRNA、或其组合。在另一优选例中,所述的Z1具有式(IV)结构:5’-TATCTTGTGGAAAGGACGAAACACCGN20GTTTTAGAGCTAGAAATAGCAAGTTAAAAT-3’(IV)式中,N20为猪特异性sgRNA的编码序列。在另一优选例中,所述sgRNA文库的容量为82392条猪特异性sgRNA。在另一优选例中,所述的文库是用本专利技术第二方面所述的方法制备的。本专利技术第二方面提供了一种制备本专利技术第一方面所述的猪全基因组特异性sgRNA文库的方法,包括步骤:(a)提供核酸构建物Z1,所述的核酸构建物Z1具有以下结构:AL-N20-AR其中,AL为位于猪特异性sgRNA的编码序列上游的左同源臂序列,N20为猪特异性sgRNA的编码序列,AR为位于猪特异性sgRNA的编码序列下游的右同源臂序列;(b)以所述的核酸构建物Z1为模板,进行PCR扩本文档来自技高网...

【技术保护点】
1.一种猪全基因组特异性sgRNA文库,其特征在于,所述文库包括:(i)N种表达猪特异性sgRNA的载体,其中N为≥20000的正整数,所述的猪特异性sgRNA是针对猪全基因组的靶基因,并且所述的靶基因选自下组:(a)蛋白编码基因、(b)lincRNA基因、(c)miRNA基因、(d)上述(a)、(b)和(c)的组合;并且,所述的猪特异性sgRNA具有以下结构特征:(1)sgRNA所针对的靶基因位点中含有的PAM为NGG,其中N为A、T、C、G任意碱基;(2)sgRNA长度为19或20nt;(3)sgRNA的GC含量选择40‑60%;(4)sgRNA的全基因组脱靶评估选择不含1和2个碱基错配脱靶位点,且相比较其它sgRNA,选择脱靶数量相对较少的sgRNA;(5)对于靶向蛋白编码基因的猪特异性sgRNA,其结合位置位于所述编码基因的起始密码子ATG下游500bp区域内;对于靶向lincRNA基因的猪特异性sgRNA,其结合位置位于所述lincRNA转录起始点下游的500bp区域内;对于靶向miRNA基因的猪特异性sgRNA,其结合位置为miRNA前体序列或成熟序列;以及(ii)任选的M种阴性对照载体,所述的阴性对照载体为表达无关sgRNA的载体,其中M为正整数。...

【技术特征摘要】
1.一种猪全基因组特异性sgRNA文库,其特征在于,所述文库包括:(i)N种表达猪特异性sgRNA的载体,其中N为≥20000的正整数,所述的猪特异性sgRNA是针对猪全基因组的靶基因,并且所述的靶基因选自下组:(a)蛋白编码基因、(b)lincRNA基因、(c)miRNA基因、(d)上述(a)、(b)和(c)的组合;并且,所述的猪特异性sgRNA具有以下结构特征:(1)sgRNA所针对的靶基因位点中含有的PAM为NGG,其中N为A、T、C、G任意碱基;(2)sgRNA长度为19或20nt;(3)sgRNA的GC含量选择40-60%;(4)sgRNA的全基因组脱靶评估选择不含1和2个碱基错配脱靶位点,且相比较其它sgRNA,选择脱靶数量相对较少的sgRNA;(5)对于靶向蛋白编码基因的猪特异性sgRNA,其结合位置位于所述编码基因的起始密码子ATG下游500bp区域内;对于靶向lincRNA基因的猪特异性sgRNA,其结合位置位于所述lincRNA转录起始点下游的500bp区域内;对于靶向miRNA基因的猪特异性sgRNA,其结合位置为miRNA前体序列或成熟序列;以及(ii)任选的M种阴性对照载体,所述的阴性对照载体为表达无关sgRNA的载体,其中M为正整数。2.如权利要求1所述的sgRNA文库,其特征在于,所述表达载体含有一表达猪sgRNA的表达盒,所述表达盒具有式I所示的从5’至3’的结构:Z0-Z1-Z2(I)式中,Z0为第一启动子;Z1为AL-N20-AR,其中AL为位于猪特异性sgRNA的编码序列上游的左臂序列N20为猪特异性sgRNA的编码序列,而AR为位于猪特异性sgRNA的编码序列下游的右臂序列;Z2为sgRNAscaffold序列。3.如权利要求2所述的sgRNA文库,其特征在于,所述表达盒具有式II所示的从5’至3’的结构:Z0-Z1-Z2-L-Z3-Z4(II)式中,Z0、Z1、和Z2如上所述,L为任选的间隔序列...

【专利技术属性】
技术研发人员:谢胜松赵书红赵长志李新云刘向东韩晓松杨高娟高杨陈毅龙杜小勇苗义良马云龙刘小磊梅书棋
申请(专利权)人:华中农业大学
类型:发明
国别省市:湖北,42

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1