利用PPR基序的DNA结合性蛋白质及其应用制造技术

技术编号:12989522 阅读:75 留言:0更新日期:2016-03-10 00:44
基于PPR基序所具有的RNA识别规则也能够用于DNA识别的推测,设定了如下课题:对于在DNA结合中起作用的PPR蛋白质进行分析,探寻具有这种特征的PPR蛋白质。本发明专利技术中明确了,利用一种能够选择性地结合DNA碱基或者能够特异性地结合DNA碱基序列的蛋白质能够解决上述课题,该蛋白质含有多个、优选2~30个、更优选5~25个、最优选9~15个的具有下述式1结构的PPR基序(式1中:螺旋A为能够形成α螺旋结构的部分;X不存在或者为由长度1~9个的氨基酸构成的部分;螺旋B为能够形成α螺旋结构的部分;并且L为由长度2~7个的氨基酸构成的部分),该PPR基序具有式1中的螺旋A的第1氨基酸、第4氨基酸、以及L中含有的第“ii”(-2)氨基酸这3处氨基酸作为与DNA碱基或对象碱基序列对应的特定的氨基酸的组合。(螺旋A)-X-(螺旋B)-L(式1)。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及能够与目标DNA碱基或DNA序列选择性或特异性结合的蛋白质。本专利技术中利用了三角状五肽重复序列(pentatricopeptiderepeat,PPR)基序。本专利技术可用于DNA结合性蛋白质的鉴定、设计、具有PPR基序的蛋白质的靶标DNA的鉴定、DNA的功能调控。本专利技术在医疗领域、农学领域等中有用。另外,本专利技术涉及利用了含有PPR基序的蛋白质与规定功能性区域的蛋白质的复合体的新的DNA切割酶。
技术介绍
近年来,使用通过各种分析得以明确的核酸结合性蛋白质因子与目标序列结合的技术已被确立并得到了应用。通过利用该序列特异性的结合,能够进行作为靶标的核酸(DNA或RNA)的细胞内定位分析、作为靶标的DNA序列的去除、或其下游存在的蛋白质编码基因的表达调控(活化或失活)。已经进行了将作为作用于DNA的蛋白质性因子的锌指蛋白(非专利文献1、非专利文献2)、TAL效应因子(TALE、非专利文献3、专利文献1)、CRISPR(非专利文献4、非专利文献5)作为蛋白质工程材料的研究和开发,但这样的蛋白质性因子的种类仍然非常有限。例如,作为人工DNA切割酶而已知的人工锌指核酸酶(ZFN)为一种嵌合蛋白质,其通过在使特异性识别并结合3~4个碱基的DNA的锌指3~6个连结而构成的、利用3~4个碱基的序列单元对碱基序列进行识别的部分上连结细菌DNA切割酶(例如FokI)的1个DNA切割结构域而形成(非专利文献2)。这样的嵌合蛋白质中,锌指结构域是已知与DNA结合的蛋白质结构域,其根据在于,已知多种转录调控因子具有该结构域,与特异的DNA序列结合并进行基因的表达调控。通过使用2个具有3个锌指的该ZFN,理论上能够在大约每700亿个碱基中诱导1处切断。但是,由于使用该ZFN的方法在制作中耗费费用等,因而并未达到广泛应用的程度。另外,功能性ZFN的筛选效率差,暗示其在这方面也存在问题。此外,由n个锌指构成的锌指结构域具有识别(GNN)n这样的序列的倾向,因而还具有靶标基因序列的自由度低这样的问题。另一方面,已开发出了将由能够识别每1个碱基的组件部分的组合序列构成的蛋白质、TAL效应因子(TALE)与细菌DNA切割酶(例如FokI)的DNA切割结构域结合而得到的酶(TALEN),正在将其作为替代ZFN的人工酶来进行研究(非专利文献3)。该TALEN是将植物病原细菌黄单胞菌(Xanthomonas)所具有的转录因子的DNA结合结构域与DNA限制酶FokI的DNA切割结构域融合而成的酶,已知其与邻近的DNA序列结合,形成二聚物并将双链DNA切断。该分子中,从感染植物的细菌中发现的TALE的DNA结合结构域利用由34个氨基酸构成的TALE基序中的2处氨基酸的组合识别1个碱基,因此,具有能够通过TALE组件的重复结构的选择来选择与靶标DNA的结合性这样的特征。利用了具有这样的特征的DNA结合结构域的TALEN具有与ZFN同样地能够向靶标基因中导入突变的特征,但与ZFN相比,具有很大优越性的是,其靶标基因(碱基序列)的自由度大幅提高,而且能够编码结合碱基。但是,TALEN的完整的立体结构并不明确,因而现状是无法鉴定TALEN的DNA的切割部位。因此,与ZFN相比,TALEN存在切割部位不准确、不固定、会在类似序列处进行切割的问题。因此,存在无法利用DNA切割酶准确地对靶标碱基序列进行切割的问题。基于这样的情况,希望开发、提供不具有上述问题的新的人工DNA切割酶。基于基因组序列信息,仅在植物中就鉴定了形成500个成员的大家族的蛋白质、即PPR蛋白质(具有三角状五肽重复序列(pentatricopeptiderepeat,PPR)基序的蛋白质)(非专利文献6)。PPR蛋白质为核编码蛋白,已知其是专门对细胞器官(叶绿体和线粒体)的RNA水平的调控、切割、翻译、剪接、RNA编辑、RNA稳定性发挥基因特异性作用的蛋白质。典型地,PPR蛋白质具有约10个保守性低的35氨基酸基序、即PPR基序连续而成的结构,认为PPR基序的组合承担了与RNA的序列选择性结合的作用。绝大部分PPR蛋白质仅由约10个PPR基序的重复构成,多数情况下,未发现发挥催化作用所需要的结构域。因此,认为该PPR蛋白质实质上为RNA衔接子(アダプター)(非专利文献7)。通常,蛋白质与DNA之间的结合同蛋白质与RNA之间的结合是基于不同的分子机制来进行的,DNA结合型蛋白质通常不与RNA结合,反过来,RNA结合型蛋白质通常不与DNA结合。例如,在作为RNA结合因子而已知的、能够对识别RNA进行编码的Pumilio蛋白质的情况下,并无其与DNA结合的报道(非专利文献8和9)。但是,在对各种PPR蛋白质的性质进行研究的过程中,已经明确提示了几种类型的PPR蛋白质作为DNA结合性因子发挥作用。小麦的p63为具有9个PPR基序的PPR蛋白质,通过凝胶迁移分析提示其与DNA进行序列特异性结合(非专利文献10)。拟南芥(Arabidopsisthaliana)的GUN1蛋白质具有11个PPR基序,通过拉下分析提示其与DNA结合(非专利文献11)。通过连缀(Run-On)分析显示,拟南芥的pTac2(具有15个PPR基序的蛋白质、非专利文献12)和拟南芥的DG1(具有10个PPR基序的蛋白质、非专利文献13)直接参与以DNA作为模板来生成RNA的转录,认为它们与DNA结合。拟南芥的GRP23(具有11个PPR基序的蛋白质、非专利文献14)的基因缺陷株表现出胚致死的表现型,显示出该蛋白质与作为DNA依赖型RNA转录酶的真核生物型RNA转录聚合酶2的主要亚基发生物理性相互作用,因此认为GRP23也发挥DNA结合的作用。但是,关于这些PPR蛋白质,只不过间接地暗示了其与DNA的结合,并未充分证明实际上进行了序列特异性结合。另外,即使这些蛋白质与DNA进行了序列特异性结合,由于通常认为蛋白质与DNA之间的结合同蛋白质与RNA之间的结合是基于不同的分子机制来进行的,因此关于具体是通过怎样的序列规则来进行结合等,甚至连预测也完全没有。【现有技术文献】【专利文献】专利文献1:WO2011/072246专利文献2:WO2011/111829【非专利文献】非专利文献1:Maeder,M.L.,etal.(2008).Rapid“open-source”engineeringofcustomizedzinc-fingernucleasesforhigh本文档来自技高网...

【技术保护点】
一种能够选择性地结合DNA碱基或者能够特异性地结合DNA碱基序列的蛋白质,其为含有1个以上的具有下述式1结构的PPR基序的蛋白质,【化1】(螺旋A)‑X‑(螺旋B)‑L  (式1)式1中:螺旋A为能够形成α螺旋结构的部分;X不存在或者为由长度1个~9个的氨基酸构成的部分;螺旋B为能够形成α螺旋结构的部分;并且L为由长度2个~7个的氨基酸构成的部分;蛋白质中含有的一个PPR基序(Mn)为下述的PPR基序:在将螺旋A的起始氨基酸作为第1氨基酸、将第4位的氨基酸作为第4氨基酸、并且将下述氨基酸作为第“ii”(‑2)氨基酸时,所述PPR基序具有第1氨基酸、第4氨基酸和第“ii”(‑2)氨基酸这3个氨基酸作为与对象DNA碱基或对象DNA碱基序列对应的特定的氨基酸的组合,所述作为第“ii”(‑2)氨基酸的氨基酸为:·在PPR基序(Mn)的C末端侧连续存在下一个PPR基序(Mn+1)时(在PPR基序间无氨基酸插入时),从构成PPR基序(Mn)的氨基酸的最后位(C末端侧)起的第‑2位氨基酸;·在PPR基序(Mn)与其C末端侧的下一个PPR基序(Mn+1)之间发现1~20个氨基酸的非PPR基序时,从下一个PPR基序(Mn+1)的第1氨基酸起向上游侧数2位、即第‑2位氨基酸;或者·在PPR基序(Mn)的C末端侧未发现下一个PPR基序(Mn+1)时、或者在与C末端侧的下一个PPR基序(Mn+1)之间发现21个氨基酸以上的构成非PPR基序的氨基酸的情况下,从构成PPR基序(Mn)的氨基酸的最后位(C末端侧)起的第2位氨基酸。...

【技术特征摘要】
【国外来华专利技术】2013.04.22 JP 2013-0898401.一种能够选择性地结合DNA碱基或者能够特异性地结合DNA碱基序列的蛋
白质,其为含有1个以上的具有下述式1结构的PPR基序的蛋白质,
【化1】
(螺旋A)-X-(螺旋B)-L(式1)
式1中:
螺旋A为能够形成α螺旋结构的部分;
X不存在或者为由长度1个~9个的氨基酸构成的部分;
螺旋B为能够形成α螺旋结构的部分;并且
L为由长度2个~7个的氨基酸构成的部分;
蛋白质中含有的一个PPR基序(Mn)为下述的PPR基序:
在将螺旋A的起始氨基酸作为第1氨基酸、将第4位的氨基酸作为第4氨基酸、
并且将下述氨基酸作为第“ii”(-2)氨基酸时,所述PPR基序具有第1氨基酸、第4氨
基酸和第“ii”(-2)氨基酸这3个氨基酸作为与对象DNA碱基或对象DNA碱基序列
对应的特定的氨基酸的组合,
所述作为第“ii”(-2)氨基酸的氨基酸为:
·在PPR基序(Mn)的C末端侧连续存在下一个PPR基序(Mn+1)时(在PPR基序间
无氨基酸插入时),从构成PPR基序(Mn)的氨基酸的最后位(C末端侧)起的第-2位氨
基酸;
·在PPR基序(Mn)与其C末端侧的下一个PPR基序(Mn+1)之间发现1~20个氨
基酸的非PPR基序时,从下一个PPR基序(Mn+1)的第1氨基酸起向上游侧数2位、
即第-2位氨基酸;或者
·在PPR基序(Mn)的C末端侧未发现下一个PPR基序(Mn+1)时、或者在与C末
端侧的下一个PPR基序(Mn+1)之间发现21个氨基酸以上的构成非PPR基序的氨基酸
的情况下,从构成PPR基序(Mn)的氨基酸的最后位(C末端侧)起的第2位氨基酸。
2.如权利要求1所述的蛋白质,该蛋白质中,使第1氨基酸、第4氨基酸和第
“ii”(-2)氨基酸这3个氨基酸的组合与对象DNA碱基或对象DNA碱基序列对应,
其中,氨基酸的组合基于下述任意一种情况来确定:
(1-1)第4氨基酸为甘氨酸(G)的情况下,第1氨基酸可以为任意的氨基酸,且第
“ii”(-2)氨基酸为天冬氨酸(D)、天冬酰胺(N)或丝氨酸(S);
(1-2)第4氨基酸为异亮氨酸(I)的情况下,第1氨基酸和第“ii”(-2)氨基酸均可
以为任意的氨基酸;
(1-3)第4氨基酸为亮氨酸(L)的情况下,第1氨基酸和第“ii”(-2)氨基酸均可以
为任意的氨基酸;
(1-4)第4氨基酸为甲硫氨酸(M)的情况下,第1氨基酸和第“ii”(-2)氨基酸均可
以为任意的氨基酸;
(1-5)第4氨基酸为天冬酰胺(N)的情况下,第1氨基酸和第“ii”(-2)氨基酸均可
以为任意的氨基酸;
(1-6)第4氨基酸为脯氨酸(P)的情况下,第1氨基酸和第“ii”(-2)氨基酸均可以
为任意的氨基酸;
(1-7)第4氨基酸为丝氨酸(S)的情况下,第1氨基酸和第“ii”(-2)氨基酸均可以
为任意的氨基酸;
(1-8)第4氨基酸为苏氨酸(T)的情况下,第1氨基酸和第“ii”(-2)氨基酸均可以
为任意的氨基酸;
(1-9)第4氨基酸为缬氨酸(V)的情况下,第1氨基酸和第“ii”(-2)氨基酸均可以
为任意的氨基酸。
3.如权利要求1所述的蛋白质,该蛋白质中,使第1氨基酸、第4氨基酸和第
“ii”(-2)氨基酸这3个氨基酸的组合与对象DNA碱基或对象DNA碱基序列对应,
其中,氨基酸的组合基于下述任意一种情况来确定:
(2-1)第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸这3个氨基酸依次为任意的
氨基酸、甘氨酸、天冬氨酸时,该PPR基序与G选择性地结合;
(2-2)第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸这3个氨基酸依次为谷氨酸、
甘氨酸、天冬氨酸时,该PPR基序与G选择性地结合;
(2-3)第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸这3个氨基酸依次为任意的
氨基酸、甘氨酸、天冬酰胺时,该PPR基序与A选择性地结合;
(2-4)第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸这3个氨基酸依次为谷氨酸、
甘氨酸、天冬酰胺时,该PPR基序与A选择性地结合;
(2-5)第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸这3个氨基酸依次为任意的
氨基酸、甘氨酸、丝氨酸时,该PPR基序与A选择性地结合,其次与C结合;
(2-6)第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸这3个氨基酸依次为任意的
氨基酸、异亮氨酸、任意的氨基酸时,该PPR基序与T和C选择性地结合;
(2-7)第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸这3个氨基酸依次为任意的
氨基酸、异亮氨酸、天冬酰胺时,该PPR基序与T选择性地结合,其次与C结合;
(2-8)第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸这3个氨基酸依次为任意的
氨基酸、亮氨酸、任意的氨基酸时,该PPR基序与T和C选择性地结合;
(2-9)第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸这3个氨基酸依次为任意的
氨基酸、亮氨酸、天冬氨酸时,该PPR基序与C选择性地结合;
(2-10)第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸这3个氨基酸依次为任意的
氨基酸、亮氨酸、赖氨酸时,该PPR基序与T选择性地结合;
(2-11)第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸这3个氨基酸依次为任意的
氨基酸、甲硫氨酸、任意的氨基酸时,该PPR基序与T选择性地结合;
(2-12)第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸这3个氨基酸依次为任意的
氨基酸、甲硫氨酸、天冬氨酸时,该PPR基序与T选择性地结合;
(2-13)第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸这3个氨基酸依次为异亮氨
酸、甲硫氨酸、天冬氨酸时,该PPR基序与T选择性地结合,其次与C结合;
(2-14)第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸这3个氨基酸依次为任意的
氨基酸、天冬酰胺、任意的氨基酸时,该PPR基序与C和T选择性地结合;
(2-15)第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸这3个氨基酸依次为任意的
氨基酸、天冬酰胺、天冬氨酸时,该PPR基序与T选择性地结合;
(2-16)第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸这3个氨基酸依次为苯丙氨
酸、天冬酰胺、天冬氨酸时,该PPR基序与T选择性地结合;
(2-17)第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸这3个氨基酸依次为甘氨酸、
天冬酰胺、天冬氨酸时,该PPR基序与T选择性地结合;
(2-18)第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸这3个氨基酸依次为异亮氨
酸、天冬酰胺、天冬氨酸时,该PPR基序与T选择性地结合;
(2-19)第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸这3个氨基酸依次为苏氨酸、

\t天冬酰胺、天冬氨酸时,该PPR基序与T选择性地结合;
(2-20)第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸这3个氨基酸依次为缬氨酸、
天冬酰胺、天冬氨酸时,该PPR基序与T选择性地结合,其次与C结合;
(2-21)第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸这3个氨基酸依次为酪氨酸、
天冬酰胺、天冬氨酸时,该PPR基序与T选择性地结合,其次与C结合;
(2-22)第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸这3个氨基酸依次为任意的
氨基酸、天冬酰胺、天冬酰胺时,该PPR基序与C选择性地结合;
(2-23)第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸这3个氨基酸依次为异亮氨
酸、天冬酰胺、天冬酰胺时,该PPR基序与C选择性地结合;
(2-24)第1氨基酸、第4氨基酸和第“ii”(-2)氨基酸这3个氨基酸依次为丝氨酸、
天冬酰胺、天冬酰胺时,该PPR基序与C选择性地结合;
(2-25)第1氨...

【专利技术属性】
技术研发人员:山本卓佐久间哲史中村崇裕八木祐介大川恭行
申请(专利权)人:国立大学法人九州大学国立大学法人广岛大学
类型:发明
国别省市:日本;JP

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术