奈瑟球菌蛋白质的杂合和串联表达制造技术

技术编号:1721826 阅读:149 留言:0更新日期:2012-04-11 18:40
连接两种或多种奈瑟球菌蛋白质从而使它们被翻译成一条多肽链。提供分子式为NH↓[2]-A-[-X-L-]↓[n]-B-COOH的杂合蛋白质,其中X是一种氨基酸序列,L是任选的接头氨基酸序列,A是任选的N-末端氨基酸序列,B是任选的C-末端氨基酸序列,n是大于1的整数。蛋白质中各n-X-部分的序列与其它-X-部分具有序列相同性,这种蛋白质是一种串联蛋白质。(*该技术在2022年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术属于蛋白质表达领域。具体涉及奈瑟球菌(Neisseria)(如淋病奈瑟球菌(N.gonorrhoeaee)或优选脑膜炎奈瑟球菌(N.meningitidis))的蛋白质表达。
技术介绍
参考文献1和2揭示了参考文献3到6所述奈瑟球菌蛋白质表达的一种另和改进的方法。一个这种方法是生成“杂合性”蛋白质,此蛋白中两种或多种奈瑟球菌蛋白质表达为一条多肽链。此方法有两个优点。首先,自身表达可能不稳定或弱的蛋白质可通过加入适当的伴侣来协助克服其问题。第二,简化工业生产,因为仅需采用一次表达和纯化即可产生两种单独有用的蛋白质。本专利技术的一个目标是进一步提供另一种和改进的奈瑟球菌蛋白质表达方法。专利技术概述杂合蛋白质因此专利技术提供同时表达两种或多种(如3、4、5、6或更多)奈瑟球菌蛋白质的方法,其中连接所述两种或多种蛋白质从而使它们被翻译成一条多肽链。一般,本专利技术的杂合蛋白质可表示为公式NH2-A-n-B-COOH,其中X是一条氨基酸序列,L是任选的接头氨基酸序列,A是任选的N-末端氨基酸序列,B是任选的C-末端氨基酸序列,n是大于1的整数。n的值在2和x之间,x的值通常是3、4、5、6、7、8、9或10。n优选是2、3或4;更优选是2或3;最优选n=2。-X-部分本专利技术有两种主要的杂合蛋白质组。这两组不互相排斥。在第一组中,各-X-部分是(a)orf1、orf4、orf25、orf40、orf46.1、orf83、NMB1343、230、233、287、292、594、687、736、741、907、919、936、953、961或983氨基酸序列;(b)与(a)的氨基酸序列有序列相同性的氨基酸序列;或(c)含(a)的氨基酸序列片段的氨基酸序列优选(a)的亚组是orf46.1、230、287、741、919、936、953、961和983。更优选的(a)的亚组是orf46.1、287、741和961。图3显示优选的杂合蛋白质。在第二组中,该杂合蛋白质包括第一个-X-部分(-Xa-)和第二个-X-部分(-Xb-)。-Xa-部分具有下列氨基酸序列之一(d)参考文献3所述的446个偶数序列编号SEQ IDs(即2、4、6…890、892);(e)参考文献4所述的45个偶数SEQ IDs(即2、4、6…88、90);(f)参考文献5所述的1674个偶数SEQ IDs 2-3020、偶数SEQ IDs 3040-3114和所有的SEQ IDs 3115-3241;(g)参考文献7的2160个氨基酸序列,NMB0001到NMB2160;(h)参考文献1或2所述的氨基酸序列。-Xb-部分与-Xa-的关系如下(i)-Xb-与-Xa-具有序列相同性和/或(j)-Xb-包括-Xa-的片段。此第二种杂合性蛋白质例子包括的蛋白质中有两个或多个相同的-X-部分,或它们是同一蛋白质的变体,如同一蛋白质的两种多态,可表示为-Xa-Xb-;三种多态型,可表示为-Xa-Xb-Xc等。-Xa-Xb-部分可以是从N-末端到C-末端的任一顺序。-Xa-部分优选是orf1、orf4、orf25、orf40、off46.1、orf83、NMB1343、230、233、287、292、594、687、736、741、907、919、936、953、961或983氨基酸序列。-Xa-部分更优选是orf46.1、230、287、741、919、936、953、961和983。-Xa-部分最优选是orf46.1、287、741或961氨基酸序列。这些蛋白质中,各n-X-部分与其它各-X-部分具有序列相同性,此蛋白质称为“串联蛋白质”。优选n=2的串联蛋白质。(b)和(i)中的‘序列相同性’程度优选大于50%(如60%、70%、80%、90%、95%、99%或更高直至100%)。这包括突变体、同源物、直向同源物、等位基因变体等(如参见参考文献8)。相同性优选通过MPSRCH程序(Oxford Molecular)中应用的Smith-Waterman同源性检索算法来确定,使用参数空格开放罚分(gap openpenalty)=12和空格延伸罚分(gap extension penalty)=1的相关空格检索。通常,将两个蛋白质间50%或更高的相同性视为功能相等的指征。(c)和(j)中所指‘片段’应包括(a)、(d)、(e)、(f)、(g)或(h)的氨基酸序列的至少m个连续氨基酸,取决于具体序列。m是7或更大(如8、10、12、14、16、18、20、25、30、35、40、50、60、70、80、90、100、150、200或更大)。这些片段优选包含(a)、(d)、(e)、(f)、(g)或(h)氨基酸序列的抗原表位。优选的片段见参考文献9和10所述。优选的(c)和(j)片段是C-和/或N-末端的截短物(如Δ1-287、Δ2-287等)。优选的(b)、(c)和(j)序列删除了聚甘氨酸序列。已发现这样有助于表达。聚甘氨酸序列可表示为(Gly)g,其中g≥3(如4、5、6、7、8、9或更大)。如果-X-部分包含其野生型中的聚甘氨酸序列,在本专利技术的杂合蛋白质中优选删除此序列。这可以通过破坏或去除(Gly)g,如通过缺失(如CGGGGS→CGGGS、CGGS、CGS或CS)、通过取代(如CGGGGS→CGXGGS、CGXXGS、CGXGXS等)和/或通过插入(如CGGGGS→CGGXGGS、CGXGGGS等)而实现。优选缺失(Gly)g,缺失直至包含聚甘氨酸序列的蛋白质N-末端部分(如缺失SEQ ID 1中的残基1-32)本文称为‘ΔG’。删除聚甘氨酸序列具体用于蛋白质287、741、983和Tbp2(ΔG287、ΔG 741、ΔG 983和ΔG Tbp2-参考文献1和2)。优选的(c)和(j)片段删除了整个蛋白质结构域。这具体用于蛋白质961、287和ORF46。一旦蛋白质在概念上分成结构域,(c)和(j)片段可删除一个或多个这些结构域(如287B、287C、287BC、ORF461-433、ORF46433-608、961c-参考文献2;本文图4和5)。287蛋白质在概念上分成三个结构域,称为A、B和C(参见参考文献2的图5)。结构域B具有IgA蛋白酶的排列,结构域C具有转铁蛋白-结合蛋白的排列,结构域A显示与数据库序列无强排列。287的多态型排列见参考文献8所述。ORF46在概念上分成两个结构域种和血清型之间非常保守的第一结构域(氨基酸1-433ORF46.1)和不很保守的第二结构域(氨基酸433-608)。优选缺失该第二结构域,留下ORF46.1。ORF46的多态型排列见参考文献8所述。961蛋白质在概念上分成几个结构域(图4)。如果-X-部分含有野生型的前导肽序列,可将它包含在本专利技术的杂合蛋白质中或删除。当删除此前导肽时,这是(c)和(j)中氨基酸序列的优选例子。在一个实施方案中,缺失此前导肽,除了位于杂合蛋白质N-末端的-X-部分,即保留X1的前导肽,但出去删去X2…Xn的前导肽。这相当于缺失所有前导肽并采用X1的前导肽作为部分-A-。当n=2时,-X-部分的优选配对是ΔG287和230;ΔG287和936;ΔG287和741;961c和287;9本文档来自技高网...

【技术保护点】
一种具有以下分子式的杂合蛋白质:NH↓[2]-A-[-X-L-]n-B-COOH,其特征在于,其中L是任选的接头氨基酸序列,A是任选的N-末端氨基酸序列,B是任选的C-末端氨基酸序列,n是大于1的整数,X是:(a)orf1、 orf4、orf25、orf40、orf46.1、orf83、NMB1343、230、233、287、292、594、687、736、741、907、919、936、953、961或983氨基酸序列;(b)与(a)的氨基酸序列具有序 列相同性的氨基酸序列;或(c)含有(a)的氨基酸序列片段的氨基酸序列。

【技术特征摘要】
...

【专利技术属性】
技术研发人员:M皮扎
申请(专利权)人:启龙有限公司
类型:发明
国别省市:IT[意大利]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利