合理设计的合成抗体文库及其用途制造技术

技术编号:5441388 阅读:245 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供通过特别设计具有定向序列多样性和长度多样性的文库来克服产生编码抗体的多核苷酸文库已知方法的固有缺点的方法。所述文库被设计成反映由人免疫系统天然产生的免疫前抗体库并且基于对公众可获取的人抗体序列数据库的分析研究所获悉的合理设计。

【技术实现步骤摘要】
【国外来华专利技术】专利说明相关申请本申请要求2007年9月14日申请的美国临时申请顺序号60/993,785的优先权, 该申请通过引用全部结合到本文中。
技术介绍
抗体作为研究工具以及在诊断和治疗应用中具有重要意义。然而,有用抗体的鉴 定十分困难,而且--旦被鉴定出来,常常需要相当可观的重新设计或‘人源化’后,才适合于 治疗用途。用于鉴定所需抗体的现有方法通常包括代表性抗体的噬菌体展示,所述代表性抗 体例如通过扩增得自B细胞或组织的核酸而获得的人文库(human l ibraries),又或者合 成文库。然而,这些方法都有局限性。例如,本领域已知的大多数人抗体文库只含有可通过 实验从来源(例如B细胞)俘获或克隆的抗体序列多样性。因此,人抗体文库可能完全缺限性,例如编码非天然存在(例如非人类)的具有免疫原性潜力的序列的可能。此外,本领 域的某些合成文库受以下两种限制中的至少一种所困(1)文库在理论上可能含有的成员 数目(即理论多样性(theoretical diversity))可能大于实际上可以合成的成员数目,和 (2)实际合成的成员数目可能大得无法筛选出物理实现(physical realization)的文库 中的每个成员,因此降低了可以分离具有特定性质的文库成员的概率。例如,能够筛选出1012个文库成员的物理实现的文库(例如酵母展示、噬菌体展 示、核糖体展示等)可能只采集到包含在具有1013个成员的文库中的序列的约10%。假定 CDRH3 长度中位值约为 12. 7 个氨基酸(Rock 等,J. Exp. Med.,1994,179 :323-328),仅 CDRH3 中的理论序列变异体数就大约有2012'7种,即约3. 8X1016种变异体。这一数字未计入发生 在CDRH1和CDMI2、重链构架区以及与不同轻链配对中的已知变异,每条轻链还在其相应的 CDRL1、CDRL2和CDRL3中具有变异。最后,从这些文库中分离出的抗体常常不适于改进候 选分子结合的合理亲和力成熟技术。因此’存在对具有有系统地代表候选抗体的定向多样性(directeddiversity) 的较小(即能够合成和物理实现的)抗体文库的需要,所述候选抗体是非免疫原性的 (即更似人的)并具有所需性质(例如识别大量抗原的能力)。然而,要获得这类文库 需要权衡限制文库所代表的序列多样性(使得能够合成和物理实现,可能具有超采样 (over samp ling),同时限制引入非人类序列)而同时保持足以识别大量抗原的多样性水平 的竞争目的。在本专利技术之前,本领域已知“虽然含有重链CDR3长度多样性的文库已有报道, 但是无法合成编码天然重链CDR3库(repertoire)中存在的序列多样性和长度多样性两者 的DM” (Hoet等,Nat. Biotechnol. ,2005,23 :344,通过引用其全部予以结合)。因此,最好是具有下列特征(a) (e)的抗体文库(a)可以容易地合成,(b)可 以物理实现并且在某些情况下可以超采样,(c)含有足够的多样性以识别由免疫前人抗体 库(preimmune human repertoire)所识别的所有抗原(即在负选择之前),(d)在人体内 是非免疫原性的(即包含人源序列),和(e)含有CDR长度多样性和序列多样性,以及构架多样性,代表了天然存在的人抗体。本专利技术的实施方案至少首次提供具有这些所需特征的 抗体文库(antibody libraries)。专利技术概述本专利技术至少涉及多个合成多核苷酸文库、产生和使用本专利技术文库的方法、包括本 专利技术文库的试剂盒和计算机可读形式。在一些实施方案中,本专利技术的文库被设计成反映由 人免疫系统天然产生的免疫前抗体库(preimmune r印ertoire),并且本专利技术的文库基于对 公众可获取的人抗体序列数据库的分析研究所获悉的合理设计。应当了解的是,下文中描 述了本专利技术的某些非限制性实施方案。正如本说明书全文中所描述的一样,本专利技术还包括 许多其它的实施方案。在某些实施方案中,本专利技术包括合成多核苷酸文库,其中所述多核苷酸编码至少 106种独特的抗体CDI H3氨基酸序列,所述CDRH3氨基酸序列包含(1)0 约3个氨基酸的N1氨基酸序列,其中N1氨基酸序列中的每个氨基酸都处 在由人B细胞功能性表达的CDRH3氨基酸序列中的N1氨基酸序列相应位置上12个最频繁 出现的氨基酸之中;(ii)人CDRH3DH氨基酸序列、其N-端和C-端截短、或者与它们之中的任一个有至 少约80%同一性的序列;(iii)0 约3个氨基酸的N2氨基酸序列,其中N2氨基酸序列中的每个氨基酸都 处在由人B细胞功能性表达的CDRH3氨基酸序列中的N2氨基酸序列相应位置上12个最频 繁出现的氨基酸之中;和(iv)人CDRH3H3-JH氨基酸序列、其N-端截短、或者与它们之中的任一个有至少约 80%同一性的序列。在其它实施方案中,本专利技术包括合成多核苷酸文库,其中所述多核苷酸编码至少 约106种独特的抗体CDRH3氨基酸序列,所述CDim3氨基酸序列包含(i)() 约3个氨基酸的N1氨基酸序列,其中(a)最N-端的N1氨基酸,如果存在,则选自R、G、P、L、S、A、V、K、I、Q、T和D ;(b)第二最1端的附氨基酸,如果存在,则选自0、?、1 、5丄^、£、六、0、1、1和1(; 和(c)第三最N-端的M氨基酸,如果存在,则选自G、R、P、S、L、A、V、T、E、D、K和F ; (ii)人CDRH3DH氨基酸序列、其N_端和C_端截短、或者与它们之中的任一个有至 少约80%同一性的序列(iii)0 约3个氨基酸的N2氨基酸序列,其中(a)最N-端的N2氨基酸,如果存在,则选自G、P、R、L、S、A、T、V、E、D、F和H ;(b)第二最N-端的N2氨基酸,如果存在,则选自6、卩、1 、3、1\[、六1、£、¥、0和1(; 和(c)第三最N-端的N2氨基酸,如果存在,则选自G、P、S、R、L、A、T、V、D、E、W和Q ; 和 (iv)人CDRH3 H3-JH氨基酸序列、其N_端截短、或者与它们之中的任一个有至少 约80%同一性的序列。少约106种独特的抗体CDRH3氨基酸序列,所述CDRH3氨基酸序列与下式所表示的氨基酸 序列有至少约80%相同[X] - [N1 ] - [DII] - [N2] - [IL3-JII],其中(i) X是任何氨基酸残基或无氨基酸残基;(ii) N1 是选自以下的氨基酸序列G、P、R、A、S、L、T、V、GG、GP、GR、GA、GS、GL、GT、 GV、PG、RG、AG、SG、LG、TG、VG、PP、PR、PA、PS、PL、PT、PV、RP、AP、SP、LP、TP、VP、GGG、GPG、 GRG、GAG、GSG、GLG、GTG、GVG、PGG、RGG、AGG、SGG、LGG、TGG、VGG、GGP、GGR、GGA、GGS、GGL、 GGT、GGV、D、E、F、H、I、K、M、Q、W、Y、AR、AS、AT、AY、DL、DT、EA、EK、FH、FS、HL、冊、IS、KV、 LD、LE、LR、LS、LT、NR、NT、QE、QL、QT、RA、RD、RE、RF、RH、RL、RR、RS、RV、SA、S本文档来自技高网...

【技术保护点】
一种合成多核苷酸文库,其中所述多核苷酸编码至少106种独特的抗体CDRH3氨基酸序列,所述CDRH3氨基酸序列包含:(i)0~约3个氨基酸的N1氨基酸序列,其中N1氨基酸序列中的每个氨基酸都处在由人B细胞功能性表达的CDRH3氨基酸序列中的N1氨基酸序列相应位置上12个最频繁出现的氨基酸之中;(ii)人CDRH3DH氨基酸序列、其N-端和C-端截短、或者与它们之中的任一个有至少约80%同一性的序列;(iii)0~约3个氨基酸的N2氨基酸序列,其中N2氨基酸序列中的每个氨基酸都处在由人B细胞功能性表达的CDRH3氨基酸序列中的N2氨基酸序列相应位置上12个最频繁出现的氨基酸之中;和(iv)人CDRH3H3-JH氨基酸序列、其N-端截短、或者与它们之中的任一个有至少约80%同一性的序列。

【技术特征摘要】
【国外来华专利技术】US 2007-9-14 60/993785一种合成多核苷酸文库,其中所述多核苷酸编码至少106种独特的抗体CDRH3氨基酸序列,所述CDRH3氨基酸序列包含(i)0~约3个氨基酸的N1氨基酸序列,其中N1氨基酸序列中的每个氨基酸都处在由人B细胞功能性表达的CDRH3氨基酸序列中的N1氨基酸序列相应位置上12个最频繁出现的氨基酸之中;(ii)人CDRH3DH氨基酸序列、其N-端和C-端截短、或者与它们之中的任一个有至少约80%同一性的序列;(iii)0~约3个氨基酸的N2氨基酸序列,其中N2氨基酸序列中的每个氨基酸都处在由人B细胞功能性表达的CDRH3氨基酸序列中的N2氨基酸序列相应位置上12个最频繁出现的氨基酸之中;和(iv)人CDRH3 H3-JH氨基酸序列、其N-端截短、或者与它们之中的任一个有至少约80%同一性的序列。2.一种抗体,所述抗体分离自权利要求1的文库的多肽表达产物。3.权利要求1的文库,其中一种或多种CDRH3氨基酸序列还包含N-端尾残基。4.权利要求3的文库,其中所述N-端尾残基选自G、D和E。5.权利要求1的文库,其中所述Nl氨基酸序列选自G、P、R、A、S、L、T、V、GG、GP、GR、 GA、GS、GL、GT、GV、PG、RG、AG、SG、LG、TG、VG、PP、PR、PA、PS、PL、PT、PV、RP、AP、SP、LP、TP、 VP、GGG、GPG、GRG、GAG、GSG、GLG、GTG、GVG、PGG、RGG、AGG、SGG、LGG、TGG、VGG、GGP、GGR、GGA、 GGS、GGL, GGT、GGV、D、E、F、H、I、K、M、Q、W、Y、AR、AS、AT、AY、DL、DT、EA、EK、FH、FS、HL、Hf、 IS、KV、LD、LE、LR、LS、LT、NR、NT、QE、QL、QT、RA、RD、RE、RF、Rli、RL、RR、RS、RV、SA、SD、SE、 SF、SI、SK、SL、SQ、SR、SS、ST、SV、TA、TR、TS、TT、Tff、VD、VS、WS、YS、AAE、AYH、DTL, EKR、I SR. NTP, PKS, PRP, PTA, PTQ、REL, RPL, SAA, SAL、SGL、SSE, TGL, WGT 及其组合。6.权利要求1的文库,其中所述N2氨基酸序列选自G、P、R、A、S、L、T、V、GG、GP、GR、 GA、GS、GL、GT、GV、PG、RG、AG、SG、LG、TG、VG、PP、PR、PA、PS、PL、PT、PV、RP、AP、SP、LP、TP、 VP、GGG, GPG、GRG、GAG、GSG、GLG、GTG,GVG, PGG, RGG, AGG, SGG、LGG、TGG、VGG,GGP, GGR、GGA、 GGS、GGL, GGT、GGV、D、E、F、H、I、K、M、Q、W、Y、AR、AS、AT、AY、DL、DT、EA、EK、FH、FS、HL、HW、 IS、KV、LD、LE、LR、LS、LT、NR、NT、QE、QL、QT、RA、RD、RE、RF、RH、RL、RR、RS、RV、SA、SD、SE、 SF、SI、SK、SL、SQ、SR、SS、ST、SV、TA、TR、TS、TT、TW、VD、VS、WS、YS、AAE、AYH、DTL、EKR、ISR、 KTP, PKS、PRP、PTA, PTQ、REU RPL, SAA, SAL、SGL, SSE, TGL, ffGT 及其组合。7.权利要求1的文库,其中所述H3-JH氨基酸序列选自AEYFQH、EYFQH、YFQH、FQH、QH、 H、YffYFDL, WYFDL、YFDL、FDL、DL、L、AFDV、FDV、DV、V、YFDY、FDY、DY、Y、NWFDS、WFDS、FDS、 DS、S、YYYYYGMDV、YYYYGMDV、YYYGMDV、YYGMDV、YGMDV、GMDV 和 MDV。8.权利要求1的文库,其中所述多核苷酸还包含促进同源重组的5’多核苷酸序列和 3’多核苷酸序列。9.权利要求1的文库,其中所述多核苷酸还编码一种或多种是CDMB氨基酸序列 的N 端的重链chassis氨基酸序列,并且所述一种或多种重链chassis氨基酸序列选 自由 IGHV卜2、 IGHV1-3、 IGHV1-8、 IGHV1-18、 IGHV1-24、 IGHV1-45、 IGHV1-46、 IGHV卜58、 IGHV1-69、 IGHV2-5、 IGHV2-26、 IGHV2-70、 IGHV3-7、 IGHV3-9、 IGHV3-11、 IGHV3-13、 IGHV3-15、 IGHV3-20、 IGHV3-21、 IGHV3-23、 IGHV3-30、 IGHV3-33、 IGHV3-43、 IGHV3-48、IGHV3-49、 IGHV3-53、 IGHV3-64、 IGHV3-66、 IGHV3-72、 IGHV3-73、 IGHV3-74、 IGHV4-4、 IGHV4-28、 IGHV4-31、 IGHV4-34、 IGHV4-39、 IGHV4-59、 IGHV4-61、 IGHV4-B、 IGHV5-51、 IGIIV6-1和IGHV7-4-1编码的约Kabat氨基酸1 约Kabat氨基酸94,或者与它们之中的 任一个有至少约80 %同一性的序列。10.权利要求1的文库,其中所述多核苷酸还编码一种或多种是CDim3氨基酸序列 的C-端的FRM4氨基酸序列,其中所述一种或多种FRM4氨基酸序列选自由IGHJl、IGHJ2、 IGHJ3、IGHJ4、IGHJ5和IGHJ6编码的FRM4氨基酸序列,或者与它们之中的任一个有至少约 80%同一性的序列。11.权利要求10的文库,其中所述多核苷酸还编码一种或多种是FRM4氨基酸序列的 C-端的免疫球蛋白重链恒定区氨基酸序列。12.权利要求11的文库,其中所述CDRH3氨基酸序列表达为全长重链的组成部分。13.权利要求12的文库,其中所述全长重链选自IgGl、IgG2、IgG3和IgG4或其组合。14.权利要求1的文库,其中所述多核苷酸还编码替代性支架。15.权利要求1的文库,其中所述CDRH3氨基酸序列的长度为约2 约30、约8 约19 或约10 约18个氨基酸残基。16.权利要求1的文库,其中所述文库的合成多核苷酸编码约IO6 约1()14、约IO7 约 1013、约IO8 约1012、约IO9 约IO12或约IO10 约IO12种独特的CDRH3氨基酸序列。17.一种多肽文库,所述多肽文库由权利要求1的合成多核苷酸文库编码。18.一种载体文库,所述载体文库包含权利要求1的多核苷酸文库。19.一种细胞群,所述细胞包含权利要求18的载体。20.权利要求19的细胞群,其中所述细胞群的倍增时间为约1小时 约3小时、约3小 时 约8小时、约8小时 约16小时、约16小时 约20小时或20小时 约30小时。21.权利要求19的细胞群,其中所述细胞是酵母细胞。22.权利要求21的酵母细胞,其中所述酵母是酿酒酵母(Saccharomyces cerevisiae)。23.—种合成多核苷酸文库,其中所述文库的总的理论多样性为N种独特的CDRH3序 列,其中N为约IO6 约IO15 ;并且其中物理实现的总的理论⑶Ι Ι3多样性的大小为至少约 3K,因此得出包含在文库总的理论多样性内的任何个别CDRH3序列存在于实际文库中的概 率为至少约95%。24.一种合成多核苷酸文库,其中所述多核苷酸编码至少约IO6种独特的抗体CDim3氨 基酸序列,所述CDRH3氨基酸序列包含(i)0 约3个氨基酸的Nl氨基酸序列,其中(a)最N-端的Nl氨基酸,如果存在,则选自R、G、P、L、S、A、V、K、I、Q、T和D;(b)第二最N-端的Nl氨基酸,如果存在,则选自0、卩、! 、3^』、六、0、1、11和1(;和(c)第三最N-端的Nl氨基酸,如果存在,则选自G、R、P、S、L、A、V、T、E、D、K和F;( )人⑶RH3DH氨基酸序列、其N-端和C-端截短、或者与它们之中的任一个有至少约80%同一性的序列;(iii)0 约3个氨基酸的N2氨基酸序列,其中(a)最N-端的N2氨基酸,如果存在,则选自G、P、R、L、S、A、T、V、E、D、F和II ;(b)第二最N-端的N2氨基酸,如果存在,则选自G、P、R、S、T、L、A、V、E、Y、D和K;和(c)第三最N-端的N2氨基酸,如果存在,则选自0、卩、3、! ^、了^、0』、1和0;和(iv)人CDI H3H3-JH氨基酸序列、其N-端截短、或者与它们之中的任一个有至少约80%同一性的序列。25.--种抗体,所述抗体分离自权利要求24的文库的多肽表达产物。26.一种合成多核苷酸文库,其中所述多核苷酸编码至少约106种独特的抗体CDim3氨 基酸序列,所述CDmi3氨基酸序列与下式所表示的氨基酸序列有至少约80%相同[X] — [Ni]-[DH]-[K2]-[H3-JH],其中(i)X是任何氨基酸残基或无氨基酸残基;(ii)Nl 是选自以下的氨基酸序列G、P、R、A、S、L、Τ、V、GG、GP、GR、GA、GS、GL、GT、GV、 PG、RG、AG、SG、LG、TG、VG、PP、PR、PA、PS、PL、PT、PV、RP、AP、SP、LP、TP、VP、GGG、GPG、GRG、 GAG、GSG、GLG、GTG、GVG、PGG、RGG、AGG、SGG、LGG、TGG、VGG、GGP、GGR、GGA、GGS、GGU GGT、 GGV、D、E、F、H、I、K、M、Q、W、Y、AR、AS、AT、AY、DL、DT、EA、EK、FH、FS、HL、HW、IS、KV、LD、LE、 LR、LS、LT、NR、NT、QE、QL、QT、RA、RD、RE、RF、RH、RL、RR、RS、RV、SA、SD、SE、SF、Si、SK、SL、 SQ、SR、SS、ST、SV、TA、TR、TS、TT、TW、VD、VS、WS、YS、AAE、AYII、DTL、EKR、ISR、NTP、PKS、PRP、 PTA, PTQ, REL, RPL, SAA, SAU SGL, SSE, TGL, WGT 及其组合;(iii)DH是选自以下的氨基酸序列由 IGHDl-I、IGHD1-20、IGHD1-26、IGHD1-7、 IGHD2-15、IGHD2-2、IGHD2-21、IGHD2-8、IGHD3-10、IGHD3-16、IGHD3-22、IGHD3-3、IGHD3-9、 IGIID4-17、IGIID4-23、IGHD4-4、IGHD-4-11、IGIID5-12、IGHD5-24、IGHD5-5、IGHD-5-18、 IGHD6-1.3、IGHD6-19、IGHD6-25、IGHD6-6和IGHD7-27编码的不包括终止密码子的所有可能 读框及其N-端和C-端截短;(iv)N2 是选自以 F的氨基酸序列G、P、R、A、S、L、Τ、V、GG、GP、GR、GA、GS、GL、GT、GV、 PG、RG、AG、SG、LG、TG、VG、PP、PR、PA、PS、PL、PT、PV、RP、AP、SP、LP、TP、VP、GGG、GPG、GRG、 GAG、GSG、GLG、GTG、GVG、PGG、RGG、AGG、SGG、LGG、TGG、VGG、GGP、GGR、GGA、GGS、GGL, GGT、 GGV、D、E、F、H、I、K、M、Q、W、Y、AR、AS、AT、AY、DL、DT、EA、EK、FH、FS、HL、HW、IS、KV、LD、LE、 LR、LS、LT、NR、NT、QE、QL、QT、RA、RD、RE、RF、RH、RL、RR、RS、RV、SA、SD、SE、SF、Si、SK、SL、 SQ、SR、SS、ST、SV、TA、TR、TS、TT、Tff、VD、VS、WS、YS、AAE、AYH、DTL、EKR、ISR、NTP、PKS、PRP、 PTA, PTQ、REL, RPL, SAA、SAL、SGU SSE, TGU WGT 及其组合;禾口(ν) H3-JH 是选自以下的氨基酸序列AEYFQH、EYFQH、YFQH、FQH, QH、H、YWYFDL, WYFDL, YFDL、FDL、DL、L、AFDV、FDV, DV, V、YFDY、FDY, DY, Y、NWFDS、WFDS、FDS、DS、S、YYYYYGMDV、 YYYYGMDV,YYYGMDV,YYGMDV,YGMDV,GMDV和MDV,或者与它们之中的任一个有至少80%同一 性的序列。27.一种抗体,所述抗体分离自权利要求26的文库的多肽表达产物。28.—种合成多核苷酸文库,其中所述文库基本由众多多核苷酸组成,所述多核苷酸编 码与下式所表示的氨基酸序列有至少约80%相同的CDI H3氨基酸序列[X] -[Ni] -[DH] -[N2] -[H:3-JH:],其中(i)X是任何氨基酸残基或无氨基酸残基;(ii)Nl 是选自以 F的氨基酸序列G、P、R、A、S、L、T、V、GG、GP、GR、GA、GS、GL、GT、GV、 PG、RG、AG、SG、LG、TG、VG、PP、PR、PA、PS、PL、PT、PV、RP、AP、SP、LP、TP、VP、GGG、GPG、GRG、GAG、GSG、GLG、GTG、GVG、PGG、RGG、AGG、SGG、LGG、TGG、VGG、GGP、GGR、GGA、GGS、GGL, GGT、 GGV、D、E、F、H、I、K、M、Q、W、Y、AR、AS、AT、AY、DL、DT、EA、EK、FH、FS、HL、Hf、IS、KV、LD、LE、 LR、LS、LT、NR、NT、QE、QL、QT、M、RD、RE、RF、RH、RL、RR、RS、RV、SA、SD、SE、SF、Si、SK、SL、 SQ、SR、SS、ST、SV、TA、TR、TS、TT、TW、VD、VS、WS、YS、AAE、AYH、DTL, EKR、ISR、NTP、PKS、PRP、 PTA、PTQ、REL、RPL、SAA, SAL、SGL, SSE, TGL, WGT 及其组合;(iii)DH是选自以 F 的氨基酸序列由 IGHD1-1、IGHD1-20、IGHD1-26、IGHD1-7、 IGIID2-15、IGHD2-2、IGIID2-21、IGHD2-8、IGIID3-10、IGIID3-16、IGHD3-22、IGIID3-3、IGHD3-9、 IGHD4-17、 IGHD4-23、 IGHD4-4、 IGHD-4-11、 IGHD5-12、 IGHD5-24、 IGHD5-5、 IGHD-5-18、 IGHD6-13、IGHD6-19、IGHD6-25、IGHD6-6和IGHD7-27编码的不包括终止密码子的所有可能 读框及其N-端和...

【专利技术属性】
技术研发人员:M瓦斯克斯M费尔德豪斯TU格恩格罗斯KD维特拉普
申请(专利权)人:阿迪马布公司
类型:发明
国别省市:US[美国]

相关技术
    暂无相关专利
网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1