多样性合成肽和多肽文库的设计和构建制造技术

技术编号:9615152 阅读:92 留言:0更新日期:2014-01-30 01:28
本发明专利技术涉及多样性合成肽和多肽文库的设计和构建。本发明专利技术涉及多样性肽和多肽文库的设计和构建。具体而言,本发明专利技术涉及使用多重相关参数作为过滤器创建数据集的分析数据库设计方法;还涉及通过定向多重合成寡核苷酸合成(directed?multisyntheses?oligonucleotide?synthesis)来生成序列多样性的方法。本发明专利技术使得人们能够基于可个别直接限定的单一或多重相关关键参数,将大型、复杂的附注释的数据库简化成更简单的相关序列数据集。所述方法还使得人们能够基于这种方法,使用离散和简并寡核苷酸的多重合成群集来捕获多种多样的序列群集或其部分,来生成多样性文库。

Design and construction of a library of diverse synthetic peptides and peptides

The present invention relates to the design and construction of a library of diversity synthetic peptides and polypeptides. The present invention relates to the design and construction of a diversity peptide and polypeptide library. Specifically, the invention relates to a method of database design analysis using multiple parameters as a filter to create data sets; also relates to multiple synthesis directed by oligonucleotide synthesis (directed? Multisyntheses? Oligonucleotide? Synthesis) method to generate sequence diversity. The present invention enables a large, complex, annotated database to be reduced to simpler relative sequence data sets based on single or multiple relevant key parameters that can be individually directly defined. The method also allows one to employ a discrete and degenerate oligonucleotide based multiple synthesis cluster to capture a wide variety of sequences, clusters, or parts thereof to generate a diversity library.

【技术实现步骤摘要】
多样性合成肽和多肽文库的设计和构建本申请是申请日为2007年9月28日、中国申请号为200780044613.3、专利技术名称为“多样性合成肽和多肽文库的设计和构建”的专利技术申请的分案申请。
本专利技术涉及多样性肽和多肽文库的设计和构建。具体而言,本专利技术涉及使用多重相关参数作为过滤器的用于创建数据集的分析数据库设计方法;还涉及通过定向多重合成寡核苷酸合成(directed multisyntheses oligonucleotide synthesis)来生成序列多样性的方法。本专利技术使得人们能够基于可个别直接限定的单一或多重相关关键参数,将大型、复杂的附注释的数据库简化成更简单的相关序列数据集。所述方法还使得人们能够基于这种方法,使用离散和简并寡核苷酸的多重合成群集(multisynthetic collection)来捕获多种多样的序列群集或其部分,来生成多样性文库。专利技术背景基于肽或多肽的药物候选物的开发通常起始于筛选相关肽或多肽序列的文库。因此筛选治疗性抗体候选物的第一步通常是创建高多样性的抗体序列文库。有数种用于设计和构建多样性抗体文库的方法是本领域已知的。已经有人描述了丝状噬菌体-肽组合抗体文库可以通过改组重链和轻链基因来增加多样性(Kang 等,Proc.Natl.Acad.Sc1.USA, 88:11120-11123, (1991)),或通过易错聚合酶链式反应(PCR)向文库引入随机突变来增加多样性(Gram等,Proc.Natl.Acad.Sc1.USA, 89:3576-3580, (1992))。使用确定的框架作为生成抗体文库的基础已经由 Barbas 等,Proc.Natl.Acad.Sc1.USA89:4457-4461 (1992)(随机化CD3-H3) ;Barbas 等,Genel37:57-62 (2003)(对 VKCDR3 的延伸随机化);和 Hayanashi等,Biotechniquesl7:310 (1994)(通过重叠序列延伸和PCR对抗体CDR区进行同时诱变)描述。其它文献报导了⑶R-H3文库与单一八基因的组合(Nissim等,EMBOJ.13:692-698(1994)), CDR-H3文库与'基因的限定群集的组合(De Kruif等,J.Mol.Biol.248:97-105 (1995))或 CDR-H3 文库与 Vl 基因的随机化库(randomized repertoire)的组合(Griffiths 等,EMBO J.13:3245-3260 (1994))。另见美国专利Nos.5667988 ;6096551 ;7067284,它们描述了使用通用或随机化的免疫球蛋白轻链来产生抗体文库的方法。Knappik等,J.Mol.Biol.296:57-86 (2000)描述了一种用于设计和构建人抗体文库的不同构思,称为HuCAL (Human Combinatorial Antibody Libraries ;人类组合抗体文库)。这种方法基于这 样的发现,在免疫应答过程中被频繁使用的人Vh和\亚家族各自分别由一种共有框架所代表,这样就有七个重链的HuCAL共有基因和七个轻链的HuCAL共有基因,它们产生49种可能的组合。所有基因均通过全合成制备,同时考虑密码子选择、促进蛋白质聚集的不利残基和所有CDR侧翼的独特及通用限制位点等因素。所述方法导致生成包含⑶R的模块化抗体,这些⑶R可按照需要转化成不同抗体形式。HuCAL抗体文库的设计和合成在美国专利6300064 ;6696248 ;6706484 ;和6828422中有描述。尽管有这些以及其它的进展,还是非常需要用于设计和构建高多样性(多)肽(如抗体)文库的新的有效方法。
技术实现思路
本专利技术涉及多样性肽和多肽文库的设计和构建。在一个方面,本专利技术涉及用于数据库多样性分析的方法,所述数据库包含相关的氨基酸序列,所述相关的氨基酸序列以至少一个共享的序列基序为特征,所述方法包括步骤:(a)对所述相关的氨基酸序列进行比对;(b)通过对包含共享序列基序的相关氨基酸序列应用预定的两个或更多个过滤器(filter)的组合来创建第一数据集;(c)分析第一数据集在共享序列基序内的位置氨基酸使用频率(positionalamino acid usage frequency);和(d)创建以共享序列基序内的一个或多个氨基酸位置处的最小阈值氨基酸使用频率(minimum threshold amino acid usage frequency)为特征的第二数据集。在步骤(d)中,可以为共享序列基序内的任何和全部氨基酸位置指定最小阈值氨基酸使用频率。 在一个具体实施方案中,为共享序列基序内的大多数氨基酸位置指定最小阈值氨基酸使用频率。在另一个具体实施方案中,为共享序列基序内的全部氨基酸位置指定最小阈值氨基酸使用频率。在多种实施方案中,为共享序列基序内的具体氨基酸位置指定的最小阈值氨基酸使用频率可以是相同或不同的。在一个进一步的实施方案中,最小阈值氣基酸使用频率被设定为给共孚序列基序内的大部分氨基酸位置提供最小总和氨基酸使用率(minimum sum amino acid usage)。在一个更进一步的实施方案中,最小阈值氨基酸使用频率被设定为给所述共享序列基序内的所有氨基酸位置提供最小总和氨基酸使用率。可以将最小总和氨基酸使用率设定为任何期望的水平,并且在具体的实施方案中是至少约40%,或至少约45%,或至少约50%,或至少约55%,或至少约60%,或至少约65%,或至少约70%,或至少约75%,或至少约80%,或至少约85%,或至少约90%。在另一个实施方案中,所述相关的氨基酸序列是抗体序列。在另一个实施方案中,所述相关的氨基酸序列包含抗体重链序列。在一个进一步的实施方案中,所述相关的氨基酸序列包含抗体轻链序列。如果所述相关的氨基酸序列是抗体序列,那么共享序列基序可以是,例如,CDR序列,诸如⑶Rl、⑶R2或⑶R3序列。对可用于本专利技术方法的步骤(b)中的过滤器的性质或数目没有限制。在一种具体的实施方案中,在抗体序列的情况下,预定的过滤器组合可以选自下组:(I)抗体重链或轻链的同种型;(2)CDRU CDR2和CDR3序列中一种或多种的长度;(3)在CDRU CDR2和CDR3序列中的一种或多种内的一个或多个预定位置处一个或多个预定氨基酸残基的存在;(4)框架类型;(5)抗体结合的抗原;(6)抗体亲和力;和(7) CDR序列之外的位置氨基酸残基(positional amino acid residues)。在一个进一步的实施方案中,抗体重链和/或轻链⑶R1XDR2和⑶R3序列中的至少一个的大小是匹配的。例如,这个参数可以作为附加的过滤器与抗体重链和/或轻链序列的同种型组合。在多种实施方案中,位置氨基酸使用频率是至少约3%,或至少约5%,或至少约10%,或至少约15% ;或设定在约3%至约15%,或约5%至约10%。在本专利技术的方法的另一个实施方案中,CDR序列内的每个氨基酸以相同的位置氨基酸使用频率为特征。在一个供选择的实施方案中,位置氨基酸使用频率在所述CDR序列内的至少两个氨基酸残基处不同。 在另一个实施方案中本文档来自技高网
...

【技术保护点】
一种产生肽或多肽序列的组合文库的方法,包括使用组合式寡核苷酸合成来将氨基酸侧链化学多样性引入所述肽或多肽序列的两个或更多个氨基酸位置。

【技术特征摘要】
2006.10.02 US 60/849,0351.一种产生肽或多肽序列的组合文库的方法,包括使用组合式寡核苷酸合成来将氨基酸侧链化学多样性引入所述肽或多肽序列的两个或更多个氨基酸位置。2.权利要求1的方法,其中所述氨基酸侧链化学多样性被设计为模拟在所述肽或多肽序列中天然存在的多样性。3.权利要求1或权利要求2的方法,其中所述文库是抗体文库。4.权利要求3的方法,其中所述抗体文库包含抗体重链可变域序列。5.权利要求3的方法,其中所述文库包含抗体轻链可变域序列。6.权利要求3的方法,其中所述文库是...

【专利技术属性】
技术研发人员:劳伦斯霍罗威茨拉梅什R巴特阿伦L库尔茨曼
申请(专利权)人:航道生物技术有限责任公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1