抗体/抗体片段的选择制造技术

技术编号:27098770 阅读:24 留言:0更新日期:2021-01-25 18:40
本发明专利技术涉及在选择方法中选择抗体和/或抗体片段。本发明专利技术的主题为一种方法、一种系统和一种计算机程序产品,用于为对抗体和/或抗体片段的轻链和重链的可变区进行编码的基因对产生分数值。可基于分数值来选择抗体和/或抗体片段。体片段。体片段。

【技术实现步骤摘要】
抗体/抗体片段的选择


[0001]本专利技术涉及在选择方法中选择抗体和/或抗体片段。本专利技术的主题为一种方法、一种系统和一种计算机程序产品,用于为对抗体和/或抗体片段的轻链和重链的可变区进行编码的基因对产生分数值。可基于分数值来选择抗体和/或抗体片段。

技术介绍

[0002]作为针对外源入侵物的防御系统,人类免疫系统构成各种器官、细胞类型和分子的复杂网络。
[0003]抗体(也称为免疫球蛋白)是来自球蛋白类别的蛋白质,它们在脊椎动物中作为对某些物质(所谓的抗体)的响应而形成。抗体服务于免疫系统;抗体由白细胞类、B淋巴细胞产生。
[0004]几乎仅大分子或结合到颗粒上的分子(例如在细菌表面上的脂多糖)作为抗原起作用。某一种抗原一般诱发仅某几种特定抗体的形成,这些抗体通过特异的非共价键合大多数情况下仅识别此种外源物质。
[0005]抗体对抗原的特异性键合构成了针对入侵的外源物质的防御的主要部分。
[0006]每种抗体由两个相同的重链(英文:heavy chains,H)和两个相同的轻链(英文:light chains,L)组成,这些链通过共价的二硫桥键彼此联接成Y形结构。轻链分别由一个可变区和一个恒定区组成。将其称为V
L
和C
L
。相反,重链分别具有一个可变区和三个(IgG,IgA)或四个(IgM,IgE)恒定区。类似地将其称为V
H
和C
H
1、C
H
2、C
H
3。
[0007]一个轻链和一个重链的可变区构成抗原结合位点;这些抗原结合位点因此对于药物学、免疫学和/或诊断学目的而言具有特殊的意义。为了例如在药物中使用抗体和/或抗体片段,建立并分析了抗体和/或抗体片段的大型文库。
[0008]用于生成和表征抗体文库的广泛使用的技术是“噬菌体展示”方法,其中可以将相应的感兴趣的蛋白质作为融合多肽在细菌噬菌体外壳蛋白上进行表达并且通过结合到固定的或可溶的生物素标记的配体(抗原)上来进行选择。以此方式构造的噬菌体可以被视为紧凑的基因单元,该单元已经将表现型和基因型特性组合。“噬菌体展示”技术已经成功应用于抗体、抗体片段、酶、DNA结合蛋白质等。
[0009]为了例如使用抗体文库的噬菌体展示,首先从生物体中分离相关的细胞。它涉及尤其在血液中、骨髓中和淋巴结中存在的浆细胞。从这些细胞中分离mRNA,然后将其转录成cDNA。
[0010]借助于聚合物酶链式反应(PCR),从cDNA中复制出抗体的轻链(V
L
)和重链(V
H
)的可变区的基因。
[0011]在特殊的噬菌粒载体中,将每个基因组与M13噬菌体的外壳蛋白pIII(次要外壳蛋白)的截短基因相连并且用其转化大肠杆菌(Escherichia coli)。
[0012]由此,大肠杆菌细菌表达含有scFv片段或Fab抗体片段的pIII融合蛋白质。通过信号肽,将融合蛋白质运输到细胞周质中,在那里融合蛋白质折叠成功能性的scFv或通过二
硫桥键连接的Fab片段。Fv或Fab部分首先通过pIII片段保持锚定在大肠杆菌内膜中并且在噬菌体组装完成时结合到衣壳上。
[0013]通过通常负责细菌感染的外壳蛋白pIII,在与M13辅助噬菌体联合感染之后,功能性的抗体片段在新形成噬菌体的成熟过程中被装入其外壳中。同时,含有对应抗体片段的相关基因信息的噬菌粒被装入新形成噬菌体的内部。即,这些重组的噬菌体中的每一个理论上在其表面上具有不同的抗体片段并且同时在其内部具有相关的基因(V
L
和V
H
),与(人)体内的数十亿个B细胞的类似。
[0014]在所谓的生物淘选中,可以经由在表面上暴露的抗体片段,通过与经固定的配体(抗原)的相互作用,而从十亿倍的不相关噬菌体的背景中选择“结合”的噬菌体。
[0015]生物淘选通常涉及多个选择循环(淘选轮次)。这通常涉及将基质暴露于噬菌体展示文库,从而可以进行若干噬菌体的结合。非特异性结合的和弱结合的噬菌体被洗掉。在清洗之后仍然结合的且因此为特异性的噬菌体随后被分离(洗脱)。使所洗脱的噬菌体增殖并且在进一步的淘选轮次中重新暴露于基质,直到得到有效结合噬菌体的富集群体。
[0016]在选择过程的末尾,可以从所分离的噬菌体中简单地分离相关的抗体基因并测序。此时测序得到了关于抗体(片段)的图谱的信息。文献中描述了其他的用于选择抗体和/或抗体片段的方法(参见例如Sai T.Reddy等人:Monoc/onal antibodies isolated without screening by anaylzing the variable-gene repertoire of plasma cells,Nature Biotechnology Vol.28No.9,Sept.2010,965-971)。
[0017]用于测定序列的标准方法为根据Sanger的双脱氧法(链终止合成)。如此测序的DNA段(读取,Reads)的长度可以达到超过1000个碱基对,但是这是与高成本和耗时相关联的。替代方案为下一代测序(英文:Next Generation Sequencing,NGS)。由于在非常小的面积上检测许多平行运行且在空间上分开的测序反应,与标准方法相比,以较短的读取长度快速实现了明显更高的通量。NGS实现了106数量级的测序反应。这意味着可能确定整个文库的多样性和质量。
[0018]在生物淘选选择方法中,最后的池虽然不断富集特异性结合的抗体片段,但是仍然总是包含大量的不同抗体片段。这个数量过大,而无法详细研究所有的抗体片段;必须进行选择。在很多情况下,根据在最后的池中抗体片段的V
H
基因的数量将抗体片段排序。一般来说,已经富集的抗体片段越多,其V
H
基因在最后的池中的数量也越多。
[0019]但是,在最后的池中的V
H
基因的数量对于选择特别感兴趣和/或有价值的抗体而言不是充分的依据。
[0020]因此所期望的是为鉴别有前景的抗体片段提供更好的帮助。

技术实现思路

[0021]这个目的通过独立权利要求的主题实现。优选的实施方式存在于从属权利要求、本说明书以及附图中。
[0022]在第一方面,本专利技术提供了一种方法,该方法包括以下步骤:
[0023]-接收涉及V
L
基因和V
H
基因的特征,其中V
L
基因和V
H
基因对抗体和/或抗体片段的轻链和重链的可变区进行编码,其中这些抗体和/或抗体片段源自选择方法,其中该选择方法包括多个彼此相继的选择循环,其中每一个选择循环的结果为具有抗体和/或抗体片段
的池,
[0024]-对于这些池中的V
L
基因和V
H
基因对来构造特征向量,其中每一对的V
L
基本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种方法,包括以下步骤:-接收涉及V
L
基因和V
H
基因的特征,其中V
L
基因和V
H
基因对抗体和/或抗体片段的轻链和重链的可变区进行编码,其中这些抗体和/或抗体片段源自选择方法,其中该选择方法包括多个彼此相继的选择循环,其中每一个选择循环的结果为具有抗体和/或抗体片段的池,-对于这些池中的V
L
基因和V
H
基因对来构造特征向量,其中每一对的V
L
基因和V
H
基因对属于同一个抗体和/或抗体片段的可变区进行编码,其中一个池的每个特征向量至少包括以下特征:
·
V
L
基因在相应池中的出现频度,
·
V
H
基因在相应池中的出现频度,
·
V
L
基因在前一个池中的出现频度,
·
V
H
基因在前一个池中的出现频度,
·
V
H
基因在相应池中的出现频度与V
L
基因在相应池中的出现频度之间的绝对差值,
·
V
H
基因在前一个池中的出现频度与V
L
基因在前一个池中的出现频度之间的绝对差值,-鉴别这些池的这些特征向量中的富集模式,其中富集模式表示在该选择方法中用相应的V
L
基因和V
H
基因富集该抗体和/或抗体片段的强度,-基于该富集模式来获得V
L
基因和V
H
基因对的分数值,其中将这些分数值与相应的富集强度相关联,-对用户输出这些分数值。2.根据权利要求1所述的方法,其中鉴别富集模式包括以下子步骤:-执行在至少三个彼此接连的池中的V
L
基因和V
H
基因对的所有特征向量的降维,并且同时获得在相应池中的V
L
基因和V
H
基因对的因子,-通过将这些因子沿彼此接连的池的坐标值变化量化,获得V
L
基因和V
H
基因对的分数值。3.根据权利要求1或2之一所述的方法,包括以下步骤:-接收涉及V
L
基因和V
H
基因的特征,其中V
L
基因和V
H
基因对抗体和/或抗体片段的轻链和重链的可变区进行编码,其中这些抗体和/或抗体片段源自选择方法,其中该选择方法包括多个彼此相继的选择循环,其中每一个选择循环的结果为具有抗体和/或抗体片段的池,-基于这些特征,对于这些池中的V
L
基因和V
H
基因对来构造特征向量,其中每一对的V
L
基因和V
H
基因对属于同一个抗体和/或抗体片段的可变区进行编码,其中一个池的每个特征向量至少包括以下特征:
·
V
L
基因在相应池中的出现频度,
·
V
H
基因在相应池中的出现频度,
·
V
L
基因在前一个池中的出现频度,
·
V
H
基因在前一个池中的出现频度,
·
V
H
基因在相应池中的出现频度与V
L
基因在相应池中的出现频度之间的绝对差值,
·
V
H
基因在前一个池中的出现频度与V
L
基因在前一个池中的出现频度之间的绝对差值,-基于这些特征向量来获得在一个池中的这些V
L
基因和V
H
基因对的因子,其中这些因子
用比特征向量更少数量的变量来描述在一个池中的这些对的特性,-基于这些因子来获得V
L
基因和V
H
基因对的分数值,-任选地:基于这些分数值来获得V
L
基因和V
H
基因对的排序列表,-对用户输出这些分数值和/或排序列表。4.根据权利要求1至3之一所述的方法,包括以下步骤:-接收涉及V
L
基因和V
H
基因的特征,其中V
L
基因和V
H
基因对抗体和/或抗体片段的轻链和重链的可变区进行编码,其中这些抗体和/或抗体片段源自选择方法,其中该选择方法包括多个彼此相继的选择循环,其中每一个选择循环的结果为具有抗体和/或抗体片段的池,-基于这些特征,对于这些池中的V
L
基因和V
H
基因对来构造特征向量,其中每一对的V
L
基因和V
H
基因对属于同一个抗体和/或抗体片段的可变区进行编码,其中一个池的每个特征向量至少包括以下特征:
·
V
L
基因在相应池中的出现频度,
·
V
H
基因在相应池中的出现频度,
·
V
L
基因在前一个池中的出现频度,
·
V
H
基因在前一个池中的出现频度,
·
V
H
基因在相应池中的出现频度与V
L
基因在相应池中的出现频度之间的绝对差值,
·
V
H
基因在前一个池中的出现频度与V
L
基因在前一个池中的出现频度之间的绝对差值,-基于相应的特征向量对于在一个池中的V
L
基因和V
H
基因对进行主分量分析并且获得这些主分量,-对于每一对的V
L
基因和V
H
基因:在由主分量分析构造的向量空间中获得起点与终点之间的向量,其中该起点代表用于该选择方法的第一个池的一个对的主分量,并且该终点代表用于该选择方法的最后一个池的同一个对的主分量,-计算该向量的长度,或者计算该向量在该向量空间的一个轴上投影的长度,或者将该向量的起点偏移到该向量空间的原点并且计算该向量的终点的任选加权的主分量的积,并且使用相应计算的结果作为用于V
L
基因和V
H
基因对的分数值,-任选地:基于这些分数值来获得V
L
基因和V
H
基因对的排序列表,-对用户输出这些分数值和/或排序列表。5.根据权利要求1至4之一所述的方法,包括以下步骤:-接收涉及V
L
基因和V
H
基因的特征,其中V
L
基因和V
H
基因对抗体和/或抗体片段的轻链和重链的可变区进行编码,其中这些抗体和/或抗体片段源自选择方法,其中该选择方法包括多个彼此相继的选择循环,其中每一个选择循环的结果为具有抗体和/或抗体片段的池,-基于这些特征,对于这些池中的V
L
基因和V
H
基因对来构造特征向量,其中每一对的V
L
基因和V
H
基因对属于同一个抗体和/或抗体片段的可变区进行编码,其中一个池的每个特征向量至少包括以下特征:
·
V
L
基因在相应池中的出现频度,
·
V
H
基因在相应池中的出现频度,
·
V
L
基因在前一个池中的出现频度,
·
V
H
基因在前一个池中的出现频度,
·
V
H
基因在相应池中的出现频度与V
L
基因在相应池中的出现频度之间的绝对差值,
·
V
H
基因在前一个池中的出现频度与V
L
基因在前一个池中的出现频度之间的绝对差值,-基于相应的特征向量对于在一个池中的V
L
基因和V
H
基因对进行主分量分析并且获得这些主分量,-从该选择方法的第一个池开始至该选择方法的最后一个池为止,将对于每一对的V
L
基因和V
H
基因的主分量的坐标相加,并且计算通过将这些主分量的坐标相加产生的向量的长度,并且使用该向量的长度作为V
L
基因和V
H
基因对的分数值,-任选地:基于这些分数值来获得V
L
基因和V
H
基因对的排序列表,-对用户输出这些分数值和/或排序列表。6.根据权利要求1至5之一所述的方法,其中在构造这些特征向量时输入选自以下清单的一个其他特征或多个其他特征:
·
在所观察的池中不同V
H
基因的绝对数量(出现频度):numVH
·
在所观察的池中不同V
L
基因的绝对数量(出现频度):numVL
·
在所观察的池中出现频度最高的那个V
H
基因的绝对数量(出现频度):maxVH
·
在所观察的池中出现频度最高的那个V
L
基因的绝对数量(出现频度):maxVL
·
在所观察的池中V
H
基因的相对出现频度(相对于所观察的池中出现频度最高的V
H
基因的数量):relVH=VH/maxVH
·
在所观察的池中V
L
基因的相对出现频度(相对于所观察...

【专利技术属性】
技术研发人员:C
申请(专利权)人:拜耳股份公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利