【技术实现步骤摘要】
抗体/抗体片段的选择
[0001]本专利技术涉及在选择方法中选择抗体和/或抗体片段。本专利技术的主题为一种方法、一种系统和一种计算机程序产品,用于为对抗体和/或抗体片段的轻链和重链的可变区进行编码的基因对产生分数值。可基于分数值来选择抗体和/或抗体片段。
技术介绍
[0002]作为针对外源入侵物的防御系统,人类免疫系统构成各种器官、细胞类型和分子的复杂网络。
[0003]抗体(也称为免疫球蛋白)是来自球蛋白类别的蛋白质,它们在脊椎动物中作为对某些物质(所谓的抗体)的响应而形成。抗体服务于免疫系统;抗体由白细胞类、B淋巴细胞产生。
[0004]几乎仅大分子或结合到颗粒上的分子(例如在细菌表面上的脂多糖)作为抗原起作用。某一种抗原一般诱发仅某几种特定抗体的形成,这些抗体通过特异的非共价键合大多数情况下仅识别此种外源物质。
[0005]抗体对抗原的特异性键合构成了针对入侵的外源物质的防御的主要部分。
[0006]每种抗体由两个相同的重链(英文:heavy chains,H)和两个相同的轻链(英文:light chains,L)组成,这些链通过共价的二硫桥键彼此联接成Y形结构。轻链分别由一个可变区和一个恒定区组成。将其称为V
L
和C
L
。相反,重链分别具有一个可变区和三个(IgG,IgA)或四个(IgM,IgE)恒定区。类似地将其称为V
H
和C
H
1、C
H
2、C
H
3。
[00 ...
【技术保护点】
【技术特征摘要】
1.一种方法,包括以下步骤:-接收涉及V
L
基因和V
H
基因的特征,其中V
L
基因和V
H
基因对抗体和/或抗体片段的轻链和重链的可变区进行编码,其中这些抗体和/或抗体片段源自选择方法,其中该选择方法包括多个彼此相继的选择循环,其中每一个选择循环的结果为具有抗体和/或抗体片段的池,-对于这些池中的V
L
基因和V
H
基因对来构造特征向量,其中每一对的V
L
基因和V
H
基因对属于同一个抗体和/或抗体片段的可变区进行编码,其中一个池的每个特征向量至少包括以下特征:
·
V
L
基因在相应池中的出现频度,
·
V
H
基因在相应池中的出现频度,
·
V
L
基因在前一个池中的出现频度,
·
V
H
基因在前一个池中的出现频度,
·
V
H
基因在相应池中的出现频度与V
L
基因在相应池中的出现频度之间的绝对差值,
·
V
H
基因在前一个池中的出现频度与V
L
基因在前一个池中的出现频度之间的绝对差值,-鉴别这些池的这些特征向量中的富集模式,其中富集模式表示在该选择方法中用相应的V
L
基因和V
H
基因富集该抗体和/或抗体片段的强度,-基于该富集模式来获得V
L
基因和V
H
基因对的分数值,其中将这些分数值与相应的富集强度相关联,-对用户输出这些分数值。2.根据权利要求1所述的方法,其中鉴别富集模式包括以下子步骤:-执行在至少三个彼此接连的池中的V
L
基因和V
H
基因对的所有特征向量的降维,并且同时获得在相应池中的V
L
基因和V
H
基因对的因子,-通过将这些因子沿彼此接连的池的坐标值变化量化,获得V
L
基因和V
H
基因对的分数值。3.根据权利要求1或2之一所述的方法,包括以下步骤:-接收涉及V
L
基因和V
H
基因的特征,其中V
L
基因和V
H
基因对抗体和/或抗体片段的轻链和重链的可变区进行编码,其中这些抗体和/或抗体片段源自选择方法,其中该选择方法包括多个彼此相继的选择循环,其中每一个选择循环的结果为具有抗体和/或抗体片段的池,-基于这些特征,对于这些池中的V
L
基因和V
H
基因对来构造特征向量,其中每一对的V
L
基因和V
H
基因对属于同一个抗体和/或抗体片段的可变区进行编码,其中一个池的每个特征向量至少包括以下特征:
·
V
L
基因在相应池中的出现频度,
·
V
H
基因在相应池中的出现频度,
·
V
L
基因在前一个池中的出现频度,
·
V
H
基因在前一个池中的出现频度,
·
V
H
基因在相应池中的出现频度与V
L
基因在相应池中的出现频度之间的绝对差值,
·
V
H
基因在前一个池中的出现频度与V
L
基因在前一个池中的出现频度之间的绝对差值,-基于这些特征向量来获得在一个池中的这些V
L
基因和V
H
基因对的因子,其中这些因子
用比特征向量更少数量的变量来描述在一个池中的这些对的特性,-基于这些因子来获得V
L
基因和V
H
基因对的分数值,-任选地:基于这些分数值来获得V
L
基因和V
H
基因对的排序列表,-对用户输出这些分数值和/或排序列表。4.根据权利要求1至3之一所述的方法,包括以下步骤:-接收涉及V
L
基因和V
H
基因的特征,其中V
L
基因和V
H
基因对抗体和/或抗体片段的轻链和重链的可变区进行编码,其中这些抗体和/或抗体片段源自选择方法,其中该选择方法包括多个彼此相继的选择循环,其中每一个选择循环的结果为具有抗体和/或抗体片段的池,-基于这些特征,对于这些池中的V
L
基因和V
H
基因对来构造特征向量,其中每一对的V
L
基因和V
H
基因对属于同一个抗体和/或抗体片段的可变区进行编码,其中一个池的每个特征向量至少包括以下特征:
·
V
L
基因在相应池中的出现频度,
·
V
H
基因在相应池中的出现频度,
·
V
L
基因在前一个池中的出现频度,
·
V
H
基因在前一个池中的出现频度,
·
V
H
基因在相应池中的出现频度与V
L
基因在相应池中的出现频度之间的绝对差值,
·
V
H
基因在前一个池中的出现频度与V
L
基因在前一个池中的出现频度之间的绝对差值,-基于相应的特征向量对于在一个池中的V
L
基因和V
H
基因对进行主分量分析并且获得这些主分量,-对于每一对的V
L
基因和V
H
基因:在由主分量分析构造的向量空间中获得起点与终点之间的向量,其中该起点代表用于该选择方法的第一个池的一个对的主分量,并且该终点代表用于该选择方法的最后一个池的同一个对的主分量,-计算该向量的长度,或者计算该向量在该向量空间的一个轴上投影的长度,或者将该向量的起点偏移到该向量空间的原点并且计算该向量的终点的任选加权的主分量的积,并且使用相应计算的结果作为用于V
L
基因和V
H
基因对的分数值,-任选地:基于这些分数值来获得V
L
基因和V
H
基因对的排序列表,-对用户输出这些分数值和/或排序列表。5.根据权利要求1至4之一所述的方法,包括以下步骤:-接收涉及V
L
基因和V
H
基因的特征,其中V
L
基因和V
H
基因对抗体和/或抗体片段的轻链和重链的可变区进行编码,其中这些抗体和/或抗体片段源自选择方法,其中该选择方法包括多个彼此相继的选择循环,其中每一个选择循环的结果为具有抗体和/或抗体片段的池,-基于这些特征,对于这些池中的V
L
基因和V
H
基因对来构造特征向量,其中每一对的V
L
基因和V
H
基因对属于同一个抗体和/或抗体片段的可变区进行编码,其中一个池的每个特征向量至少包括以下特征:
·
V
L
基因在相应池中的出现频度,
·
V
H
基因在相应池中的出现频度,
·
V
L
基因在前一个池中的出现频度,
·
V
H
基因在前一个池中的出现频度,
·
V
H
基因在相应池中的出现频度与V
L
基因在相应池中的出现频度之间的绝对差值,
·
V
H
基因在前一个池中的出现频度与V
L
基因在前一个池中的出现频度之间的绝对差值,-基于相应的特征向量对于在一个池中的V
L
基因和V
H
基因对进行主分量分析并且获得这些主分量,-从该选择方法的第一个池开始至该选择方法的最后一个池为止,将对于每一对的V
L
基因和V
H
基因的主分量的坐标相加,并且计算通过将这些主分量的坐标相加产生的向量的长度,并且使用该向量的长度作为V
L
基因和V
H
基因对的分数值,-任选地:基于这些分数值来获得V
L
基因和V
H
基因对的排序列表,-对用户输出这些分数值和/或排序列表。6.根据权利要求1至5之一所述的方法,其中在构造这些特征向量时输入选自以下清单的一个其他特征或多个其他特征:
·
在所观察的池中不同V
H
基因的绝对数量(出现频度):numVH
·
在所观察的池中不同V
L
基因的绝对数量(出现频度):numVL
·
在所观察的池中出现频度最高的那个V
H
基因的绝对数量(出现频度):maxVH
·
在所观察的池中出现频度最高的那个V
L
基因的绝对数量(出现频度):maxVL
·
在所观察的池中V
H
基因的相对出现频度(相对于所观察的池中出现频度最高的V
H
基因的数量):relVH=VH/maxVH
·
在所观察的池中V
L
基因的相对出现频度(相对于所观察...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。