抗体改造模型训练方法、抗体改造方法及其装置制造方法及图纸

技术编号：39730209 阅读：7 留言：0更新日期：2023-12-17 23:34

本公开的实施例提供了一种抗体改造模型训练方法、抗体改造方法、及其分别对应的装置、设备、计算机程序产品和存储介质。其中，通过基于包括动物抗体和人类抗体数据的训练样本集对语言模型进行自监督预训练，使得所得到的预训练语言模型具有与训练动物抗体与训练人类抗体之间的特征差异相关的知识，并且通过利用与抗体改造相关的多个性能指标，对所述预训练语言模型进行进一步优化，以生成最终用于抗体改造的抗体改造模型。通过本公开的实施例的方法能够结合动物抗体和人类抗体数据，使得模型可以更好地处理以动物抗体为输入的人源化改造任务，优化其抗体人源化的改造结果，提高抗体人源化改造的成功率，从而为抗体药物研发提供技术支持。供技术支持。供技术支持。

全部详细技术资料下载

【技术实现步骤摘要】
抗体改造模型训练方法、抗体改造方法及其装置

[0001]本公开涉及人工智能领域，更具体地，涉及一种抗体改造模型训练方法、抗体改造方法、及其分别对应的装置、设备、计算机程序产品和存储介质。

技术介绍

[0002]非人源性抗体进入人体内会引起严重的机体排异反应，进而影响抗体在临床应用时的安全性和效果。因此需要对抗体进行人源化改造，尽可能降低抗体的异源性，并且使其特异性和亲和力保持不变。人源化抗体在治疗肿痛、自身免疫性疾病、器官移植和病毒感染等方面已经显示出独特的优势和良好的应用前景。
[0003]人源化抗体主要可以指利用基因克隆及脱氧核糖核酸(DNA)重组技术对来自动物的单克隆抗体进行改造，重新表达产生的抗体。其大部分氨基酸序列被人源序列取代，基本保留动物原始的单克隆抗体的亲和力和特异性，又降低了其异源性，以有利地应用于人体。抗体的人源化改造可以有效降低抗体的异源性，增长其半衰期，有效改善抗体对人体免疫系统的活化作用。
[0004]因此，需要一种高效的抗体人源化改造方法，使得可以优化抗体人源化的改造结果。

技术实现思路

[0005]为了解决上述问题，本公开通过对来自动物与人类的抗体进行自监督预训练，并通过强化学习机制引入抗体人源化改造过程中的各种优化指标来进一步优化抗体人源化改造模型，从而优化抗体人源化的改造结果。
[0006]本公开的实施例提供了一种抗体改造模型训练方法、抗体改造方法、及其分别对应的装置、设备、计算机程序产品和存储介质。
[0007]本公开的实施例提供了一...

【技术保护点】

【技术特征摘要】
1.一种抗体改造模型训练方法，包括：获取用于抗体改造模型训练的训练样本集，所述训练样本集中的训练样本包括训练动物抗体和训练人类抗体；基于所述训练样本集对语言模型进行自监督预训练，生成用于抗体改造的预训练语言模型，所述预训练语言模型具有与训练动物抗体与训练人类抗体之间的特征差异相关的知识；以及利用所述训练样本集中的每个训练动物抗体，针对与抗体改造相关的多个性能指标，对所述预训练语言模型进行优化，以生成经训练的抗体改造模型。2.如权利要求1所述的方法，其中，基于所述训练样本集对语言模型进行自监督预训练，生成用于抗体改造的预训练语言模型包括：基于所述训练样本集，针对用于学习训练动物抗体与训练人类抗体之间的特征差异的多项训练任务，对语言模型进行自监督预训练，生成用于抗体改造的预训练语言模型。3.如权利要求2所述的方法，其中，所述多项训练任务包括掩蔽语言预测任务、移植多肽恢复任务和物种预测任务中的一个或多个；其中，所述掩蔽语言预测任务用于学习训练动物抗体和训练人类抗体各自的特征，所述移植多肽恢复任务用于学习训练动物抗体的人源化改造过程中的特征变化，并且所述物种预测任务用于区分训练动物抗体和训练人类抗体各自的特征。4.如权利要求3所述的方法，其中，针对所述多项训练任务中的每项训练任务，基于所述训练样本集对语言模型进行自监督预训练包括：在所述掩蔽语言预测任务中，对于所述训练样本集中的每个训练样本，对所述训练样本中的部分氨基酸残基进行掩蔽，并利用语言模型对所述部分氨基酸残基进行预测，以生成对于所述部分氨基酸残基中的每一个的残基类型预测结果；在所述移植多肽恢复任务中，对于所述训练样本集中的每个训练人类抗体，将所述训练人类抗体中的氨基酸残基片段随机替换为来自任一训练动物抗体的氨基酸残基片段，并利用所述语言模型对所述训练人类抗体中的所述氨基酸残基片段进行预测，以生成对于所述训练人类抗体中的所述氨基酸残基片段中的每个氨基酸残基的残基类型预测结果；以及在所述物种预测任务中，对于所述训练样本集中的每个训练样本，利用所述语言模型对所述训练样本所属的物种进行预测，以生成对于所述训练样本的物种类型预测结果。5.如权利要求3所述的方法，其中，所述语言模型采用基于多头注意力机制的蛋白质语言模型架构，以训练样本的氨基酸残基序列为输入，并且以对所述氨基酸残基序列的分类预测结果和对所述氨基酸残基序列中的每个氨基酸残基的分类预测结果为输出。6.如权利要求3所述的方法，其中，基于所述训练样本集，针对用于学习训练动物抗体与训练人类抗体之间的特征差异的多项训练任务，对语言模型进行自监督预训练，生成用于抗体改造的预训练语言模型包括：针对所述多项训练任务中的每项训练任务，基于所述训练样本集对语言模型进行自监督预训练；以及通过对损失函数进行优化，生成用于抗体改造的预训练语言模型，其中，所述损失函数是基于所述训练样本集中的每个训练样本关于所述多项训练任务中的每项训练任务的任务结果来确定的。
7.如权利要求...

【专利技术属性】
技术研发人员：吴家祥，
申请(专利权)人：腾讯科技深圳有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人