一种抗体库的构建方法及装置制造方法及图纸

技术编号：25047671 阅读：24 留言：0更新日期：2020-07-29 05:36

本发明专利技术涉及一种抗体库的构建方法及装置，包括以下步骤：对次级抗体库中的抗体序列进行预处理，以得到字符级抗体序列集合；利用训练好的双向生成对抗网络生成器模型对所述字符级抗体序列集合进行处理获得高活性抗体序列，以建立高级抗体库。其优点在于，通过使用训练好的双向生成对抗网络生成器模型对次级抗体库的活性抗体序列进行非理性定向进化，从而得到高活性抗体序列，并建立高级抗体库，以用于后续高亲和力抗体的筛选；方法简便，耗时短，提高进化效率和筛选效率。

全部详细技术资料下载

【技术实现步骤摘要】
一种抗体库的构建方法及装置
本专利技术涉及人工智能
，尤其涉及一种抗体库的构建方法及装置。
技术介绍
人工智能是计算机学科的一个分支，兴起于上世纪五十年代中期，首次提出了“人工智能”这个术语，然而，当时研究人工智能的起点较低，他们的目标只是实现简单的模仿人类行为的机器人。人工智能是研究使计算机来模拟人的某些思维过程和智能行为(如学习、推理、思考、规划等)的学科，主要包括计算机实现智能的原理、制造类似于人脑智能的计算机，使计算机能实现更高层次的应用。人工智能将涉及到计算机科学、心理学、哲学和语言学等学科。现阶段的人工智能处于高速发展时期，人工智能产业链则涵盖了基础层、技术层、应用层、业务层等多个方面，目前人工智能在语音识别、自然语言处理、计算机视觉、机器人等人工智能
取得不俗成就，这是以往人工智能发展所不能达到的一种繁荣景象。随着人工智能的深入发展，医药研发也迎来了人工智能的时代。生成式对抗网络(GenerativeAdversarialNetworks，GAN)是Goodfellow等在2014年提出的一种生成式模型，目前已经成为人工智能学界一个热门的研究方向，著名学者YannLecun甚至将其称为“过去十年间机器学习领域最让人激动的点子”。GAN的基本思想源自博弈论的二人零和博弈，由一个生成器和一个判别器构成，通过对抗学习的方式来训练，目的是估测数据样本的潜在分布并生成新的数据样本。在图像和视觉计算、语音和语言处理、信息安全、棋类比赛等领域，GAN正在被广泛研究，具有巨大的应用前景。GA...

【技术保护点】
1.一种抗体库的构建方法，其特征在于，包括以下步骤：/n对次级抗体库中的抗体序列进行预处理，以得到字符级抗体序列集合；/n利用训练好的双向生成对抗网络生成器模型对所述字符级抗体序列集合进行处理获得高活性抗体序列，以建立高级抗体库。/n

【技术特征摘要】
1.一种抗体库的构建方法，其特征在于，包括以下步骤：
对次级抗体库中的抗体序列进行预处理，以得到字符级抗体序列集合；
利用训练好的双向生成对抗网络生成器模型对所述字符级抗体序列集合进行处理获得高活性抗体序列，以建立高级抗体库。

2.根据权利要求1所述的抗体库的构建方法，其特征在于，所述训练好的双向生成对抗网络生成器模型通过如下方法训练完成：
将训练抗体序列中的氨基酸序列中的每个氨基酸映射为对应的实数，以得到氨基酸序列向量；
基于抗体类别对所述训练抗体序列进行分组，以得到对应不同分组的各个氨基酸序列向量，形成字符级抗体序列集合；
从所述字符级抗体序列集合中随机选取所述氨基酸序列向量作为迭代数据；
将选取的各个所述氨基酸序列向量中的每个氨基酸映射的实数通过Embedding操作映射为固定长度的1维向量，以得到抗体序列矩阵；
将所述抗体序列矩阵输入双向生成对抗网络生成器模型以训练双向生成对抗网络生成器模型参数，直至损失值迭代趋于稳定时停止训练，得到所述训练好的双向生成对抗网络生成器模型。

3.根据权利要求2所述的抗体库的构建方法，其特征在于，所述双向生成对抗网络生成器模型包括：生成器、编码器和判别器；
所述将所述抗体序列矩阵输入双向生成对抗网络生成器模型以训练双向生成对抗网络生成器模型参数，直至损失值迭代趋于稳定时停止训练，得到所述训练好的双向生成对抗网络生成器模型包括：
将所述抗体序列矩阵输入至所述编码器，以得到抗体序列高维向量；
将随机编码向量输入至所述生成器，以得到抗体序列低维向量；
将所述抗体序列高维向量和所述抗体序列低维向量输入至所述判别器，以得到判别结果；
根据所述判别结果计算损失值，直至所述损失值迭代趋于稳定时停止训练，以得到所述训练好的双向生成对抗网络生成器模型。

4.根据权利要求2所述的抗体库的构建方法，其特征在于，训练所述双向生成对抗网络生成器模型还包括：
使用Adam梯度下降算法对所述双向生成对抗网络生成器模型进行训练。

5.根据权利要求1所述的抗体库的构建方法，其特征在于，所述对次级抗体库中的抗体序列进行预处理，以得到字符级抗体序列集合包括：
分别将所述抗体序列中的氨基酸序列中的每个氨基酸映射为对应的实数，以得到氨基酸序列向量；
基于抗体类别对所述抗体序列进行分组，以得到对应不同分组的各个氨基酸序列向量，形成字符级抗体序列集合。

6.根据权利要求1所述的抗体库的构建方法，其特征在于，所述次级抗体库通过如下方法构建：
对初级抗体库的抗体序列进行筛选得到活性抗体序列，以建立次级抗体库。

7.根据权利要求6所述的抗体库的构建方法，其特征在于，通过人工智能深度学习和迁移学习对所述初级抗体库的抗体序列进行筛选得到活性抗体序列。

8.一种抗体库的构建装置，其特征在于，包括：
预处理模块，用于对次级抗体库的抗体序列进行预处理，以得到字符级抗体序列集合；
双向生成对抗网...

【专利技术属性】
技术研发人员：赵文祥，刘明耀，魏海涛，褚敏，晁瑞华，李亚男，
申请(专利权)人：上海祥耀生物科技有限责任公司，浙江祥耀生物医药有限公司，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人