一种衣壳蛋白序列生成模型的训练方法及装置制造方法及图纸

技术编号:38355337 阅读:32 留言:0更新日期:2023-08-05 17:27
本申请实施例提供了一种衣壳蛋白序列生成模型的训练方法及装置。所述方法包括:获取训练数据,所述训练数据为在蛋白质分子的选定区域内具有指定衣壳功能的序列集合;对所述训练数据进行数据增强处理,得到模型训练数据;基于设定加噪处理方式对所述模型训练数据进行不同时刻的加噪处理,得到在不同时刻的加噪训练数据;根据所述加噪训练数据和指定生成路径下的损失函数对待训练衣壳蛋白序列生成模型进行训练,得到所述指定衣壳功能的在所述指定生成路径下的衣壳蛋白序列生成模型。本申请实施例可以生成大量衣壳所需功能的衣壳蛋白序列,产生的衣壳蛋白序列可用序列的占比较高,同时,找到的可用的序列数量要比随机突变找到的序列数量大很多。找到的序列数量大很多。找到的序列数量大很多。

【技术实现步骤摘要】
一种衣壳蛋白序列生成模型的训练方法及装置


[0001]本申请涉及人工智能
,特别是涉及一种衣壳蛋白序列生成模型的训练方法及装置。

技术介绍

[0002]AAV(Adeno

associated viruses,腺相关病毒)衣壳已成为一种治疗性体内基因传递的强大工具。然而,天然衣壳的转导效率仍然限制了治疗目的,此外由于基因型

表型关系的复杂性和许多必须同时优化的功能特性,设计增强型衣壳的工程已被证明具有挑战性。
[0003]目前,决定蛋白质功能的物理相互作用还没有很好地理解,所以现有更多的手段是定向进化,即当机制理解有限时,反复应用随机突变和人工选择通常是默认的工程策略。但是这种方式设计出来的衣壳,在很高的比例上是不可用的,生产效率很低。目前还有一种最新的方法是通过先用少量具有某种功能的数据(该方法中衣壳的功能是设计出的衣壳序列所对应病毒具有活性)训练一个二分类器,即该序列有活性或者没有活性。然后再在随机划分的突变子空间(子空间的构建方式示意图如图1所示)内进行随机采样,如果通过二分类器判定为本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种衣壳蛋白序列生成模型的训练方法,其特征在于,所述方法包括:获取训练数据,所述训练数据为在蛋白质分子的选定区域内具有指定衣壳功能的序列集合;对所述训练数据进行数据增强处理,得到模型训练数据;基于设定加噪处理方式对所述模型训练数据进行不同时刻的加噪处理,得到在不同时刻的加噪训练数据;根据所述加噪训练数据和指定生成路径下的损失函数对待训练衣壳蛋白序列生成模型进行训练,得到所述指定衣壳功能的在所述指定生成路径下的衣壳蛋白序列生成模型。2.根据权利要求1所述的方法,其特征在于,所述对所述训练数据进行数据增强处理,得到模型训练数据,包括:在每个所述训练数据对应的序列中的任意位置添加设定字符,以得到序列长度一致的所述模型训练数据;其中,所述设定字符为没有含义的字符。3.根据权利要求1所述的方法,其特征在于,在所述根据所述加噪训练数据和指定生成路径下的损失函数对待训练衣壳蛋白序列生成模型进行训练,得到所述指定衣壳功能的在所述指定生成路径下的衣壳蛋白序列生成模型之后,还包括:获取完全噪声的蛋白质序列,以及指定的模型功能;获取所述指定的模型功能对应的目标衣壳蛋白序列生成模型;将所述完全噪声的蛋白质序列输入至所述目标衣壳蛋白序列生成模型,以由所述目标衣壳蛋白序列生成模型按照所述指定生成路径对所述完全噪声的蛋白质序列进行处理,得到所述完全噪声的蛋白质序列对应的去噪后的预测衣壳蛋白序列;对所述预测衣壳蛋白序列进行后处理,得到最终的衣壳蛋白序列。4.根据权利要求3所述的方法,其特征在于,所述对所述预测衣壳蛋白序列进行后处理,得到最终的衣壳蛋白序列,包括:检测得到所述预测衣壳蛋白序列中包含的所述设定字符;将所述设定字符替换为空字符,生成最终的所述衣壳蛋白序列。5.根据权利要求1所述的方法,其特征在于,所述设定加噪处理方式包括:离散型加噪方式和连续型加噪方式中的任一种。6.根据权利要求5所述的方法,其特征在于,在所述设定加噪处理方式为离散型加噪方式时,所述基于设定加噪处理方式对所述模型训练数据进行不同时刻的加噪处理,得到在不同时刻的加噪训练数据,包括:根据预先定义的在不同时刻的转移概率矩阵对所述模型训练数据进行加噪处理,得到所述模型训练数据对应的在不同时刻的加噪训练数据。7.根据权利要求5所述的方法,其特征在于,在所述设定加噪处理方式为连续型加噪方式时,所述基于设定加噪处理方式对所述模型训练数据进行不同时刻的加噪处理,得到在不同时刻的加噪训练数据,包括:根据预先定义的不同时刻的噪声...

【专利技术属性】
技术研发人员:刘丽君宋剑飞邓亚峰施慧
申请(专利权)人:杭州碳硅智慧科技发展有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1