【技术实现步骤摘要】
细胞株相似性评价方法及相似细胞株培养基配方推荐方法
[0001]本专利技术属于生物
,更具体地,涉及一种细胞株相似性评价方法及相似细胞株培养基配方推荐方法。
技术介绍
[0002]从人工智能建模来说,细胞株的种类是多样的,以CHO细胞这一大类举例,CHO细胞株类型有CHO
‑
K1,CHO
‑
DG44,CHO
‑
GS等,CHO细胞株的蛋白表达有融合蛋白、单抗、双抗的区别,同时蛋白中各种氨基酸的成分含量与比例也有区别,另外细胞株的形态与大小也存在差异。因此不同细胞株之间的特征有着或大或小的差异性。
[0003]多样的细胞株在评定标准、数据分析与处理方面会存在很大困难。一方面,部分细胞株特征无法有效运用特定的场景,如细胞的形态学特征在细胞筛选中起作用,但在细胞培养不一定起大的作用,反而是细胞株表达的蛋白及其序列、DNA插入位点影响较大。另一方面,以上特征过于繁多,CHO细胞株的种类是多样的,繁多重复无效的特征不利于数据分析处理。
[0004]虽然细胞株之间 ...
【技术保护点】
【技术特征摘要】
1.一种细胞株相似性评价方法,其特征在于,包括以下步骤:(1)针对不同细胞株进行条件相当的实验获取平行数据;所述平行数据,即在具有可比性的实验条件下获取的细胞株差异导致的采样结果不同的实验数据;(2)对细胞株类型进行编号,作为嵌入层的输入,以获取所述平行数据的实验条件为监督学习模型的训练输入,以所述平行数据的实验结果为输出监督,对嵌入层和监督学习模型组成的相连网络进行端到端的训练,使得回归模型的损失函数收敛,获得经训练的嵌入层;(3)将步骤(2)获得的经训练的嵌入层的权值矩阵作为细胞株特征向量集合,按照其结构分别获取特定细胞株特征向量;(4)计算步骤(3)获得的细胞株特征向量之间的相似性,作为相应细胞株之间的相似性。2.如权利要求1所述的细胞株相似性评价方法,其特征在于,所述嵌入层具有与细胞株种类相应的输入维度,所述嵌入层的输出维度8到128维之间;所述嵌入层和监督学习模型组成的相连网络为嵌入层与回归模型相连或采用涵盖有嵌入层的监督学习模型;所述回归模型的输入由嵌入层的输出和训练输入组成;所述涵盖有嵌入层的监督学习模型基于多层神经网络的回归模型、基于卷积神经网络的回归模型、基于循环神经网络的回归模型和/或基于注意力机制神经网络的回归模型。3.如权利要求1所述的细胞株相似性评价方法,其特征在于,所述监督学习模型按照如下方法获取:对多个备选的监督学习模型,采用所述细胞株类别之一的平行数据集进行训练并测试,择优作为所述监督学习模型。4.如权利要求1所述的细胞株相似性评价方法,其特征在于,步骤(4)所述细胞株特征向量之间的相似性,其计算方法包括但不限于:余弦相似度、闵可夫斯基距离、Pearson相关系数;优选所述闵可夫斯基距离包括欧式距离,曼哈顿距离,切比雪夫距离。5.一种细胞株相似性评价系统,其特征在于,包括平行数据获取模块、自学习模块、细胞株特征向量提取模块、以及相似性计算模块;所述平行数据获取模块,用于输入针对不同细胞株进行条件相当的实验获取的平行数据;所述平行数据,即在具有可比性的实验条件下获取的细胞株差异导致的结果不同的实验数据,提交给自学习模块;所述自学习模块,包括相连的嵌入层和监督学习模块,用于对细胞株类型进行编号,作为嵌入层的输入,以获取所述平行数据的实验条件为训练输入为监督学习模型的训练输入,以所述平行数据的实验结果为输出监督,对所述嵌入...
【专利技术属性】
技术研发人员:梁楚亨,张祥涛,陈亮,黄贺声,梁国龙,
申请(专利权)人:深圳太力生物技术有限责任公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。