System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind()
【技术实现步骤摘要】
本专利技术属于生物培养基领域,具体地,本专利技术涉及一种基于核方法的快速优化培养基配方的方法。
技术介绍
1、随着生物技术的发展,培养基组分已经十分复杂,其组分数量接近100多种。培养基组分优化是培养基开发过程中尤为重要的一环。
2、由于动物细胞培养基中组分和种类极为复杂,在进行不同的项目研究和细胞种类选用时往往需要考虑众多试验设计的因素和水平,从而满足需求。在这个过程中,使用传统开发方式非常依赖研究员的专业知识和经验。传统方法中首先要根据经验来确定候选组分和范围,随后利用析因实验设计的方式对这些组分进行筛选试验。在对产生的关键组分进行响应面试验设计,通过响应面拟合结果对培养基组分浓度进行优化。
3、这个过程高度依赖研究员的经验与知识,并且是一个试错的过程。候选组分和范围的确认是否有效直接影响后续培养基开发的实验量与周期。近年来,开始有文献报道使用多变量分析软件处理小样本多变量的动物细胞培养基开发实验数据。然而,目前商业的多变量分析软件中多基于线性模型进行分析,而培养基组分和产量间的复杂非线性关系使得基于线性分析的有效性降低,且无法满足实际生产中对于稳定性控制的输出要求。
4、有鉴于此,本领域亟需开发一套通用的能够将非线性模型转化为线性模型的细胞培养基开发算法。
技术实现思路
1、本专利技术的目的是提供一种基于核方法的回归算法的快速优化培养基组分的方法,可以将非线性模型转化为线性模型进行细胞培养基开发。
2、在本专利技术的第一方面,提
3、(a)提供一待优化培养基配方;其中,所述配方中包括p个组分,各组分的浓度值表示为对应的数据集表示为为i为1-p的正整数,p为10-150;
4、(b)将待优化培养基配方的组分浓度数据集输入到点交换算法中,利用点交换算法对各组分浓度进行第一轮的n次随机点交换处理,分别获得n个经随机点交换处理的虚拟优化培养基配方,矩阵表示为n×p,其中n为随机点交换处理的次数,并且n为≥30的正整数;
5、(c)基于所述n×p的矩阵,计算对于该轮次的组分的协方差矩阵的迹(trace);
6、(d)重复步骤(b)和(c),重复m-1轮次,从而获得各轮次的组分的协方差矩阵的迹;其中,m为200-500。
7、(e)对经m轮次得到的m个迹进行比较,从而确定数值最大的迹以及该最大的迹所对应的n×p的矩阵,即迹最大矩阵(或tmax矩阵);在所述tmax矩阵中,每个虚拟优化配方的各组分的浓度值表示为xi′,其对应数据集为矩阵表示为n×p;其中,i为1-p的正整数,n为1-n的正整数;
8、(f)按照tmax矩阵中的n组虚拟优化培养基配方,配制n组培养基,执行培养实验,从而获得n组实验产量数据,记为
9、(g)对tmax矩阵中的n组虚拟优化培养基配方使用局部加权回归模型进行组分变量与产量的拟合,拟合得到n个产量预测数据,记为
10、基于步骤(g)中的产量预测数据和步骤(f)中的实验产量数据使用式q1,计算各虚拟优化培养基配方的伪决定系数r2p,从而得到r2p最大的a个组分,记为最重要的组分(topa组分),其中a为3-10的整数;从tmax矩阵中删去其他组分,剩余的数据集的矩阵记为n×topa矩阵;
11、
12、其中;
13、r2p为伪决定系数;
14、y(n)为步骤(f)中培养实验中第n个虚拟优化培养基配方对应的实验产量数据;
15、为步骤(g)中局部加权回归模型对第n个虚拟优化培养基配方拟合得到的产量预测数据;
16、为步骤(f)中所有实验产量数据的平均值;
17、n为1-n的整数;
18、(h)使用核方法进行建模,并对用核方法建模获得的非线性模型用不确定性分析算法进行分析,从而得到推荐培养基,其中所述的推荐培养基中具有一个或多个组分的推荐浓度;
19、(i)配制步骤(h)获得的推荐培养基,并进行细胞培养实验,得到目标产物的产量;
20、(j)当目标产物的产量达到预期值时,优化结束;当产量低于预期值时,重复步骤(b)-(i)直到目标产物的产量达到预期值。
21、在另一优选例中,步骤(h)中,具体包括如下步骤:
22、(h1)基于步骤(f)得到的实验产量数据确定产量最高的培养基中各组分的浓度值,根据步骤(g)中的伪决定系数结果,保留topa组分及其对应的浓度值,记为cmmax培养基;
23、(h2)以cmmax培养基中各组分的浓度值为基准值,在基准值上下20%的范围内随机生成候选浓度值,得到多组候选培养基配方;
24、(h3)在tmax矩阵中不重复地删去一组数据,剩余n-1组数据,矩阵表示为(n-1)×p;
25、(h4)使用式q2所示的核函数将步骤(h3)中的(n-1)×p矩阵进行转换,从而将线性模型拓展至非线性模型;
26、
27、其中,
28、k()是使用核函数,d表示配方数目与组分数目的矩阵,即步骤(h3)中的(n-1)×p矩阵;dt代表对d的转置;
29、(h5)基于步骤(h4)得到的非线性模型建立产量预测模型q4,利用该产量预测模型q4对步骤(h2)中获得的候选培养基配方的产量进行拟合,得到预测产量;
30、f(d)=wk(d,dt)+b q4
31、其中,w为权重系数,b为偏置系数;
32、(h6)重复步骤(h3)至步骤(h5),最多重复n-1次,其中,步骤(h3)中每次删去不同于前次的一组数据,每次剩余数据的矩阵表示为(n-1)×p;
33、(h7)对步骤(h5)-(h6)中获得的候选培养基配方的预测产量进行评价,将具有下列特征的培养基配方作为推荐培养基配方,用于细胞培养实验:
34、1)预测产量数据中最高预测产量对应的候选培养基配方;
35、2)计算各组候选培养基的方差,最大方差值对应的候选培养基配方;
36、3)计算各组候选培养基的预测产量与其方差的和(σ),最大和σ对应的候选培养基配方。
37、在另一优选例中,所述的cmmax培养基为步骤(f)中最高产量对应的一组培养基中的topa组分及其对应的组分浓度。
38、在另一优选例中,步骤(f)和步骤(i)中,培养实验中使用的细胞选自下组:cho细胞、mdck细胞、bhk细胞、sf9细胞、highfive细胞、293细胞、mdbk细胞、f81细胞、df-1细胞、lmh细胞、vero细胞、pk15细胞、st细胞、marc145细胞、杂交瘤细胞、二倍体细胞、免疫效应细胞;较佳地为cho细胞、mdck细胞、sf9细胞、vero细胞;更佳地为cho细胞。
39、在另一优选例中,在步骤(h2)中,在基准值上下15%的范围内本文档来自技高网...
【技术保护点】
1.一种基于核方法拟合的快速优化培养基组分的方法,其特征在于,
2.如权利要求1所述的方法,其特征在于,步骤(h)中,具体包括如下步骤:
3.如权利要求1所述的方法,其特征在于,步骤(f)和步骤(i)中,培养实验中使用的细胞选自下组:CHO细胞、MDCK细胞、BHK细胞、Sf9细胞、HighFive细胞、293细胞、MDBK细胞、F81细胞、DF-1细胞、LMH细胞、Vero细胞、PK15细胞、ST细胞、Marc145细胞、杂交瘤细胞、二倍体细胞、免疫效应细胞;较佳地为CHO细胞、MDCK细胞、Sf9细胞、Vero细胞;更佳地为CHO细胞。
4.如权利要求2所述的方法,其特征在于,在步骤(h2)中,在基准值上下15%的范围内随机生成候选浓度;较佳地,在基准值上下12%的范围内随机生成候选浓度,更佳地,10%,8%。
5.如权利要求2所述的方法,其特征在于,步骤(h5)中,所述的权重系数w和偏置系数b是通过最小化式Q3所示的损失函数求得的;
6.如权利要求1所述的方法,其特征在于,N为50-150,较佳地60-100。
...【技术特征摘要】
1.一种基于核方法拟合的快速优化培养基组分的方法,其特征在于,
2.如权利要求1所述的方法,其特征在于,步骤(h)中,具体包括如下步骤:
3.如权利要求1所述的方法,其特征在于,步骤(f)和步骤(i)中,培养实验中使用的细胞选自下组:cho细胞、mdck细胞、bhk细胞、sf9细胞、highfive细胞、293细胞、mdbk细胞、f81细胞、df-1细胞、lmh细胞、vero细胞、pk15细胞、st细胞、marc145细胞、杂交瘤细胞、二倍体细胞、免疫效应细胞;较佳地为cho细胞、mdck细胞、sf9细胞、vero细胞;更佳地为cho细胞。
4.如权利要求2所述的方法,其特征在于,在步骤(h2)中,在基准值上下15%的范围内随机生成候选浓度;较佳地,在基准值上...
【专利技术属性】
技术研发人员:刘旭平,范里,
申请(专利权)人:上海倍谙基生物科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。