一种基因编码序列的优化方法及装置制造方法及图纸

技术编号:15822998 阅读:30 留言:0更新日期:2017-07-15 05:06
本发明专利技术公开了一种基因编码序列的优化方法及装置,方法包括:生成M个基因编码序列,作为初代群体P(0),其中,M为大于1的整数;计算当代群体中每个基因编码序列的适应度;判断是否达到终止计算条件;当未达到终止计算条件时,对第t代群体P(t)的基因编码序列进行选择、交叉和变异运算,得到第t+1代群体P(t+1),返回执行计算当代群体中每个基因编码序列的适应度的步骤,t取0、1、2…;当达到终止计算条件时,选择适应度最大的基因编码序列作为优化后的基因编码序列。本发明专利技术通过采用遗传算法对基因编码序列进行优化,对于根据用户需求设置的参数采用加权求和的方式计算基因编码序列的适应度,使得优化后的基因编码序列满足用户的需求。

【技术实现步骤摘要】
一种基因编码序列的优化方法及装置
本专利技术涉及利用计算机优化基因编码序列
,具体涉及一种基因编码序列的优化方法及装置。
技术介绍
基因编码序列(Codingsequence,简称为CDS)是编码一段蛋白产物的序列,是结构基因组学术语,DNA转录成mRNA,mRNA经剪接等加工后翻译出蛋白质,所谓CDS就是与蛋白质序列一一对应的DNA序列,且该序列中间不含其它非该蛋白质对应的序列,不考虑mRNA加工等过程中的序列变化,总之,就是与蛋白质的密码子完全对应。为了能够得到更优的基因表达,往往需要对基因编码序列进行优化。然而,现有技术中的优化方式,往往是不定向的,也即是无法根据用户的需求进行定向优化,需要反复优化才能满足用户需求,导致优化效率低。
技术实现思路
本专利技术要解决的技术问题在于现有技术中无法根据用户的需求进行定向优化,需要反复优化才能满足用户需求,优化效率低,从而提供一种基因编码序列的优化方法及装置。本专利技术实施例的一方面,提供了一种基因编码序列的优化方法,包括:生成M个基因编码序列,作为初代群体P(0),其中,M为大于1的整数;采用如下公式计算当代群体中每个基因编码序列的本文档来自技高网...
一种基因编码序列的优化方法及装置

【技术保护点】
一种基因编码序列的优化方法,其特征在于,包括:生成M个基因编码序列,作为初代群体P(0),其中,M为大于1的整数;采用如下公式计算当代群体中每个基因编码序列的适应度:

【技术特征摘要】
1.一种基因编码序列的优化方法,其特征在于,包括:生成M个基因编码序列,作为初代群体P(0),其中,M为大于1的整数;采用如下公式计算当代群体中每个基因编码序列的适应度:其中,n表示根据用户需求设置的用于计算每个基因编码序列的适应度的参数的数量,n大于等于2,Ni表示第i个参数对应的值,wi表示第i个参数对应的权重;判断是否达到终止计算条件;当未达到所述终止计算条件时,对第t代群体P(t)中每个基因编码序列采用选择、交叉、变异运算,得到第t+1代群体P(t+1),返回执行计算当代群体中每个基因编码序列的适应度的步骤,t取0、1、2…;当达到所述终止计算条件时,选择适应度最大的基因编码序列作为优化后的基因编码序列。2.根据权利要求1所述的基因编码序列的优化方法,其特征在于,所述n大于或等于5,计算基因编码序列的适应度的公式具体为:f=w1·N1+w2·N2+w3·N3+w4·N4+w5·N5其中,N1=∑fsc/m,m表示对应基因编码序列中密码子的数量,fsc表示对应基因编码序列中单个密码子的适应度,w1表示其权重;N2=PatScoreDP/(1+PatScoreDP+PatScoreUP),其中,PatScoreDP表示对应基因编码序列中用户期望出现的序列的总长度,PatScoreUP对应基因编码序列中用户不期望出现的序列的总长度,w2表示对应的权重;N3表示对应基因编码序列中GC含量,w3表示其权重;N4表示对应基因编码序列中每个密码子第三个位置出现GC的比率,w4表示其权重;N5表示基因编码序列二级结构的最小自由能,w5表示其权重。3.根据权利要求1所述的基因编码序列的优化方法,其特征在于,判断是否达到终止计算条件包括:判断群体的进化代数是否达到最大代数;当所述群体的进化代数未达到所述最大代数时,确定为未达到终止计算条件;当所述群体的进化代数达到所述最大代数时,确定为达到所述终止计算条件。4.根据权利要求1所述的基因编码序列的优化方法,其特征在于,判断是否达到所述终止计算条件包括:判断连续j代群体的基因编码序列的适应度的提高值是否均小于预设阈值,其中,j为大于等于2的整数;当连续j代群体的基因编码序列的适应度的提高值均大于或等于所述预设阈值,确定为未达到所述终止计算条件;当连续j代群体的基因编码序列的适应度的提高值均小于所述预设阈值,确定为达到所述终止计算条件。5.根据权利要求1所述的基因编码序列的优化方法,其特征在于,在选择适应度最大的基因编码序列作为优化后的基因编码序列之后,还包括:将所述优化后的基因编码序列中重复的序列去除。6.一种基因编码序列的优化装置,其特征在于,包括:序列生成单元,用于生成M个基因编...

【专利技术属性】
技术研发人员:段广有徐凤丹金亮廖国娟葛毅
申请(专利权)人:苏州金唯智生物科技有限公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1