The invention discloses a method for multiple sequence comparison of multi-objective artificial bee colony algorithm based on biology, the technical scheme is to construct multiple sequence alignment multi-objective optimization model, then using multi-objective artificial bee colony algorithm to optimize the new multiple sequence alignment multi-objective optimization model is the embodiment of the invention, the multi-objective artificial bee colony algorithm based on has strong ability of global exploration and local exploitation ability, fast convergence speed and can obtain multiple sequence alignment performance and good biological characteristics.
【技术实现步骤摘要】
一种基于多目标人工蜂群算法的生物多序列对比方法
本专利技术属于生物信息学
,尤其是涉及一种基于多目标人工蜂群算法的生物多序列对比方法。
技术介绍
多序列比对(MultipleSequenceAlignment,MSA)作为生物序列分析的最基本任务之一,是生物信息学目前研究的热点问题之一,它是SPS(Sum-of-PairsScore,配对得分总和)意义下的NP(Non-deterministicPolynomial,非确定多项式)完全组合优化问题。目前用于解决MSA问题的方法主要有:遗传算法、带变异二进制粒子群优化算法、细菌觅食优化,人工蜂群算法和各种算法的混合使用方法以及基于图论的方法等。但是,专利技术人发现,上述算法适用于多序列比对的过程中,要么控制参数多、收敛速度慢、计算量多且计算复杂,要么虽然具有控制参数少、全局寻优能力强、收敛速度快、鲁棒性强等优点,但当其接近全局最优解时,搜索速度变慢,甚至易陷入局部最优。因此,亟需一种具有较强的全局探索能力、局部开采能力且收敛速度快的算法适用于多序列比对,能获取较好的多序列比对性能和生物特性。
技术实现思路
本专利技 ...
【技术保护点】
一种基于多目标人工蜂群算法的生物多序列对比方法,其特征在于:所述方法包括以下步骤:步骤1:设置多序列对比方法的初始参数,包括预先设定种群规模M、最大迭代次数Gmax、蜜源开采限制次数Limit以及当前迭代次数iter=0;步骤2:对蜜源进行初始化及个体编码,并随机产生M个引领蜂;设有N条序列参与比对,各条序列的长度依次为l1,l2,Λ,lN,并随机产生lmax和1.2lmax之间的随机数L作为比对后序列的长度;其中lmax=max(l1,l2,Λ,lN);根据预设的序列比对的数学模型,将每条序列需要插入的空位数分别设为L‑li,并随机生成N个1到L‑li随机排列的一维矩阵α ...
【技术特征摘要】
1.一种基于多目标人工蜂群算法的生物多序列对比方法,其特征在于:所述方法包括以下步骤:步骤1:设置多序列对比方法的初始参数,包括预先设定种群规模M、最大迭代次数Gmax、蜜源开采限制次数Limit以及当前迭代次数iter=0;步骤2:对蜜源进行初始化及个体编码,并随机产生M个引领蜂;设有N条序列参与比对,各条序列的长度依次为l1,l2,Λ,lN,并随机产生lmax和1.2lmax之间的随机数L作为比对后序列的长度;其中lmax=max(l1,l2,Λ,lN);根据预设的序列比对的数学模型,将每条序列需要插入的空位数分别设为L-li,并随机生成N个1到L-li随机排列的一维矩阵αi后采用二维矩阵进行个体编码,得到每一个蜜源的编码为γ=[a1,a2,Λ,aN];其中,一维矩阵中存储的是各条序列所需插入空位的位置,在输入比对结果时将蜜源编码转化成对应的比对并以二维矩阵的形式存储;1≤i≤N;确定随机产生的M个引领蜂及其对应的序列长度和序列;步骤3:确定种群当前最优蜜源位置Ebest;对每一个随机产生的引领蜂均根据下述公式(4)进行计算,计算出目标函数f1(Si)和f2(Si);其中,式(4)中,g(S')=n1×gopen+n2×gextend表示对齐序列组S'的空位罚分,n1,n2分别为空位开放的数量和空位扩展的数量;Ω表示多序列比对空间;令F1=(f1(S1),f1(S2),Λ,f1(SL)以及F2=(f2(S1),f2(S2),Λ,f2(SL),则计算出F=(min(F1),min(F2)),并记录种群当前最优蜜源位置Ebest;步骤4:通过种群当前最优蜜源位置Ebest对每一个随机产生的引领蜂进行单点交叉操作产生新的引领蜂Vi;步骤5:按步骤3中的公式(4)计算每一个随机产生的引领蜂的适应度值F(Ei)及其对应新引领蜂的适应度值F(Vi)并进行比较;如果F(Vi)<F(Ei),则用新引领蜂Vi的序列比对替代及其对应的随机产生的引领蜂Ei的序列比对;否则继续保持随机产生的引领蜂Ei的原始...
【专利技术属性】
技术研发人员:匡芳君,张思扬,周文俊,
申请(专利权)人:温州商学院,
类型:发明
国别省市:浙江,33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。