【技术实现步骤摘要】
一种基因序列优化方法、装置、设备及介质
本申请涉及基因序列处理
,特别涉及一种基因序列优化方法、装置、设备及介质。
技术介绍
DNA中文名称是脱氧核糖核酸,是一种高分子化合物,由四种脱氧核糖核苷酸基本单元组成。这四种脱氧核糖核苷酸分别由腺嘌呤(Adenine)、胞嘧啶(Cytosine)、鸟嘌呤(Guanine)和胸腺嘧啶(Thymine)四种碱基组成,简记为A、T、C、G,一般用碱基序列表示DNA(DeoxyribonucleicAcid,脱氧核糖核酸)分子结构。通过生物化学手段控制DNA分子之间的杂交反应,可以实现DNA计算。一般认为,DNA计算具有先天并行的优势,在求解自然界广泛存在的诸多复杂问题上,具有经典数字计算机所无法比拟的巨大优势。DNA计算需要依靠功能强大的蛋白质作为辅助工具,完成各类计算。故根据的蛋白质-DNA相互作用,设计出合适的DNA序列就十分重要。遗传算法是一种以生物进化为启发,求解复杂全局优化问题的仿生型算法。它以自然进化论与遗传变异理论为基础,将运算对象编码,同时使用多个搜索点的概率搜索技术 ...
【技术保护点】
1.一种基因序列优化方法,其特征在于,包括:/n步骤S11:随机生成初代种群,将所述初代种群作为初始运算种群,进行迭代运算;其中,所述初代种群中的个体均为目标基因序列对应的格雷码;所述目标基因序列为待优化基因序列中多个基因片段组成的序列;/n步骤S12:对所述初始运算种群进行聚类;/n步骤S13:利用蛋白质与基因相互作用打分函数对所述初始运算种群中的每个所述个体进行适应度计算;/n步骤S14:根据聚类结果从所述初始运算种群中筛选出满足预设条件的所述个体,得到目标种群;/n步骤S15:从所述目标种群中选择出第一预设数量个个体组进行交叉计算;其中,所述个体组包括两个个体,并且, ...
【技术特征摘要】
1.一种基因序列优化方法,其特征在于,包括:
步骤S11:随机生成初代种群,将所述初代种群作为初始运算种群,进行迭代运算;其中,所述初代种群中的个体均为目标基因序列对应的格雷码;所述目标基因序列为待优化基因序列中多个基因片段组成的序列;
步骤S12:对所述初始运算种群进行聚类;
步骤S13:利用蛋白质与基因相互作用打分函数对所述初始运算种群中的每个所述个体进行适应度计算;
步骤S14:根据聚类结果从所述初始运算种群中筛选出满足预设条件的所述个体,得到目标种群;
步骤S15:从所述目标种群中选择出第一预设数量个个体组进行交叉计算;其中,所述个体组包括两个个体,并且,任一所述个体组中的两个个体均属于同一聚类;
步骤S16:从所述目标种群中随机选择出第二预设数量个所述个体进行变异;
步骤S17:判断所述目标种群是否达到预设收敛条件;
步骤S18:若所述目标种群未达到所述预设收敛条件,则将当前目标种群确定为初始运算种群,并跳转至步骤S12继续迭代;
步骤S19:若所述目标种群达到所述预设收敛条件,则停止迭代,并从所述目标种群中确定出第一目标个体,以实现对所述待优化基因序列的优化;其中,所述第一目标个体包括每一个聚类中适应度最高的个体。
2.根据权利要求1所述的基因序列优化方法,其特征在于,所述对所述初始运算种群进行聚类,包括:
利用K-means算法对所述初始运算种群进行聚类。
3.根据权利要求1所述的基因序列优化方法,其特征在于,所述对所述初始运算种群进行聚类,包括:
利用DBSCAN算法对所述初始运算种群进行聚类。
4.根据权利要求1所述的基因序列优化方法,其特征在于,所述判断所述目标种群是否达到预设收敛条件,包括:
判断所述目标种群的进化代数是否达到预设代数阈值。
5.根据权利要求1所述的基因序列优化方法,其特征在于,所述判断所述目标种群是否达到预设收敛条件,包括:
判断所述目标种群对应的目标差值是否小于预设差值阈值;
其中,所述目标差值为基于当前目标种群中所有个体与上一代目标种群中对应的个体之间的二进制差值计算得到的差值;所述二进制差值为利用个体对应的二进制码计算得到的差值。
6.根据权利要求5所述的基因序列优化方法,其特征在于,所述判断所述目标种群是否达到预设收敛条件,包括:
判断所述目标种群对应的格雷码位差异数量是否小于预设位差阈值;
其...
【专利技术属性】
技术研发人员:李辰,蒋东东,金良,徐哲,赵雅倩,李仁刚,
申请(专利权)人:浪潮电子信息产业股份有限公司,
类型:发明
国别省市:山东;37
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。