【技术实现步骤摘要】
一种基于遗传算法用于高通量混合测序实验分组优化的系统和方法
[0001]本专利技术涉及信息技术以及生物高通量测序,具体涉及一种基于遗传算法用于高通量混合测序(Pooling)实验分组优化的系统和方法。
技术介绍
[0002]高通量测序技术又称为“下一代”测序技术,是对传统测序的一次革命性的改变,一次对大规模的分子进行序列测定。近些年高通量测序技术的迅猛发展,伴随着生物信息学处理序列的成熟应用,该技术被广泛地用来解决生物学各种问题,例如我们可以实施更多物种的基因组计划从而解密更多生物物种的基因组遗传密码,同时在已经完成基因组序列测定的物种中,对该物种的其他品种进行大规模的全基因组重测序也成为了可能。随着人类基因组计划的顺利完成,测序技术取得了显著的进步,使得测序成本不断的持续下降,检测的类型也越来越丰富,使研究人员可以在短时间内获得的数据量越来越多。
[0003]高通量测序技术中一种减少成本的测序方式是多重测序方法,它是将不同来源的DNA 标本分别添加带有特殊的不同分子标签(条形码(Barcode)或者索引(Index ...
【技术保护点】
【技术特征摘要】
1.一种用于高通量混合测序实验分组优化的系统,其包括:数据获取模块,其确定测序平台及测序类型,并获取样本数据;预处理模块,其读取到的实验数据进行预处理;优化模块,其建立混合测序实验分组的优化模型;求解模块,其设计模型求解的智能优化算法。2.一种用于高通量混合测序实验分组优化的系统,其包括:数据获取模块,其确定测序平台及测序类型,并获取样本数据;预处理模块,其读取到的实验数据进行预处理;优化模块,其建立混合测序实验分组的优化模型;求解模块,其设计模型求解的智能优化算法。3.根据权利要求1或2所述的系统,其中所述预处理是指:对样本数据确定每个分组所能承受的数据量的上限和下限,计算出每一个样本对应的实际需求数据量;由计算出的所有样本总的实际需求数据量和每组数据量的上限,得到分组的组数;根据样本特殊标签将样本聚类,每个类型会对应若干个样本,并计算每个类型中的样本数、对应的实际需求数据量以及每个样本对应的标签序列。4.根据权利要求1或2所述的系统,其中所述优化模型是以每组的实际需求数据总量与每个分组所能承受的数据量的上限的距离为目标建立的。5.根据权利要求1或2所述的系统,其中所述智能优化算法是带精英策略的遗传算法。6.一种...
【专利技术属性】
技术研发人员:张洪波,代晓转,刘军,陈琪,
申请(专利权)人:杭州诺辉健康科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。