【技术实现步骤摘要】
【国外来华专利技术】鉴定具有相互作用的组分的生物分子的方法、系统和软件相关申请的交叉引用该申请基于35U.S.C.§119(e)要求2013年1月31日提交的题为“鉴定具有相互作用的组分的生物分子的方法、系统和软件”的美国临时专利申请号61/759,276和2013年3月15日提交的题为“使用乘法型模型(MODELOFMULTIPLICATIVEFORM)鉴定生物分子的方法、系统和软件”的美国临时专利申请号61/799,377的权益,其被为了所有目的通过引用全部并入本文。
本公开内容涉及分子生物学、分子进化、生物信息学和数字化系统的领域。更具体地,本公开内容涉及用于通过计算预测生物分子的活性和/或指导定向进化的方法。还提供了用于执行这些方法的系统,包括数字化系统和系统软件。本公开内容的方法在优化用于工业和治疗用途的蛋白方面具备实用性。背景蛋白设计长久以来被认为是艰巨的任务,只因为一个原因,构成可搜索的序列空间的可能分子的激增。蛋白的序列空间是巨大的并且利用本领域已知的现有方法不可能探索详尽。由于这种复杂性,很多近似的方法已被用于设计更好的蛋白;其中首当其冲的是定向进化法。如今,蛋白的定向进化被通过往往迭代进行的多种高通量筛选和重组方式来主导。并行地,已提出了多种计算技术用于搜索序列-活性空间。虽然每种计算技术在特定情况下具有优势,但是有效地搜索序列空间以鉴定功能性蛋白的新方法是高度期望的。概述本公开内容展现了用于生成并利用序列-活性模型的技术,所述序列-活性模型使用非线性项,特别是解释序列中的两个或更多个亚单位之间的相互作用的项。序列-活性模型将生物分子的活性、特征或特性 ...
【技术保护点】
一种用于鉴定影响期望活性的生物分子方法,所述方法包括:(a)接收针对多个生物分子的序列和活性数据;(b)由所述序列和活性数据制作基础模型,其中所述基础模型将活性预测为所述序列的亚单位的存在或不存在的函数;(c)通过对所述基础模型加上或减去至少一个新交互作用项来制作至少一个新模型,其中所述新交互作用项代表两个或更多个相互作用的亚单位之间的相互作用;(d)确定所述至少一个新模型将活性预测为所述亚单位的存在或不存在的函数的能力;以及(e)基于在(d)中确定的所述至少一个新模型的预测活性的能力以及对包括另外的新交互作用项的偏倚来决定是否对所述基础模型加上或减去所述新交互作用项。
【技术特征摘要】
【国外来华专利技术】2013.01.31 US 61/759,276;2013.03.15 US 61/799,3771.一种用于鉴定影响期望活性的生物分子方法,所述方法包括:(a)接收针对多个生物分子的序列和活性数据;(b)由所述序列和活性数据制作基础模型,其中所述基础模型将活性预测为所述序列的亚单位的存在或不存在的函数,并且所述基础模型不包括来自限定的交互作用项集合的交互作用项;(c)制作多个新模型,其中每个新模型通过从所述限定的交互作用项集合选择交互作用项并将所选择的交互作用项加入到所述基础模型来获得,以使得每个新模型包括单个交互作用项;(d)确定所述多个新模型将所述活性预测为所述亚单位的存在或不存在的函数的能力;(e)基于在(d)中确定的每个新模型的预测活性的能力以及每个新模型对包括另外的交互作用项的偏倚在所述多个新模型中鉴定至少一个最佳模型;(f)使用所述至少一个最佳模型代替所述基础模型来重复(c),并加上与(c)中加上的交互作用项不同的交互作用项;(g)使用所述至少一个最佳模型代替所述基础模型来重复(d)和(e);以及(h)重复(f)和(g)一次或更多次。2.一种用于鉴定影响期望活性的生物分子方法,所述方法包括:(a)接收针对多个生物分子的序列和活性数据;(b)由所述序列和活性数据制作基础模型,其中所述基础模型将活性预测为所述序列的亚单位的存在或不存在的函数并且所述基础模型包括限定的交互作用项集合内的所有交互作用项;(c)制作多个新模型,其中每个新模型通过从所述限定的交互作用项集合选择交互作用项并从所述基础模型减去所选择的交互作用项来获得,以使得每个新模型包含所述限定的集合内少一个的所有交互作用项;(d)确定所述多个新模型将所述活性预测为所述亚单位的存在或不存在的函数的能力;(e)基于在(d)中确定的每个新模型预测活性的能力以及每个新模型对包括另外的交互作用项的偏倚在所述多个新模型中鉴定至少一个最佳模型;(f)使用所述至少一个最佳模型代替所述基础模型来重复(c),并减去与(c)中减去的交互作用项不同的交互作用项;(g)使用所述至少一个最佳模型代替所述基础模型来重复(d)和(e);以及(h)重复(f)和(g)一次或更多次。3.根据权利要求1或2所述的方法,其中(c)中的制作所述多个新模型包括利用先验信息来确定所述多个新模型的后验概率分布。4.根据权利要求3所述的方法,其中制作基础模型和/或所述多个新模型包括利用吉布斯抽样使模型符合所述序列和活性数据。5.根据权利要求1或2所述的方法,其中所述至少一个最佳模型包括各自包含不同的交互作用项的两个或更多个最佳模型。6.根据权利要求5所述的方法,所述方法还包括基于所述两个或更多个新模型制作集成模型,其中所述集成模型包括来自所述两个或更多个最佳模型的交互作用项,并且所述交互作用项通过(d)中确定的所述两个或更多个最佳模型预测活性的能力被加权。7.根据权利要求1或2所述的方法,其中(d)中的所述多个新模型预测活性的能力通过赤池信息准则或贝叶斯信息准则来测量。8.根据权利要求1或2所述的方法,其中所述序列为完整的基因组、完整的染色体、染色体片段、对于相互作用基因的基因序列的集合、基因或蛋白。9.根据权利要求1或2所述的方法,其中所述亚单位为染色体、染色体片段、单体型、基因、核苷酸、密码...
【专利技术属性】
技术研发人员:格雷戈里·艾伦·科普,
申请(专利权)人:科德克希思公司,
类型:发明
国别省市:美国;US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。