人类1型双载蛋白Src同源结构域3结合肽的亲和力预测及分析方法技术

技术编号:7451321 阅读:478 留言:0更新日期:2012-06-22 07:13
本发明专利技术公开了一种人类1型双载蛋白Src同源结构域3结合肽的亲和力预测及分析方法,先选取氨基酸的电性性质、立体性质、疏水性质和氢键性质参数,采用主成分分析法建立氨基酸理化性质归类得分,再用该得分对肽序列中的每个氨基酸残基进行表征,实现肽序列结构的参数化描述,再用遗传算法从肽序列结构参数中挑选出与亲和力密切相关的特征参数,采用高斯过程方法建立特征参数与亲和力的关系模型即亲和力预测及分析模型,最后通过分析模型的超参数获得影响肽亲和力的结构因素,通过模型预测得到肽的亲和力值;本发明专利技术可以为高通量筛选具有高亲和力的人类1型双载蛋白Src同源结构域3结合肽提供有力的工具,进而促进人类1型双载蛋白Src同源结构域3结合肽类抑制剂的开发研究。

【技术实现步骤摘要】

本专利技术属于计算机化学领域,涉及一种应用计算模型预测和分析多肽配体与蛋白质受体之间亲和力大小的方法。
技术介绍
作为生物体系的重要组分之一,蛋白质在生命运作中发挥了不可替代的作用并行使着多样的生物学功能,如组织构建、物质运输、反应催化和免疫调控等。蛋白质相互作用 (protein- protein interaction, PPI)在信号转导及其它重要的生物过程中也扮演着极其重要的角色。通常,PPI由结构域所介导。Src同源结构域3(Src homology domain, SH3)是人类蛋白质组中最为丰富的结构域,广泛存在于各类蛋白如蛋白激酶、脂肪酶、GTP 酶及调节蛋白质中并引导了多样细胞生化过程。Src同源结构域3由50-70个氨基酸残基组成,包含由五个β折叠组成的两个片层结构,折叠模式具有高度保守性,倾向于识别富含脯氨酸的PXXP型肽链(P为脯氨酸,X为任意氨基酸)。人双载蛋白(amphiphysin)有两种型别amphiphySin 1和amphiphysin 2,它们与包涵素介导的胞吞作用、肌动蛋白功能性及信号通路等过程密切相关,在诸多生理和病理过程中扮演了极其重要的角色。既往研究表明,由人双载蛋白Src同源结构域3介导的PPI与一些肿瘤发生、增殖和转移过程以及骨髓增生症、巨颂症、多发性肾病等密切相关。因此,甄别人类基因组中可以被人双载蛋白 Src同源结构域3识别的肽基序,对于了解人双载蛋白Src同源结构域3介导的PPI的分子机制以及开发具有高亲和力和特异性的人双载蛋白Src同源结构域3结合肽类抑制剂均非常有益。但是,基于实验途径逐个合成人类基因组编码的所有可能肽基序(一般为10个氨基酸残基)并逐个检测其与人双载蛋白Src同源结构域3的亲和力是一件极度耗时耗力的工作;而既往文献报道的预测方法如采用自由能分析法研究Src同源结构域3与不同肽配体的结合热力学行为由于效率很低也不适合于Src同源结构域3结合肽的高通量筛选。因此,有必要发展一种有效的基于计算机的方法来精确预测和分析人双载蛋白Src同源结构域3结合肽的亲和力,以实现具有高亲和力的人类双载蛋白Src同源结构域3结合肽的高通量筛选,进而促进具有高亲和力和特异性的人类双载蛋白Src同源结构域3结合肽类抑制剂的开发研究。
技术实现思路
有鉴于此,本专利技术的目的在于提供一种,为高通量筛选具有高亲和力的人类1型双载蛋白Src同源结构域3结合肽提供有力的工具,进而促进具有高亲和力和特异性的人类1型双载蛋白Src 同源结构域3结合肽类抑制剂的开发研究。为达到上述目的,本专利技术提供如下技术方案,包含如下步骤a.氨基酸理化性质归类得分的建立选取氨基酸的电性性质参数、立体性质参数、疏水性质参数和氢键性质参数,采用主成分分析方法,获得足以表征氨基酸电性性质、立体性质、疏水性质和氢键性质的主成分,计算每个主成分得分矢量,将其定义为氨基酸理化性质归类得分;b.肽序列结构的参数化描述选择已知亲和力大小的人类1型双载蛋白Src同源结构域3结合肽,应用步骤a建立的氨基酸理化性质归类得分对肽序列中的每个氨基酸残基进行表征,获得组成肽的所有氨基酸残基的理化性质归类得分,作为肽序列结构参数;c.与亲和力最为密切相关的特征参数的选取采用遗传算法从步骤b所得的肽序列结构参数中挑选出与亲和力最为密切相关的特征参数;d.亲和力预测及分析模型的建立采用高斯过程方法建立步骤c所得特征参数与亲和力的关系模型即亲和力预测及分析模型;e.肽的亲和力预测及分析通过对步骤d建立的亲和力预测及分析模型的超参数进行分析,获得影响肽亲和力的结构因素;针对未知亲和力大小的肽,根据其氨基酸序列计算出步骤c选出的特征参数的具体数值,再输入步骤d建立的亲和力预测及分析模型中进行计算,即得到肽与人类1型双载蛋白Src同源结构域3的亲和力值。进一步,步骤a中所述电性性质参数包括净电荷(net charge)、分子极性 (polarity)、区域电子效应(localized electrical effect)禾口极化率(polarizability); 所述立体性质参数包括标准范德瓦耳斯体积(normalized van der Waals volume)、分子尺度(molecular size)、侧链体禾只(residue volume)、图形指数(graph shape index)禾口柔性参数(flexibility parameter);所述疏水性质参数包括溶剂化自由能(solvation free energy)、分配系数(partition coefficient)、色谱保留指数(retention index)、疏水矩 (hydrophobic moment)禾口溶剂可及面禾只(solvent accessible surface area);所述氧键性质参数包括氢键给受体数目(number of hydrogen bond donors/acceptors)和氢键贡献因子(hydrogen bond contribution factor) 进一步,步骤c中所述遗传算法参数设置如下初始种群大小为200,收敛标准为 100代循环,变异度为1%,目标函数用留一法交叉验证。进一步,步骤d是将肽对人类1型双载蛋白Src同源结构域3的亲和力指标BLU (Boehringer light unit)转换为对数形式IogBLU,再以IogBLU作为模型的因变量,使用高斯过程方法建立特征参数与该因变量之间的线性/非线性杂化回归模型,以留一法交叉验证和测试集外部预测验证模型的预测能力。本专利技术的有益效果在于本专利技术基于氨基酸理化性质归类得分和遗传算法-高斯过程方法建立了一种。首先,根据结构决定性质的原理,从全面解析肽序列结构角度出发,从目前公开的上千种氨基酸物理化学参数和形状几何指数中精心选取了 119种指标,这些指标具有意义明确、表征能力强、易于操作等优点,在此基础上应用主成分分析法建立的氨基酸理化性质归类得分,可以全面、有效地反映氨基酸的理化性质信息,继而实现对肽序列结构的参数化描述;其次,使用具有强大全局搜索能力的遗传算法挑选特征参数,能够在较短的时间内从大量肽序列结构参数中搜寻到全局最优解即与亲和力最为密切相关的特征参数用于后续建模;最后,考虑到肽序列结构与其生物活性之间存在非常复杂的关系,本专利技术选用高斯过程方法(一种线性/非线性杂化的机器学习建模方法)对特征参数与亲和力之间的内在定量关系进行统计学习,建立了简便可靠的亲和力预测及分析模型,实现了根据肽序列预测其亲和力的功能,可以为高通量筛选具有高亲和力的人类1型双载蛋白Src同源结构域3结合肽提供有力的工具,进而促进具有高亲和力和特异性的人类1型双载蛋白Src同源结构域3结合肽类抑制剂的开发研究。附图说明图1为20个天然氨基酸在电性性质前2个主成分得分空间中的分布示意图。图2为20个天然氨基酸在立体性质前2个主成分得分空间中的分布示意图。图3为20个天然氨基酸在疏水性质前2个主成分得分空间中的分布示意图。图4为20个天然氨基酸在氢键性质前2个主成分得分空间中的分布示意图。图5为亲和力预测及分析模型对人类1型双载蛋白Src同源结构域3结合肽的亲和力预测本文档来自技高网
...

【技术保护点】

【技术特征摘要】

【专利技术属性】
技术研发人员:任彦荣
申请(专利权)人:重庆教育学院
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术