蛋白质潜在致敏性的预测方法技术

技术编号:8594183 阅读:246 留言:0更新日期:2013-04-18 07:27
本发明专利技术提供了一种蛋白质潜在致敏性的预测方法,包括以下步骤:步骤一,制作训练正集和训练负集;步骤二,对蛋白质的各类属性进行编码,构建特征向量;步骤三,引用最大相关最小冗余方法进行特征排序,引用递增式的特征选择方法进行最优特征选择;步骤四,通过对选择出的特征进行统计分析,给出与蛋白质致敏特性显著相关的特征结果报告。本发明专利技术提供的预测方法可以有效地对蛋白质的潜在致敏性进行预测,其准确度比现有的计算生物学预测方法更高,并且能有效分析出同蛋白质的致敏特性相关的蛋白特征,对过敏原预测、蛋白质致敏性机制研究有着重要作用。

【技术实现步骤摘要】
蛋白质潜在致敏性的预测方法
本专利技术涉及一种蛋白质特性的计算生物学预测方法,尤其是涉及一种蛋白质潜在致敏性的预测方法。
技术介绍
由食物和环境因素导致的过敏及其它的超敏反应是慢性病的主要成因,全世界约有25%的人口受此困扰。过敏原包括食物中的蛋白质、冷空气、热空气、紫外线、金属等等,其中具有致敏性的蛋白质对人类的健康可能造成巨大危害。另外,越来越多的转基因食品进入到我们的日常生活中,食物过敏的潜在风险也随之增高。因此,对蛋白质的潜在致敏性进行评估预测是十分必要的。目前,计算生物学的过敏原预测方法主要有三种,一是基于序列的方法,二是基于motif(模体)的方法,三是基于SVM(支持向量机)的方法。FAO/WHO(联合国粮食与农业组织/世界卫生组织)提出的基于序列的预测方法,其原理是根据待测蛋白与已知过敏原蛋白在氨基酸序列上的相似度进行判别,该方法可以有效地预测出过敏原蛋白,但其假阳性率非常高;基于motif的预测方法是比较待测蛋白与过敏原特征motifs,该方法同基于序列的方法相比,一定程度上提高了特异性,减少了假阳性率,但总体准确率却只有65%左右,还远达不到实际需求;基于SVM的本文档来自技高网...
蛋白质潜在致敏性的预测方法

【技术保护点】
一种蛋白质潜在致敏性的预测方法,其特征在于,包括以下步骤:步骤一,制作训练正集和训练负集;步骤二,对蛋白质的各类属性进行编码,构建特征向量;步骤三,引用最大相关最小冗余方法进行特征排序,引用递增式的特征选择方法进行最优特征选择;步骤四,通过对选择出的特征进行统计分析,给出与蛋白质致敏特性显著相关的特征结果报告。

【技术特征摘要】
1.一种蛋白质潜在致敏性的预测方法,其特征在于,包括以下步骤:步骤一,制作训练正集和训练负集;步骤二,对蛋白质的各类属性进行编码,构建特征向量;步骤三,引用最大相关最小冗余方法进行特征排序,引用递增式的特征选择方法进行最优特征选择;步骤四,通过对选择出的特征进行统计分析,给出与蛋白质致敏特性显著相关的特征结果报告;步骤二中,所述属性的编码包括以下步骤:将二级结构倾向性、疏水性、极化性、可溶性、标准化的范德华体积和极性,按照序列位置中每个氨基酸的分类对蛋白序列进行重新编码,所述分类见下表:所述构建特征向量包括如下步骤:整合蛋白质的属性;每类属性分别计算其特征向量;然后整合成一个156维的表示蛋白质的特征向量;其中,所述特征向量所示的蛋白质的氨基酸组成计算公式为:蛋白质二级结构倾向性、疏水性、极化性、可溶性、标准化的范德华体积和极性的特征向量元件的计算,则根据所述重新编码后的序列完成,对每种属性,计算其重新编码序列的C,T和D;以一...

【专利技术属性】
技术研发人员:李婧王婧张大兵
申请(专利权)人:上海交通大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1