当前位置: 首页 > 专利查询>江南大学专利>正文

使用KNN计算与相似性比对预测蛋白质亚细胞区间方法技术

技术编号:13346707 阅读:76 留言:0更新日期:2016-07-14 17:09
本发明专利技术公开了一种使用KNN计算与相似性比对预测蛋白质亚细胞区间方法,其特征在于,包括以下步骤:步骤1、提取蛋白质序列数据集中所有蛋白质序列的AAC特征;步骤2、通过KNN算法,确定预测范围内的蛋白质序列集合;步骤3、进行Blast相似性比对计算,得到最高相似性序列;最高相似性序列所属的区间就是所预测序列的所属区间。本发明专利技术的预测准确率较高,尤其在传统方法预测准确率较低的亚细胞类上识别精度明显提高,对准确预测未知蛋白的亚细胞位置具有重要作用。

【技术实现步骤摘要】

【技术保护点】
一种使用KNN计算与相似性比对预测蛋白质亚细胞区间方法,其特征在于,包括以下步骤:步骤1、提取蛋白质序列数据集中所有蛋白质序列的AAC特征;步骤2、在蛋白质序列数据集中选取一条蛋白质序列设定为测试序列,其余蛋白质序列设定为训练集,通过KNN算法,确定预测范围内的蛋白质序列集合;步骤3、将所预测序列与预测范围内的蛋白质序列集合进行Blast相似性比对计算,得到最高相似性序列;最高相似性序列所属的区间就是所预测序列的所属区间。

【技术特征摘要】

【专利技术属性】
技术研发人员:张梁薛卫王雄飞杨荣丽
申请(专利权)人:江南大学
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1