The invention discloses a method, system and device for prediction of protein interaction. The method acquires the multidimensional image data corresponding to the predicted protein, and inputs the multidimensional image data to the convolutional neural network to process the prediction results. The system includes data modules for obtaining the multi-dimensional image data of the predicted protein, and a processing module for output the multi-dimensional image data to process in the convolution neural network, so as to output prediction results. The device includes a memory for providing storage space and a processor for executing a program for prediction of protein interaction. The invention converts protein sequence data into multi-dimensional image data and processes it with convolution neural network, which provides a method for convolutional neural network parameters suitable for protein data characteristics and extends the dimension of input data, and provides more accurate prediction. The invention can be applied to the field of protein interaction prediction.
【技术实现步骤摘要】
一种蛋白质相互作用预测方法、系统和装置
本专利技术涉及大数据处理技术,尤其是一种蛋白质相互作用预测方法、系统和装置。
技术介绍
蛋白质相互作用是生命活动的基础,细胞内的生理变化均通过蛋白质调节来实现。但是生命活动中各项功能和现象不是由单一蛋白质实现,而是通过蛋白质与蛋白质,蛋白质与核酸以及蛋白质与其他小分子化合物之间的相互作用来实现,因此研究蛋白质之间的作用关系对研究生命科学有重要的意义。全球的科研机构对蛋白质的相互作用关系分析展开了广泛的研究,从早期的理论分析,到随着各类技术发展而产生的实验方法手段,迄今已积累了大量的实验数据。如何从这些数量巨大的生物数据中,挖掘相关信息,在生物信息学领域属热点研究方向。在基于蛋白质的序列特征及结构性质的研究中,现有方法对数据格式要求严格,数据预处理需要大量的人工注释,不利于进行大规模数据分析和未知数据潜在性预测。
技术实现思路
为了解决上述技术问题,本专利技术的第一目的是提供一种蛋白质相互作用预测方法,本专利技术的第二目的是提供一种蛋白质相互作用预测系统,本专利技术的第三目的是提供一种蛋白质相互作用预测装置。本专利技术所采取的第一 ...
【技术保护点】
一种蛋白质相互作用预测方法,其特征在于,包括以下步骤:获取所需预测的蛋白质所对应的多维图像数据;将获得的多维图像数据输入到卷积神经网络中进行处理,从而输出预测结果。
【技术特征摘要】
1.一种蛋白质相互作用预测方法,其特征在于,包括以下步骤:获取所需预测的蛋白质所对应的多维图像数据;将获得的多维图像数据输入到卷积神经网络中进行处理,从而输出预测结果。2.根据权利要求1所述的一种蛋白质相互作用预测方法,其特征在于,所述将获得的多维图像数据输入到卷积神经网络中进行处理,从而输出预测结果这一步骤之前,还设有建立卷积神经网络步骤,所述建立卷积神经网络步骤具体包括:获取蛋白质相互作用数据库中蛋白质所对应的多维图像数据和相互作用数据值,用所得多维图像数据构建输入数据正样本,用所得相互作用数据值构建输出数据正样本;获取蛋白质相互作用数据库外蛋白质所对应的多维图像数据和相互作用数据值,用所得多维图像数据构建输入数据负样本,用所得相互作用数据值构建输出数据负样本;抽选输入数据正样本和输入数据负样本从而分别构建训练输入数据集和测试输入数据集;抽选输出数据正样本和输出数据负样本从而分别构建训练输出数据集和测试输出数据集;用训练输入数据集以及训练输出数据集训练卷积神经网络,用测试输入数据集以及测试输出数据集卷积神经网络;将训练和测试结束后得到的卷积神经网络作为所需建立的卷积神经网络。3.根据权利要求1或2所述的一种蛋白质相互作用预测方法,其特征在于,所述多维图像数据的获取方法包括以下任一种:单独编码的数据转换方法、错位编码的数据转换方法、中心对称编码的数据转换方法和相邻编码的数据转换方法。4.根据权利要求3所述的一种蛋白质相互作用预测方法,其特征在于,所述单独编码的数据转换方法所用公式为:F1=pix(ik1).reshape(length,width,dimension)F2=pix(1800+ik2).reshape(length,width,dimension)式中,F1为第一蛋白质转换后得到的多维图像数据,F2为第二蛋白质转换后得到的多维图像数据,pix()为将蛋白质的序列位点转换为图像像素位点的函数,ik1为第一蛋白质的序列位点,ik2为第二蛋白质的序列位点,reshape()为将一维序列数据转换为矩阵数据的函数,leng...
【专利技术属性】
技术研发人员:邹小勇,王洋,李占潮,戴宗,
申请(专利权)人:中山大学,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。