当前位置: 首页 > 专利查询>吉林大学专利>正文

基于深层神经网络的脑脊液蛋白质的预测方法技术

技术编号:23346517 阅读:39 留言:0更新日期:2020-02-15 04:57
基于深度神经网络的脑脊液蛋白质的预测方法属于人工智能与大数据技术领域。本发明专利技术将现有文献和数据库的脑脊液中已经被生物实验验证的蛋白质列表作为模型训练的正样本;在Pfam蛋白质家族信息数据库中删除正样本对应的蛋白质家族信息,在剩余的蛋白质家族信息数据库中查找家族中蛋白质数量超过10个的蛋白质家族,从这些蛋白质家族中随机选取10个蛋白质信息作为模型训练的负样本。将正样本和负样本数据分成训练集、验证集和测试集。对蛋白质特征进行特征选择,搭建模型,用训练集训练模型,验证集进行调参,测试集进行性能评价。输入为蛋白特征,输出为预测结果。提高了脑脊液预测的准确率,最终实现脑脊液蛋白的预测。

Prediction method of cerebrospinal fluid protein based on deep neural network

【技术实现步骤摘要】
基于深层神经网络的脑脊液蛋白质的预测方法
本专利技术属于大数据、人工智能
,特别是涉及到一种基于深层神经网络的脑脊液蛋白质的预测方法。
技术介绍
脑脊液是由脑室内脉络丛产生的一种无色透明的液体,它循环流动于脑和脊髓表面,经脑内静脉系统与体循环相关联。主要功能是①保护大脑和脊髓免受外界震荡损伤;②调节颅内压力变化;③供给大脑、脊髓营养物质并运走代谢产物;④调节神经系统碱储量,维持正常PH值等。当脑组织或脊髓发生病变和外伤时,脑脊液也会发生各种改变。通过对脑脊液中的蛋白预测,找到疾病相关蛋白进行病理分析,能够促进疾病的早期诊断,如神经退行性疾病,多发性硬化症和创伤性脑损伤等。但是目前,公知的关于可计算的方法预测脑脊液蛋白质仍为空白。因此现有技术当中亟需要一种新型的技术方案来解决这一问题。
技术实现思路
本专利技术所要解决的技术问题是:提供一种基于深层神经网络的脑脊液蛋白质的预测方法用于解决目前公知的关于可计算的方法预测脑脊液蛋白质仍为空白的技术问题。基于深层神经网络的脑脊液蛋白质的预测方法,包括以下本文档来自技高网...

【技术保护点】
1.基于深层神经网络的脑脊液蛋白质的预测方法,其特征是:包括以下步骤,并且以下面步骤顺次进行,/n步骤一、将脑脊液中已经被生物实验验证的蛋白质作为模型训练的正样本并存储正样本的蛋白质信息数据;/n步骤二、在Pfam蛋白质家族信息数据库中删除步骤一的正样本对应的蛋白质家族信息,在剩余的蛋白质家族信息数据库中查找家族中蛋白质数量超过10个的蛋白质家族,从这些蛋白质家族中随机选取10个蛋白质信息作为模型训练的负样本并存储负样本的蛋白质信息数据;/n步骤三、将正样本和负样本信息数据均按照80%训练集、10%验证集、10%测试集进行分割;/n步骤四、将蛋白质特征进行分类,初步获得蛋白质特征向量;/n步骤...

【技术特征摘要】
1.基于深层神经网络的脑脊液蛋白质的预测方法,其特征是:包括以下步骤,并且以下面步骤顺次进行,
步骤一、将脑脊液中已经被生物实验验证的蛋白质作为模型训练的正样本并存储正样本的蛋白质信息数据;
步骤二、在Pfam蛋白质家族信息数据库中删除步骤一的正样本对应的蛋白质家族信息,在剩余的蛋白质家族信息数据库中查找家族中蛋白质数量超过10个的蛋白质家族,从这些蛋白质家族中随机选取10个蛋白质信息作为模型训练的负样本并存储负样本的蛋白质信息数据;
步骤三、将正样本和负样本信息数据均按照80%训练集、10%验证集、10%测试集进行分割;
步骤四、将蛋白质特征进行分类,初步获得蛋白质特征向量;
步骤五、用t检验方法过滤步骤四中初步获得的蛋白质特征向量,过滤后的蛋白质特征向量用支持向量机联合特征去除算法(SVM-RFE)进行特征选择,获得模型拟合训练用的蛋白质特征向量;
步骤六、通过深层神经网络建立分类器模型,所述分类器模型的输入为步骤五中获得的特征向量,分类器模型的输出为是入脑脊髓蛋白质或非入脑脊髓蛋白质;
步骤七、用训练集采用线性整流函数ReLU激活函数和交叉熵的损失函数拟合分类器模型,获得训练后的分类器模型;
步骤八、对分类器模型进行评估
将验证集中正样本和负样本的蛋白质信息以及步骤五中获得的特征向量输入步骤七训练后的分类器模型进行验证,输出的验证结果使用敏感性(Sensitivity)、特异性(Specificity)、查准率(accuracy)、准确率(Precision)、马修斯相关性系数MCC(Matthewscorrelationcoefficient)及ROC曲线下面的面积AUC(AreaUnderRocCurve),作为评价模型验证效果的评估指标,
获得的AUC小于90%,重复步骤七重新拟合训练分类器模型直至AUC达到90%以上;
步骤九、用测试集对步骤八中验证后的分类器模型进行分类准确性验证,分类准确性小于90%,重复步骤七和步骤八直至分类准确性达到90%以上,分类器模型建立完成;
步骤十、向步骤九中建立完成的分类器模型中输入预测蛋白质的特征向量,通过输出的预测结果实现基于深层神经网络的脑脊液蛋白质的预测。


2.根据权利要求1所述的基于深层神经网络的脑脊液蛋白质的预测方法,其特征是:所述步骤四中蛋白质特征按照4个大类进行分类,分别为:1)序列性质,2)结构性质,3)域和基序性质,4)物理化学性质。


3.根据权利要求1所述的基于深层神经网络的脑脊液蛋白质的预测方法,其特征是:所述步骤五中t检验方法中采用显著水平阈值p-value<=0.005。


4.根据权利要求1所述的基于深层神经网络的脑...

【专利技术属性】
技术研发人员:邵丹王岩黄岚何凯崔薛腾张双全
申请(专利权)人:吉林大学
类型:发明
国别省市:吉林;22

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1