【技术实现步骤摘要】
氨基酸一维属性预测模型训练方法、装置及属性预测方法
[0001]本专利技术涉及神经网络与蛋白质数据分析结合的
,具体涉及氨基酸一维属性预测模型训练方法、装置及属性预测方法。
技术介绍
[0002]蛋白质主要由碳、氢、氧、氮等化学元素组成,是一类重要的生物大分子。蛋白质分子上氨基酸的序列和由此形成的立体结构构成了蛋白质结构的多样性。蛋白质具有一级、二级、三级、四级结构,蛋白质分子的结构决定了它的功能,蛋白质分子的空间结构决定了蛋白质功能。为了从分子水平上了解蛋白质的作用机制,常常需要测定蛋白质的三维结构,常见的蛋白质三维结构的测定方法有核磁共振、X射线和冷冻电镜,但是,实验确定数亿种已知蛋白质结构的成本令人望而却步,故有必要直接从它们的序列计算预测蛋白质结构。所有蛋白质都是由20种不同氨基酸连接形成的多聚体。蛋白质二级结构、骨架二面角、溶剂可及表面积等氨基酸残基一维属性,是构建蛋白质三维结构的重要特征,骨架二面角和二级结构决定了三维结构的空间构象,溶剂可及表面积决定了氨基酸残基侧链基团位置。这三种属性的快速获取能有效帮助 ...
【技术保护点】
【技术特征摘要】
1.氨基酸一维属性预测模型训练方法,其特征在于,所述方法包括:构建预测模型,所述预测模型包括:特征提取层、若干个串联的感知块组成的感知层以及前向网络层,且特征提取层以及感知层均基于卷积层搭建的;获取蛋白质氨基酸一维属性预测训练集,并使用所述训练集训练预测模型直至收敛,得到目标预测模型。2.根据权利要求1所述的氨基酸一维属性预测模型训练方法,其特征在于,所述特征提取层,包括:若干个并联的第一卷积层、第一数据合并层、以及第二卷积层,其中,第一卷积层分别处理样本数据后,得到第一卷积结果;第一数据合并层将样本数据与各个第一卷积结果合并后,输出到第二卷积层;第二卷积层对合并结果进行卷积后得到第二卷积结果,并输出到感知层。3.根据权利要求2所述的氨基酸一维属性预测模型训练方法,其特征在于,各个第一卷积层的卷积核尺寸类别数量等于第一卷积层的数量,且每一个第一卷积层均均有一个卷积核。4.根据权利要求2所述的氨基酸一维属性预测模型训练方法,其特征在于,所述感知层为N个串联的感知层组成的感知层序列,且N为正整数,其中,每一个感知层均包括感知块、第二数据合并层以及第三卷积层,感知块为并联的若干个第四卷积层组成;感知层序列中的第一个感知层的感知块接收特征提取层输出的第二卷积结果,处理后得到感知结果,将感知结果输出到第二数据合并层以及第2个至第N个感知层中的第二数据合并层;第二数据合并层将感知结果、特征提取层输出的第二卷积结果以及样本数据合并后,输出到第三卷积层;第三卷积层将卷积结果输出到感知层序列中的第二个到第N个感知层的第二数据合并层;针对感知层序列中的第二个到第N个感知层中的每一个感知层,所述感知层的感知块收上一个感知层输出的卷积结果,处理后得到感知结果,将感知结果输出到自身所在感知层中的第二数据合并层;第二数据合并层将所述感知结果、特征提取层输出的第二卷积结果、样本数据以及接收的顺序次序在自身之前的其他感知块的输出合并后得到合并结果,并将合并结果输出到自身所在感知层中第三卷积层,第三卷积层将卷积结果输出到感知层序列中的下一个感知层。5.根据权利要求1所述的氨基酸一维属性预测模型训练方法,其特征在于,所述感知块包括M个并联的第四卷积层,其中,第一个第四卷积层...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。