蛋白质分类方法技术

技术编号:24332765 阅读:43 留言:0更新日期:2020-05-29 20:31
本发明专利技术公开了一种蛋白质分类方法,包括如下步骤:将蛋白质三维模型置入N*N*N大小的体素占据网格;对所述体素占据网格投射N*N条射线,每条射线通过N个体素的中心;基于射线与蛋白质三维模型的相交情况构建占据模型;将所述占据模型通过三维卷积神经网络实现对蛋白质的分类;采用体素占据网格实现对蛋白质结构的体积表示,从原始蛋白质体积数据中利用机器学习为蛋白质创建快速准确的分类器,对蛋白质数据集实现了高速高精度的分类效果。

Protein classification

【技术实现步骤摘要】
蛋白质分类方法
本专利技术属于蛋白质数据分类
,具体地说,是涉及一种蛋白质分类方法。
技术介绍
结构生物学的目标,包括全面理解分子的形状和由生物大分子支撑的形式,并扩展这方面的内容,以理解如何使用不同的分子结构来呈现大多数生物过程。在这些大分子中,蛋白质是参与大多数过程的关键效应器,具有动态复杂的表面;它们可以由成千上万个原子组成,在原子尺度上由于局部(残基侧链)或全局(环或域)结构变化而表现出多种不同的构象,这些结构变化极大地影响它们的全局和局部形状。由于蛋白质的结构与它们的功能有关,而它们之间相互作用的中断可能导致疾病状态,因此对它们的形状进行表征非常重要,有助于识别潜在的粘合剂,如其他蛋白质、药物或核酸等。蛋白质分类是生物信息学中的关键问题之一,许多无监督方法被应用于蛋白质分类问题中,其中的代表性方法包括自然矢量方法、蛋白质地图、K-string字典、Yau-Hausdorff距离等。随着机器学习的快速发展,将机器学习方法应用于蛋白质分类也取得了很大进展。Khan等采用蚁群优化方法,结合关联规则挖掘与监督分类机制对蛋本文档来自技高网...

【技术保护点】
1.蛋白质分类方法,其特征在于,包括如下步骤:/n将蛋白质三维模型置入N*N*N大小的体素占据网格;/n对所述体素占据网格投射N*N条射线,每条射线通过N个体素的中心;/n基于射线与蛋白质三维模型的相交情况构建占据模型;/n将所述占据模型通过三维卷积神经网络实现对蛋白质的分类。/n

【技术特征摘要】
1.蛋白质分类方法,其特征在于,包括如下步骤:
将蛋白质三维模型置入N*N*N大小的体素占据网格;
对所述体素占据网格投射N*N条射线,每条射线通过N个体素的中心;
基于射线与蛋白质三维模型的相交情况构建占据模型;
将所述占据模型通过三维卷积神经网络实现对蛋白质的分类。


2.根据权利要求1所述的蛋白质分类方法,其特征在于,基于射线与蛋白质三维模型的相交情况构建占据模型,具体包括:
确定穿过体素中心的射线命中蛋白质三维模型的情况;
基于命中情况构建占据模型。


3.根据权利要求2所述的蛋白质分类方法,其特征在于,在确定穿过体素中心的射线命中蛋白质三维模型的情况中,包括对命中概率估算的步骤:
使用将射线所经过的每个体素进行更新;
其中,locc和lfree分别表示在命中和未命中体素的情况下,体素被占用或空闲的对数概率;为测量序列,zt=1表示命中体素,zt=0表示未命中体素。


4.根据权利要求2所述的蛋白质分类方法,其特征在于,构建占据模型,具体包括:
将蛋...

【专利技术属性】
技术研发人员:魏志强聂婕聂为之刘安安苏育挺
申请(专利权)人:青岛海洋科学与技术国家实验室发展中心
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1