【技术实现步骤摘要】
蛋白质分类方法
本专利技术属于蛋白质数据分类
,具体地说,是涉及一种蛋白质分类方法。
技术介绍
结构生物学的目标,包括全面理解分子的形状和由生物大分子支撑的形式,并扩展这方面的内容,以理解如何使用不同的分子结构来呈现大多数生物过程。在这些大分子中,蛋白质是参与大多数过程的关键效应器,具有动态复杂的表面;它们可以由成千上万个原子组成,在原子尺度上由于局部(残基侧链)或全局(环或域)结构变化而表现出多种不同的构象,这些结构变化极大地影响它们的全局和局部形状。由于蛋白质的结构与它们的功能有关,而它们之间相互作用的中断可能导致疾病状态,因此对它们的形状进行表征非常重要,有助于识别潜在的粘合剂,如其他蛋白质、药物或核酸等。蛋白质分类是生物信息学中的关键问题之一,许多无监督方法被应用于蛋白质分类问题中,其中的代表性方法包括自然矢量方法、蛋白质地图、K-string字典、Yau-Hausdorff距离等。随着机器学习的快速发展,将机器学习方法应用于蛋白质分类也取得了很大进展。Khan等采用蚁群优化方法,结合关联规则挖 ...
【技术保护点】
1.蛋白质分类方法,其特征在于,包括如下步骤:/n将蛋白质三维模型置入N*N*N大小的体素占据网格;/n对所述体素占据网格投射N*N条射线,每条射线通过N个体素的中心;/n基于射线与蛋白质三维模型的相交情况构建占据模型;/n将所述占据模型通过三维卷积神经网络实现对蛋白质的分类。/n
【技术特征摘要】
1.蛋白质分类方法,其特征在于,包括如下步骤:
将蛋白质三维模型置入N*N*N大小的体素占据网格;
对所述体素占据网格投射N*N条射线,每条射线通过N个体素的中心;
基于射线与蛋白质三维模型的相交情况构建占据模型;
将所述占据模型通过三维卷积神经网络实现对蛋白质的分类。
2.根据权利要求1所述的蛋白质分类方法,其特征在于,基于射线与蛋白质三维模型的相交情况构建占据模型,具体包括:
确定穿过体素中心的射线命中蛋白质三维模型的情况;
基于命中情况构建占据模型。
3.根据权利要求2所述的蛋白质分类方法,其特征在于,在确定穿过体素中心的射线命中蛋白质三维模型的情况中,包括对命中概率估算的步骤:
使用将射线所经过的每个体素进行更新;
其中,locc和lfree分别表示在命中和未命中体素的情况下,体素被占用或空闲的对数概率;为测量序列,zt=1表示命中体素,zt=0表示未命中体素。
4.根据权利要求2所述的蛋白质分类方法,其特征在于,构建占据模型,具体包括:
将蛋...
【专利技术属性】
技术研发人员:魏志强,聂婕,聂为之,刘安安,苏育挺,
申请(专利权)人:青岛海洋科学与技术国家实验室发展中心,
类型:发明
国别省市:山东;37
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。