当前位置: 首页 > 专利查询>之江实验室专利>正文

基于蛋白质三维结构图像鉴定蛋白质结构域的方法及系统技术方案

技术编号:35540324 阅读:30 留言:0更新日期:2022-11-09 15:08
本发明专利技术公开了一种基于蛋白质三维结构图像鉴定蛋白质结构域的方法及系统,本发明专利技术基于结构相似性鉴定蛋白质结构域,能够有效解决当序列一致性不高时,蛋白质多序列比对错误导致的蛋白质结构域识别错漏;本发明专利技术构建基于动态图卷积神经网络的点云分割模型,可通过整合全局结构特征与局部结构特征,同时完成蛋白质结构域的分割和蛋白质结构域语义标签的获取。构域的分割和蛋白质结构域语义标签的获取。构域的分割和蛋白质结构域语义标签的获取。

【技术实现步骤摘要】
基于蛋白质三维结构图像鉴定蛋白质结构域的方法及系统


[0001]本专利技术属于医疗信息
,尤其涉及一种基于蛋白质三维结构图像鉴定蛋白质结构域的方法及系统。

技术介绍

[0002]国际药物研究的竞争主要集中在药物靶点的研究,对药物开发和重利用具有极其重要的作用,是一项非常艰巨的任务。一旦靶点具有成药性,将有一系列的候选药物进入临床筛选阶段,对相关疾病领域的治疗将有重大的影响。人体中约含有超过10万种蛋白质,其中潜在的药物靶点蛋白预计8000个左右,目前仅有约500种蛋白类药物靶点被发现。科学界普遍认为药物与靶点的相互作用是由药物与蛋白质结构域的相互作用介导的。因为蛋白质具有模块化结构,而且同一类结构域可以在不同的蛋白质中重复发现,所以一种药物可结合多个蛋白质靶点,其原因可能与药物靶向具有同一类结构域的蛋白质有关,也可能是大多数药物的多重药理作用的一个重要因素。因此准确鉴定蛋白质的结构域就显得尤为关键,对于理解药物的作用机制以及设计能够与这些治疗靶点结合的新药非常重要。目前已经发展了许多从蛋白质的氨基酸序列来确定蛋白质结构域的方法。这些方法大本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种基于蛋白质三维结构图像鉴定蛋白质结构域的方法,其特征在于,包括以下步骤:S1,数据采集及预处理,包括:获取蛋白质信息、蛋白质结构域注释信息、蛋白质三维实验结构、蛋白质三维计算结构、蛋白质二级结构注释信息;S2,生成训练集合,包括:从蛋白质三维实验结构中提取主链碳、氮、氧原子的三维坐标构建三维原子点云,经标准化预处理后,对每个原子点都赋予所属蛋白质结构域的语义标签,形成蛋白质三维结构图像作为训练集合;S3,生成目标集合,包括:从蛋白质三维计算结构中提取主链碳、氮、氧原子的三维坐标构建三维原子点云,经标准化预处理后,形成蛋白质三维结构图像作为目标集合;S4,构建点云分割模型,包括:蛋白质三维结构图像中的原子点根据K近邻分类算法构建局部有向图;根据局部有向图构建基于动态图卷积神经网络的点云分割模型;所述点云分割模型包括局部特征提取层、全局特征提取层和分割层;将蛋白质三维结构图像提取特征后输入点云分割模型,经局部特征提取层提取局部特征,经全局特征提取层提取全局特征,经分割层整合局部特征和全局特征,输出每个原子点的蛋白质结构域类别标签的分数;S5,模型训练:将训练集合中的蛋白质三维结构图像提取特征后训练点云分割模型;S6,模型预测:使用训练后的点云分割模型,对提取特征后的目标集合进行蛋白质结构域鉴定。2.根据权利要求1所述的基于蛋白质三维结构图像鉴定蛋白质结构域的方法,其特征在于,S1具体为:从蛋白质数据库中提取各物种蛋白质信息;从蛋白质家族与结构域数据库中提取各物种蛋白质结构域注释信息;从蛋白质三维实验结构数据库中提取蛋白质三维实验结构;利用蛋白质三维结构预测工具预测蛋白质三维计算结构,或者从蛋白质三维计算结构数据库中提取蛋白质三维计算结构;利用蛋白质二级结构注释工具注释从蛋白质数据库中提取蛋白质的二级结构。3.根据权利要求1所述的基于蛋白质三维结构图像鉴定蛋白质结构域的方法,其特征在于,S2中,根据蛋白质三维实验结构的链注释信息,去除蛋白质三维实验结构中的其他链或溶剂,提取剩余蛋白质三维实验结构中主链碳、氮、氧原子的三维坐标,构建三维原子点云。4.根据权利要求1所述的基于蛋白质三维结构图像鉴定蛋白质结构域的方法,其特征在于,三维原子点云的标准化预处理具体为:首先将所有原子点转移到以几何中心为原点的局部坐标系中,然后将这些原子点归一化到单位球体中。5.根据权利要求1所述的基于蛋白质三维结构图像鉴定蛋白质结构域的方法,其特征在于,蛋白质三维结构图像的原子点的点云特征包括:原子点标准化预处理后的三维坐标、原子点所属氨基酸在蛋白质中的相对顺序、原子类型、原子点所属氨基酸的二级结构注释信息、原子点与其前后相邻原子点形成的角度;所述原子类型包括α碳、其它碳、氧和氮;所述二级结构注释信息包括α螺旋、β折叠、无规卷曲;将所述相对顺序以及所述角度均进行归
一化处理。6.根据权利要求1所述的基于蛋白质三维结构图像鉴定蛋白质结构域的方法,其特征在于,所述点云分割模型中,所述局部特征提取层由多个连边卷积层依次连接,每个连边卷积层都输入每个原子点的局部有向图特征,经过连边卷积运算后输出每个原子点的局部特征;所述全局特征提取层整合局部特征提取层中所有连边卷积层输出的原子点局部特征作为多层感知机的输入,输出原子点云的局部特征集,再经过池化层的全局池化运算后输出全局特征;所述...

【专利技术属性】
技术研发人员:李劲松马静王昱
申请(专利权)人:之江实验室
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1