抗体互补决定区构象指纹数据库制造技术

技术编号:16779793 阅读:23 留言:0更新日期:2017-12-13 00:01
本发明专利技术涉及抗体互补决定区构象指纹数据库,属于生物信息学领域。对于每个抗体蛋白,包括名称,氨基酸序列,互补决定区片段范围,全信息构象指纹共四组数据,所述的氨基酸序列和互补决定区片段范围,从蛋白知识数据库获得,所述的全信息构象指纹,分两种情况处理:对于已知三维结构的抗体蛋白,从蛋白数据库里获得全部结构数据,并用蛋白折叠形状码表示;对于未知结构的抗体蛋白,对抗体互补决定区的三维空间构象进行预测得到构象谱带。本发明专利技术不仅包含了抗体蛋白序列的一级结构和有规则的二级结构,而且扩展涵盖了无规则的三级结构。可以采用构象指纹的相似性分数标记抗体互补决定区构象特征,为抗体互补决定区的分类提供新的参数。

Antibody complementary decision region conformation fingerprint database

The invention relates to the antibody complementary determination region conformation fingerprint database, which belongs to the field of bioinformatics. For each protein, including the name, amino acid sequence complementarity determining region fragment, full information conformational fingerprinting of a total of four sets of data, and the amino acid sequence of the complementarity determining region fragment, obtained from protein database, fingerprint the full information structure can be divided into two types: the antibody protein of known three-dimensional structure and get all data from the database of protein structure, protein folding and shape code; for antibody protein of unknown structure, the three-dimensional conformation determining region antibody complementary predicted conformation bands. The invention not only contains the first - order structure of the antibody protein sequence and the regular two - stage structure, but also extends the irregular three - stage structure. The conformation of conformational fingerprints can be used to mark the conformation characteristics of the complementary determinant region of the antibody and provide new parameters for the classification of antibody complementary determinant areas.

【技术实现步骤摘要】
抗体互补决定区构象指纹数据库
本专利技术涉及抗体互补决定区构象指纹数据库,属于生物信息学领域。
技术介绍
抗体又称免疫球蛋白,是免疫系统用来识别并且抵抗外来入侵的细菌或者病毒等的大型Y形蛋白质。抗体可以按照物理化学,生物功能或者来源分类。单克隆抗体的发展经历了四个阶段,分别为:鼠源性单克隆抗体、嵌合性单克隆抗体、人源化单克隆抗体和全人源单克隆抗体。抗体是具有4条多肽链的对称结构,其中2条较长的重链(H链);2条较短的轻链(L链)。整个抗体分子可分为恒定区和可变区两部分。可变区位于"Y"的两臂末端。在可变区内有一小部分氨基酸残基变化特别强烈,这些氨基酸的残基组成和排列顺序更易发生变异区域称高变区。高变区位于分子表面,该部位因在空间结构上可与抗原决定簇形成精密的互补,故高变区又称互补决定区。高变区氨基酸序列和构象决定了抗体对抗原的特异性识别和结合作用。抗体的主要功能是通过抗体互补决定区识别抗原与抗原相结合,从而有效地清除侵入机体内的微生物、寄生虫等异物,因此,抗体互补决定区的研究对抗体研究至关重要。迄今未知,全球蛋白知识数据库(UniProt)中有大约550种抗体蛋白的三维结构被测定,另外有2万5千抗体蛋白仅仅知道一级序列。基于专利技术人开发的蛋白质结构指纹技术(ProteinStructureFingerprint,PSFT),采用蛋白结构指纹方法表征已知结构的抗体蛋白,同时预测未知结构的抗体蛋白。然后,在此基础上,建立抗体互补决定区指纹数据库。
技术实现思路
本专利技术所要解决的技术问题是提供一种抗体互补决定区构象指纹数据库。本专利技术的抗体互补决定区构象指纹数据库,对于每个抗体蛋白,包括名称,氨基酸序列,互补决定区片段范围,全信息构象指纹共四组数据,所述的氨基酸序列和互补决定区片段范围,从蛋白知识数据库(UniProt)获得,所述的全信息构象指纹,分两种情况处理:对于已知三维结构的抗体蛋白,从蛋白数据库里获得全部结构数据,并用蛋白折叠形状码表示,再将抗体互补决定区的折叠形状码提取出来,作为该抗体互补决定区的全信息构象指纹;对于未知结构的抗体蛋白,该抗体互补决定区的全信息构象指纹是对抗体互补决定区的三维空间构象进行预测得到的构象谱带。从数学角度来看氨基酸,通过不同的排序,5个氨基酸可以形成不同的排列。从全部20个氨基酸中任意地提取5个氨基酸将可以形成总数为3,200,000的不同排列。每一个排列的可能折叠构象可以从全球蛋白质数据库(PDB)获得,然后用蛋白折叠形状码(PFSC)表示。在此基础上,我们创建了一个数据库来收集上述三百二十万个排列的折叠构象。该全新的数据库被命名为5AAPFSC。本专利技术的数据库中,对于未知结构的抗体互补决定区预测得到的构象谱带,通过如下过程获得:1)从全部20个氨基酸中任意地提取5个氨基酸,形成总数为3,200,000的不同排列,每一个排列的可能折叠构象从全球蛋白质数据库(PDB)获得,然后用蛋白折叠形状码表示;创建了一个数据库来收集上述排列及其对应的蛋白折叠形状码,该数据库被命名为5AAPFSC;2)对于抗体互补决定区的蛋白质,沿着氨基酸序列,从N-端开始,逐步移动向C-端,依次读取每5个连续的氨基酸,其可能具有的折叠构象从5AAPFSC数据库直接获得,用蛋白折叠形状码的字符表示;在蛋白质数据库(PDB)中出现频率最高的折叠构象对应的蛋白折叠形状码排在第一位,出现频率第二高的折叠形状码排在第二位,从上到下依次形成一列,直至收集完全为止,每5个连续的氨基酸具有不同数目的折叠构象可能;3)抗原互补决定区的全部可能的折叠形状码形成一个阵列,称为蛋白折叠构象谱带,代表了互补决定区全部可能的折叠构象;对于每一个位点,通过其全部可能的折叠形状码的相互替代,可以准确地得到所有可能的构象;可能构象的总数目是全部每5个氨基酸可能折叠构象数目的连续乘积。对于任何一个抗体互补决定区,尽管全部可能的空间构象的数目是巨大的,但可能性高的空间构象通过出现频率高的局域折叠构象组合获得。举例来说,可能性高的第一个空间构象是由每个位点出现频率最高的折叠构形状码共同构成;第二个空间构象是由每个位点出现频率第二高的折叠形状码构成,在没有第二高频率构象的位置,以频率最高的的折叠形状码作为补充构成;第三个空间构象是由每个位点出现频率第三高的折叠形状码组成,在没有第三高频率构象的位置,以频率最高的的折叠形状码作为补充构成;如此类推,形成可能性较高的一系列可能的预测构象。专利技术的表征已知结构的抗体蛋白的互补决定区,以及预测未知结构抗体互补区的构象谱带,都使用了专利技术人之前专利ZL200880003164.2公开的蛋白质折叠形状码(ProteinFoldingShapeCode,PFSC)。通过严格推导得到的蛋白质折叠形状码(PFSC)能够完好地描述连续的5个氨基酸片段的折叠形状。5个氨基酸片段在蛋白质中的任意折叠形状可以通过27PFSC向量来描述,全部27PFSC向量采用了26个英文字母加上$符号来表达。更重要的是,全部27个PFSC向量涵盖了一个完整的数学空间。而且,全部27个PFSC向量的折叠形状是高度密切相关联的。每个PFSC向量都可以从一个向量过渡转换为另一个向量。本专利技术的抗体互补决定区构象指纹数据库可以收集在各种结构测定中得到的全部数据,包含无法标记的结构数据。并且只需要读取主链碳原子的坐标(不需要知道其它原子坐标)就能够确定抗体互补决定区构象指纹。由于不受到测定结构的解析度限制,可以收集包含更多的抗体互补决定区结构。对测定得到的三维空间结构抗体互补决定区,不仅包含实验测定的高解析度结构,而且可以囊括了实验测定的低解析度结构数据。对未知三维空间结构的抗体互补决定区,本专利技术不是仅仅提供单个预测结构,而是提供了蛋白构象指纹全信息预测。可以全面揭示构象的可能变化情况。本专利技术的抗体互补决定区构象指纹数据库不仅包含了抗体蛋白序列的一级结构和有规则的二级结构,而且扩展涵盖了无规则的三级结构。可以采用构象指纹的相似性分数标记抗体互补决定区构象特征,为抗体互补决定区的分类提供新的参数。本专利技术的抗体互补决定区构象指纹数据库,包含超过500个已知抗体蛋白结构,和超过2.5万个未知结构抗体蛋白的预测构象。附图说明图1,未知结构抗体的互补决定区的氨基酸序列和预测的指纹构象。具体实施方式本专利技术的抗体互补决定区构象指纹数据库,对于每个抗体蛋白,包括名称,氨基酸序列,可变区片段范围,全信息构象指纹共四组数据,所述的氨基酸序列和可变区片段范围,从蛋白知识数据库(UniProt)获得,所述的全信息构象指纹,获得方法如下:从全球蛋白知识数据库(UniProt)中收集全部抗体蛋白结构信息。对已知三维结构的抗体蛋白和未知结构的抗体蛋白分别处理。针对已知结构的大约550种抗体蛋白,每一个蛋白可能有多个已知结构在在蛋白数据库(PDB),从PDB获得全部结构数据。将每一个蛋白结构,通过蛋白质折叠形状码(ProteinFoldingShapeCode,PFSC)转为指纹数据。将抗体互补决定区的指纹提取出来,作为该抗体互补决定区的全信息构象指纹。针对未知结构的大约2万5千种抗体蛋白,直接在蛋白知识数据库(UniProt)获得全部氨基酸序列。通过蛋白质空间构象的全信息预本文档来自技高网...
抗体互补决定区构象指纹数据库

【技术保护点】
一种抗体互补决定区构象指纹数据库,对于每个抗体蛋白,包括名称,氨基酸序列,互补决定区片段范围,全信息构象指纹共四组数据,所述的氨基酸序列和互补决定区片段范围,从蛋白知识数据库获得,所述的全信息构象指纹,分两种情况处理:对于已知三维结构的抗体蛋白,从蛋白数据库里获得全部结构数据,并用蛋白折叠形状码表示,再将抗体互补决定区的折叠形状码提取出来,作为该抗体互补决定区的全信息构象指纹;对于未知结构的抗体蛋白,该抗体互补决定区的全信息构象指纹是对抗体互补决定区的三维空间构象进行预测得到的构象谱带;对于未知结构的抗体互补决定区预测得到的构象谱带,通过如下过程获得:1)从全部20个氨基酸中任意地提取5个氨基酸,形成总数为3,200,000的不同排列,每一个排列的可能折叠构象从全球蛋白质数据库获得,然后用蛋白折叠形状码表示;创建了一个数据库来收集上述排列及其对应的蛋白折叠形状码,该数据库被命名为5AAPFSC;2)对于抗体互补决定区的蛋白质,沿着氨基酸序列,从N‑端开始,逐步移动向C‑端,依次读取每5个连续的氨基酸,其可能具有的折叠构象从5AAPFSC数据库直接获得,用蛋白折叠形状码的字符表示;在蛋白质数据库中出现频率最高的折叠构象对应的蛋白折叠形状码排在第一位,出现频率第二高的折叠形状码排在第二位,从上到下依次形成一列,直至收集完全为止,每5个连续的氨基酸具有不同数目的折叠构象可能;3)抗原互补决定区的全部可能的折叠形状码形成一个阵列,称为蛋白折叠构象谱带,代表了互补决定区全部可能的折叠构象;对于每一个位点,通过其全部可能的折叠形状码的相互替代,可以准确地得到所有可能的构象;可能构象的总数目是全部每5个氨基酸可能折叠构象数目的连续乘积。...

【技术特征摘要】
1.一种抗体互补决定区构象指纹数据库,对于每个抗体蛋白,包括名称,氨基酸序列,互补决定区片段范围,全信息构象指纹共四组数据,所述的氨基酸序列和互补决定区片段范围,从蛋白知识数据库获得,所述的全信息构象指纹,分两种情况处理:对于已知三维结构的抗体蛋白,从蛋白数据库里获得全部结构数据,并用蛋白折叠形状码表示,再将抗体互补决定区的折叠形状码提取出来,作为该抗体互补决定区的全信息构象指纹;对于未知结构的抗体蛋白,该抗体互补决定区的全信息构象指纹是对抗体互补决定区的三维空间构象进行预测得到的构象谱带;对于未知结构的抗体互补决定区预测得到的构象谱带,通过如下过程获得:1)从全部20个氨基酸中任意地提取5个氨基酸,形成总数为3,200,000的不同排列,每一个排列的可能折叠构象从全球蛋白质数据库获得,然后用蛋白折叠形状码表示;创建了一个数据库来收集上述排列及其对应的蛋白折叠形状码,该数据库被命名为5AAPFSC;2)对于抗体互补决定区的蛋白质,沿着氨基酸序列,从N-端开始,逐步移动向C-端,依次读取每5个连续的氨基酸,其可能具有的折叠构象从5AAPFSC数据库直接获得,用蛋白折叠形状码的字符表示;在蛋白质数据库中出现频率最高的折叠构象对应的蛋白折叠形状码排在第一位,出现频率第二高的折叠形状码排在第二位,从上到下依次形成一列,直至收集完全为止,每5个连续的氨基酸具有不同数目的折叠构象可能;3)抗原互补决定区的全部可能的折叠形状码形成一个阵列,称为蛋白折叠构象谱带,代表了互补决定区全部可能的折叠构象;对于每一个位点,通过其全部可能的折叠形状码的相互替代,可以准确地得到所有可能的构象;可能构象的总数目是全部每5个氨基酸可能折叠构象数目的连续乘积。2.根据权利要求1所述的抗体互补决定区构象指纹数据库,其特...

【专利技术属性】
技术研发人员:杨家安
申请(专利权)人:南京迈格罗医药科技有限公司
类型:发明
国别省市:江苏,32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1