The invention relates to the antibody complementary determination region conformation fingerprint database, which belongs to the field of bioinformatics. For each protein, including the name, amino acid sequence complementarity determining region fragment, full information conformational fingerprinting of a total of four sets of data, and the amino acid sequence of the complementarity determining region fragment, obtained from protein database, fingerprint the full information structure can be divided into two types: the antibody protein of known three-dimensional structure and get all data from the database of protein structure, protein folding and shape code; for antibody protein of unknown structure, the three-dimensional conformation determining region antibody complementary predicted conformation bands. The invention not only contains the first - order structure of the antibody protein sequence and the regular two - stage structure, but also extends the irregular three - stage structure. The conformation of conformational fingerprints can be used to mark the conformation characteristics of the complementary determinant region of the antibody and provide new parameters for the classification of antibody complementary determinant areas.
【技术实现步骤摘要】
抗体互补决定区构象指纹数据库
本专利技术涉及抗体互补决定区构象指纹数据库,属于生物信息学领域。
技术介绍
抗体又称免疫球蛋白,是免疫系统用来识别并且抵抗外来入侵的细菌或者病毒等的大型Y形蛋白质。抗体可以按照物理化学,生物功能或者来源分类。单克隆抗体的发展经历了四个阶段,分别为:鼠源性单克隆抗体、嵌合性单克隆抗体、人源化单克隆抗体和全人源单克隆抗体。抗体是具有4条多肽链的对称结构,其中2条较长的重链(H链);2条较短的轻链(L链)。整个抗体分子可分为恒定区和可变区两部分。可变区位于"Y"的两臂末端。在可变区内有一小部分氨基酸残基变化特别强烈,这些氨基酸的残基组成和排列顺序更易发生变异区域称高变区。高变区位于分子表面,该部位因在空间结构上可与抗原决定簇形成精密的互补,故高变区又称互补决定区。高变区氨基酸序列和构象决定了抗体对抗原的特异性识别和结合作用。抗体的主要功能是通过抗体互补决定区识别抗原与抗原相结合,从而有效地清除侵入机体内的微生物、寄生虫等异物,因此,抗体互补决定区的研究对抗体研究至关重要。迄今未知,全球蛋白知识数据库(UniProt)中有大约550种抗体蛋白的三维结构被测定,另外有2万5千抗体蛋白仅仅知道一级序列。基于专利技术人开发的蛋白质结构指纹技术(ProteinStructureFingerprint,PSFT),采用蛋白结构指纹方法表征已知结构的抗体蛋白,同时预测未知结构的抗体蛋白。然后,在此基础上,建立抗体互补决定区指纹数据库。
技术实现思路
本专利技术所要解决的技术问题是提供一种抗体互补决定区构象指纹数据库。本专利技术的抗体互补决定区构象指纹 ...
【技术保护点】
一种抗体互补决定区构象指纹数据库,对于每个抗体蛋白,包括名称,氨基酸序列,互补决定区片段范围,全信息构象指纹共四组数据,所述的氨基酸序列和互补决定区片段范围,从蛋白知识数据库获得,所述的全信息构象指纹,分两种情况处理:对于已知三维结构的抗体蛋白,从蛋白数据库里获得全部结构数据,并用蛋白折叠形状码表示,再将抗体互补决定区的折叠形状码提取出来,作为该抗体互补决定区的全信息构象指纹;对于未知结构的抗体蛋白,该抗体互补决定区的全信息构象指纹是对抗体互补决定区的三维空间构象进行预测得到的构象谱带;对于未知结构的抗体互补决定区预测得到的构象谱带,通过如下过程获得:1)从全部20个氨基酸中任意地提取5个氨基酸,形成总数为3,200,000的不同排列,每一个排列的可能折叠构象从全球蛋白质数据库获得,然后用蛋白折叠形状码表示;创建了一个数据库来收集上述排列及其对应的蛋白折叠形状码,该数据库被命名为5AAPFSC;2)对于抗体互补决定区的蛋白质,沿着氨基酸序列,从N‑端开始,逐步移动向C‑端,依次读取每5个连续的氨基酸,其可能具有的折叠构象从5AAPFSC数据库直接获得,用蛋白折叠形状码的字符表示;在蛋白 ...
【技术特征摘要】
1.一种抗体互补决定区构象指纹数据库,对于每个抗体蛋白,包括名称,氨基酸序列,互补决定区片段范围,全信息构象指纹共四组数据,所述的氨基酸序列和互补决定区片段范围,从蛋白知识数据库获得,所述的全信息构象指纹,分两种情况处理:对于已知三维结构的抗体蛋白,从蛋白数据库里获得全部结构数据,并用蛋白折叠形状码表示,再将抗体互补决定区的折叠形状码提取出来,作为该抗体互补决定区的全信息构象指纹;对于未知结构的抗体蛋白,该抗体互补决定区的全信息构象指纹是对抗体互补决定区的三维空间构象进行预测得到的构象谱带;对于未知结构的抗体互补决定区预测得到的构象谱带,通过如下过程获得:1)从全部20个氨基酸中任意地提取5个氨基酸,形成总数为3,200,000的不同排列,每一个排列的可能折叠构象从全球蛋白质数据库获得,然后用蛋白折叠形状码表示;创建了一个数据库来收集上述排列及其对应的蛋白折叠形状码,该数据库被命名为5AAPFSC;2)对于抗体互补决定区的蛋白质,沿着氨基酸序列,从N-端开始,逐步移动向C-端,依次读取每5个连续的氨基酸,其可能具有的折叠构象从5AAPFSC数据库直接获得,用蛋白折叠形状码的字符表示;在蛋白质数据库中出现频率最高的折叠构象对应的蛋白折叠形状码排在第一位,出现频率第二高的折叠形状码排在第二位,从上到下依次形成一列,直至收集完全为止,每5个连续的氨基酸具有不同数目的折叠构象可能;3)抗原互补决定区的全部可能的折叠形状码形成一个阵列,称为蛋白折叠构象谱带,代表了互补决定区全部可能的折叠构象;对于每一个位点,通过其全部可能的折叠形状码的相互替代,可以准确地得到所有可能的构象;可能构象的总数目是全部每5个氨基酸可能折叠构象数目的连续乘积。2.根据权利要求1所述的抗体互补决定区构象指纹数据库,其特...
【专利技术属性】
技术研发人员:杨家安,
申请(专利权)人:南京迈格罗医药科技有限公司,
类型:发明
国别省市:江苏,32
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。