具有标注活性功能的胶原寡肽数据库的建立方法技术

技术编号:38405712 阅读:11 留言:0更新日期:2023-08-07 11:15
本发明专利技术属于数据库技术领域,具体涉及一种具有标注活性功能的胶原寡肽数据库的建立方法。本专利通过检索,调研相关文献,从文献中收集自动物胶原胶原的功能寡肽序列,构建了一个胶原寡肽数据库,该包含了胶原寡肽的氨基酸序列、结构和功能,及寡肽与人和动物胶原蛋白匹配图谱等综合性信息。该数据库可以为相关领域的研究人员提供有价值的研究资源,有助于深入了解胶原寡肽的结构和生物学功能,未来有望为该胶原蛋白领域的研究提供更加全面和精准的数据支持。数据支持。数据支持。

【技术实现步骤摘要】
具有标注活性功能的胶原寡肽数据库的建立方法


[0001]本专利技术属于数据库
,具体涉及一种具有标注活性功能的胶原寡肽数据库的建立方法。

技术介绍

[0002]胶原蛋白是动物体内最重要的细胞外基制蛋白的组成成分,参与组织和器官的结构形成和提供机械保护。它作为一种天然材料,已在组织工程和药物传递系统等不同的生物医学领域得到应用。2018年,全球胶原蛋白市场规模估计为约42.7亿美元(www.grandviewresearch.com/industry

analysis/collagen

market)。胶原蛋白在牙科手术、组织工程、骨移植以及食品和制药工业中的被广泛应用,越来越多的使用场景仍在不断地被发现,所以全球胶原蛋白市场规模发展很快,并预计到2025年达到约66.3亿美元。
[0003]动物来源胶原蛋白也被用于明胶的制造,主要的产品形式有胶凝、乳化剂、增稠剂、稳定剂和胶体等。动物胶原蛋白及其衍生的明胶产品以被广泛应用与食品、制革、化妆品和制药等领域。
[0004]越来越多的研究表明,胶原蛋白作为一种重要的生物大分子,在生物医学和生物材料等领域具有广泛的应用前景。而胶原蛋白的水解产物

胶原寡肽则因其小分子量、易吸收、易代谢等优良特性,成为了当前研究热点。近年来,科学家们发现了许多来自动物胶原蛋白可以衍生出具有不同生物活性的功能寡肽。目前已经有很多研究表明,功能性胶原寡肽可以促进人体细胞的胶原蛋白的合成和人体组织修复,如减缓皮肤老化和皱纹的形成,改善关节疼痛和运动损伤,促进细胞增殖和分化、抗氧化、抗菌、抗炎、降血压、降血糖等。因此,这些胶原寡肽在医药、保健品、化妆品等领域具有广泛的应用前景。这些功能性胶原寡肽可通过胶原蛋白水解酶等酶类的水解产生,或通过化学或物理方法的处理获得。由于其分子量较小,易于人体吸收和利用,因此功能性胶原寡肽在保健品和医药领域中具有广泛的应用前景。
[0005]但目前针对胶原寡肽的研究较为分散且功能机理不明晰,因此限制了其在医药和保健品等领域的进一步应用。目前的研究主要是针对单一物种来源的短肽直接进行功能水平的实验验证,但并未对其分子水平的生物学功能机理进行系统而深入的研究。同时,尽管功能性胶原寡肽具有多种生物活性,针对单一的生物学功能研究仍然是分散的和碎片化的,目前也尚未出现针对功能性胶原寡肽多种信息如来源信息,序列信息,结构信息及功能信息的综合性整合数据库。

技术实现思路

[0006]本专利通过检索,调研相关文献,从文献中收集了441条自动物胶原胶原的功能寡肽序列,提供具有标注活性功能的胶原寡肽数据库的建立方法,该数据库包含了胶原寡肽的氨基酸序列、结构和功能,及寡肽与人和动物胶原蛋白匹配图谱等综合性信息。该数据库可以为相关领域的研究人员提供有价值的研究资源,有助于深入了解胶原寡肽的结构和生
物学功能,未来有望为该胶原蛋白领域的研究提供更加全面和精准的数据支持。
[0007]一种具有标注活性功能的胶原寡肽数据库的建立方法,包括建立基础资源层、建立数据库层、建立数据层以及建立应用层;
[0008]所述建立基础资源层为收集胶原寡肽序列,并记录其索引信息;收集不同来源的动物胶原蛋白全长序列,并记录其索引信息;
[0009]所述建立数据库层为将收集到的胶原寡肽序列库汇总成fasta文件,将胶原蛋白全长序列根据来源分为人源胶原蛋白序列库和非人源胶原蛋白序列库;
[0010]所述建立数据层为将收集到的胶原寡肽序列汇总至数据交换格式文件中,对每条寡肽序列标注索引信息;将每条胶原寡肽序列与人源胶原蛋白序列库和非人源胶原蛋白序列库进行匹配;并将匹配的结果记录在数据交换格式文件中,保存在本地数据库服务器中;
[0011]所述建立应用层为:针对数据层提供的数据交换格式文件,建立对应的交互渠道。
[0012]特别地,所述建立基础资源层中,动物胶原蛋白全长序列的来源为NBCI;
[0013]特别地,所述建立基础资源层还包括:
[0014]收集动物的胶原蛋白基因的id信息,然后转录成对应的胶原蛋白转录本蛋白氨基酸序列,然后对胶原蛋白转录本蛋白氨基酸序列进行去冗余,得到动物胶原蛋白全长序列。
[0015]所述的索引信息包括序列信息、物种来源信息、生物活性功能、文献标题和文献doi。
[0016]特别地,所述建立数据层还包括:利用蛋白结构预测工具对胶原寡肽序列库中的每条多肽进行结构预测,并将预测的每条序列的前5个结构模型的文件保存至结构数据库内。
[0017]特别地,所述建立数据层还包括:对数据交换格式文件中能同时匹配到人源胶原蛋白和非人源胶原蛋白的寡肽,绘制关联图谱。
[0018]在胶原寡肽的研究中,缺乏一个全面、系统的序列数据库一直以来是制约研究的重要因素。
[0019]本专利技术建立的胶原寡肽数据库是专门针对水解胶原蛋白开发的序列数据库,具有较高的创新性和实用性。它收集了大量不同来源的胶原蛋白水解产物的序列信息,并将其整合成一个完整的、易于查询和使用的数据库,其涵盖的数据源广泛,包括多个物种、多种胶原蛋白来源、多种酶解条件下的产物等。同时,这个数据库还提供了多种搜索和查询工具,方便用户根据不同的研究需求和特定条件快速检索和筛选相关信息。本数据库作为一个方便、可靠的资源,可以帮助研究人员更好地了解胶原寡肽的结构和功能,以及胶原寡肽的功能与来源。并为胶原蛋白的研究和应用提供了重要的信息和工具,加速胶原寡肽在多个领域如食品、化妆品、医药保健品、生物材料等领域的产品开发。
[0020]由于这个寡肽序列数据集覆盖了大量不同来源和条件下产生的寡肽及其功能,因此可以作为一个全面而且具有代表性的数据集来训练或评估机器学习模型的性能和表现。并辅助研究人员迅速找到靶标开发新型稳定的多肽原料,不断扩大和拓展胶原寡肽的应用领域和应用范围。
附图说明
[0021]下面结合附图和实施例对本专利技术进一步说明。
[0022]图1为功能胶原寡肽数据库整体架构。
[0023]图2为胶原蛋白序列收集流程。
[0024]图3为胶原蛋白序列基因信息表部分展示。
[0025]图4为COL_pep.json部分展示。
[0026]图5为低免疫原性胶原寡肽(seq84:KGEIGLPGPPG)与人源胶原蛋白序列(红色节点),非人源胶原蛋白序列(非红色节点)关联图谱示意图。
具体实施方式
[0027]下面结合具体实施例,对本专利技术作进一步详细的阐述,下述实施例不用于限制本专利技术,仅用于说明本专利技术。以下实施例中所使用的实验方法如无特殊说明,实施例中未注明具体条件的实验方法,通常按照常规条件,下述实施例中所使用的材料、试剂等,如无特殊说明,均可从商业途径得到。
[0028]在具体实施例中,没有详细说明的步骤、材料选择、数值参数均为现有技术中的常规选择,或者任何现有公开的现有技术。
[0029]图1展示了整个本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.具有标注活性功能的胶原寡肽数据库的建立方法,其特征在于,包括建立基础资源层、建立数据库层、建立数据层以及建立应用层;所述建立基础资源层为收集胶原寡肽序列,并记录其索引信息;收集不同来源的动物胶原蛋白全长序列,并记录其索引信息;所述建立数据库层为将收集到的胶原寡肽序列库汇总成fasta文件,将胶原蛋白全长序列根据来源分为人源胶原蛋白序列库和非人源胶原蛋白序列库;所述建立数据层为将收集到的胶原寡肽序列汇总至数据交换格式文件中,对每条寡肽序列标注索引信息;将每条胶原寡肽序列与人源胶原蛋白序列库和非人源胶原蛋白序列库进行匹配;并将匹配的结果记录在数据交换格式文件中,保存在本地数据库服务器中;所述建立应用层为:针对数据层提供的数据交换格式文件,建立对应的交互渠道。2.根据权利要求1所述的具有标注活性功能的胶原寡肽数据库的建立方法,其特征在于,所述建立基础资源层中,动物胶原蛋白全长序列的来源为NBCI。3.根据权利要求2所述的具有标注...

【专利技术属性】
技术研发人员:曹如茵崔俊锋
申请(专利权)人:深圳柏垠生物科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1