一种高通量筛选食源性降压肽的方法技术

技术编号:31788566 阅读:26 留言:0更新日期:2022-01-08 10:45
本发明专利技术提供一种高通量筛选食源性降压肽的方法,包括步骤:1)收集已知具有降压潜力的多肽数据作为正样本;2)从蛋白质数据库中随机提取同等数量的多肽作为负样本,3)采用伪氨基酸组成法提取多肽序列特征;4)建立降压肽protBERT深度迁移学习模型;5)采用五倍交叉验证法评价深度学习模型;6)提取食品中蛋白质,采用蛋白酶水解酶水解所得蛋白质,制备水解肽;7)测定所得的食源性水解肽的氨基酸序列,输入深度学习模型进行降压功能预测。本发明专利技术提出的方法,采用protBERT深度迁移学习模型的方法构建降压肽预测模型,并通过Accuracy和ROC两个指标对深度学习模型进行评价,有效地保证模型稳定性的同时并能直观显示模型的鉴别分析能力。析能力。

【技术实现步骤摘要】
一种高通量筛选食源性降压肽的方法


[0001]本专利技术属于肽的筛选
,具体涉及一种筛选食源性降压肽的方法。

技术介绍

[0002]高血压是以血压增高为主要特征的临床综合征,因心脏和血管是高血压病理、生理影响的主要靶器官,高压又被称为心血管综合征。长期的血压高会造成心室肥厚和扩大,甚至影响至动脉,使动脉管径、动脉壁僵硬化、动脉管径缩小,从而影响到相应器官供血情况,重要靶器官如心脏、脑和肾脏等,会出现相应器官损害,到后期会出现心脑肾的严重并发症,以及严重心脑血管事件。高血压患者往往还伴有其它危险因素,比如有些高压患者可能同时存在着糖尿病,也可以同时存在着高胆固醇血症,伴有这些危险因素情况下就更容易造成动脉粥样硬化。因此对于高血压疾病一定要给予重视和治疗,目前治疗的有效手段之一便是进行药物干预。在筛选抗高血压药物的相关研究中,ACE抑制剂成为重要的靶标。目前,大量高效、特异的ACE抑制剂在治疗高血压病和充血性心力衰竭中发挥着重要作用。值得注意的是,ACE抑制肽已在食品中被发现,该生物活性肽与ACE活性位点的Zn
2+
竞争结合,继而抑制其活性,并阻止ACE水解血管紧张素I,同时该过程毒害性较小,属于天然的抑制方法。
[0003]目前,国际范围内研究和应用较多的食源性降压肽的鉴定方法主要有:以ACE抑制酶活性的体外试验法、以高血压小鼠模型为基础的动物实验法、以ACE酶和多肽结构为基础的分子对接技术、以高血压人群为基础的人群干预法、基于随机森林、卷积神经网络和支持向量机的传统机器学习法。其中国际食品领域普遍采用的是体外试验法和分子对接法,我国目前主要采用体外实验法。上述这两种方法虽然可以进行食源性降压肽的评价和鉴定,但均存在一定的局限性,单一使用难以满足高效准确的降压肽鉴定分析要求;且这两种方法效率较低,用时较长,不能实现高通量的筛选。动物实验和人群干预实验能够准确的评价食源性降压肽的降压效果,但食品不同于药品,短期的体内实验并不能有效地证明食源性降压肽的长期辅助治疗效果,且上述方法存在实验周期长、结果不稳定、个体差异大、经费投入大等不足,不能用于食源性降压肽的大规模、高通量的筛选。以随机森林、卷积神经网络和支持向量机为代表的传统机器学习方法准确率低、耗费时间长,容易出现过拟合,对于食源性降压肽的筛选存在一定的局限性。

技术实现思路

[0004]针对现有技术的存在的不足之处,本专利技术提供了一种基于protBERT深度迁移学习模型的高通量筛选食源性降压肽的方法。
[0005]实现本专利技术上述目的的技术方案为:
[0006]一种高通量筛选食源性降压肽的方法,包括步骤:
[0007]1)收集已知具有降压潜力的多肽数据作为正样本;
[0008]2)从蛋白质数据库中随机提取同等数量的多肽作为负样本,所述蛋白质数据库选
自UniProt、PDB(Protein Data Bank,简称PDB)、SDSPB中的一种;
[0009]3)采用伪氨基酸组成法提取多肽序列特征,所述多肽序列特征包括氨基酸组成和氨基酸特征;
[0010]4)基于步骤3)所提取的氨基酸特征数据,建立降压肽protBERT深度迁移学习模型;
[0011]5)采用五倍交叉验证法评价步骤4)所建立的深度学习模型;
[0012]6)提取食品中蛋白质,采用蛋白酶水解酶水解所得蛋白质,制备水解肽;
[0013]7)测定步骤6)所得的食源性水解肽的氨基酸序列,输入步骤4)所建立的深度学习模型进行降压功能预测。
[0014]本专利技术所述的食源性降压肽的原料包括谷物、海产品、乳制品、畜禽制品等富含蛋白质的食物。当前市场上降压肽多为单一食品来源的水解肽,本专利技术也可以针对多种不同食物来源的水解肽进行鉴定分析。
[0015]步骤1)中,是对既往已发表的ACE抑制肽进行数据荟萃整理,总结其降压特性。
[0016]其中,步骤2)中,提取的多肽作为非ACE抑制肽;且提取的多肽的不同氨基酸比例与所述正样本的近似。
[0017]所述的近似,是指提取的多肽的不同氨基酸比例与所述正样本的相差10%以内,优选在5%以内。
[0018]其中,步骤3)中,用伪氨基酸组成(PseAAC)法提取组成信息、序列信息以及它们之间的相互作用信息,所述氨基酸特征包括疏水性、亲水性、质量、pK1(α

CO2H)、pK2(NH3)和pI(25℃)。
[0019]进一步地,用伪氨基酸组成法(PseAAC)编码时,每种蛋白质均由具有20+iλ长度的向量表示,其中i等于所考虑的氨基酸特征的数量,而λ是确定相互作用的氨基酸距离的系数(如果λ等于1,则仅考虑相邻氨基酸之间的相互作用)。
[0020]本专利技术的一种优选技术方案为,步骤4)中,所述protBERT深度迁移学习模型中,参数的设置为:vocab_size=30,attention_probs_dropout_prob:0.0,hidden_act:gelu,hidden_dropout_prob:0.0,hidden_size:1024,initializer_range:0.02,intermediate_size:4096,max_position_embeddings:40000,num_attention_heads:16,num_hidden_layers:30,type_vocab_size:2,vocab_size:30。
[0021]微调参数可以为:Batch size:8,Learning rate:1e

5,warm up 4:0.1。
[0022]进一步优选地,步骤5)中采用五倍交叉验证评价深度学习模型的预测效果,评价指标为准确性(Accuracy)和ROC(Receiver Operating Characteristic Curve)两个指标对深度学习模型进行评价,
[0023]Accuracy=(TN+TP)/(TN+TP+FN+FP)*100%
ꢀꢀꢀꢀꢀꢀ
(1)
[0024]其中TN是真阴性例数,TP是真阳性例数,FN是假阴性例数,FP是假阴性例数;
[0025]Accuracy越接近100%,ROC越接近于1,所述深度学习模型的精度越高;更优选地,所述准确率为85%~100%,且ROC为0.8~1时,所述判别鉴别分析模型有效。
[0026]其中,步骤6)中采用碱溶酸沉法、有机溶剂提取法、盐析、电泳,超速离心,超滤中的一种或多种方法提取蛋白质;所述蛋白酶水解酶为碱性蛋白酶、糜蛋白酶、木瓜蛋白酶、菠萝蛋白酶、胰蛋白酶、胃蛋白酶中的一种或多种。
[0027]依据蛋白特点和以往的研究经验,优选步骤6)中采用碱溶酸沉法提取食物中的蛋白质。
[0028]其中,步骤7)中利用基质辅助激光解吸电离飞行时间质谱进行所述的食源性水解肽的氨基酸序列测定,把测得的序列特征输入步骤5)中模型进行食源性降压肽的鉴定分本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种高通量筛选食源性降压肽的方法,其特征在于,包括步骤:1)收集已知具有降压潜力的多肽数据作为正样本;2)从蛋白质数据库中随机提取同等数量的多肽作为负样本,所述蛋白质数据库选自UniProt、PDB、SDSPB中的一种;3)采用伪氨基酸组成法提取多肽序列特征,所述多肽序列特征包括氨基酸组成和氨基酸特征;4)基于步骤3)所提取的氨基酸特征数据,建立降压肽protBERT深度迁移学习模型;5)采用五倍交叉验证法评价步骤4)所建立的深度学习模型;6)提取食品中蛋白质,采用蛋白酶水解酶水解所得蛋白质,制备水解肽;7)测定步骤6)所得的食源性水解肽的氨基酸序列,输入步骤5)所建立的深度学习模型进行降压功能预测。2.根据权利要求1所述的高通量筛选食源性降压肽的方法,其特征在于,步骤2)中,提取的多肽作为非ACE抑制肽;且提取的多肽的不同氨基酸比例与所述正样本的近似。3.根据权利要求1所述的高通量筛选食源性降压肽的方法,其特征在于,步骤3)中,用伪氨基酸组成法提取组成信息、序列信息以及它们之间的相互作用信息,所述氨基酸特征包括疏水性、亲水性、质量、pK1(α

CO2H)、pK2(NH3)和pI(25℃)。4.根据权利要求3所述的高通量筛选食源性降压肽的方法,其特征在于,用伪氨基酸组成法编码时,每种蛋白质均由具有20+iλ长度的向量表示,其中i等于所考虑的氨基酸特征的数量,而λ是确定相互作用的氨基酸距离的系数。5.根据权利要求1~4任一项所述的高通量筛选食源性降压肽的方法,其特征在于,步骤4)中,所述protBERT深度迁移学习模型中,参数的设置为:vocab_size=30,attention_probs_dropout_prob:0.0,hidden_act:gelu,hidden_dropout_prob:0.0,hidden_size:1024,initializer_range:0.02,inte...

【专利技术属性】
技术研发人员:薛勇王立扬赵新杰沈群
申请(专利权)人:中国农业大学
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1