当前位置: 首页 > 专利查询>山东大学专利>正文

一种蛋白质糖化位点鉴定方法技术

技术编号:22638599 阅读:26 留言:0更新日期:2019-11-26 15:25
本申请提供了一种蛋白质糖化位点鉴定方法,包括:收集蛋白质糖化位点数据,从所述蛋白质糖化位点数据中提取肽链获得肽链样本集,所述肽链以赖氨酸为中心;分别采用单热向量编码所述肽链的每个氨基酸,获得使用单热向量表示的肽链训练集;利用LSTM RNNs训练生产人工肽链样本,构建人工肽链样本集;将所述肽链样本集和人工肽链样本集中各肽链分割成一系列的生物学词,基于所述生物学词分别通过ProtVec构造所述肽链样本集和人工肽链样本集中各肽链的特征;基于CNN训练获得预测器、鉴定蛋白质糖化位点。本申请提供的种蛋白质糖化位点鉴定方法,用于鉴定蛋白质糖化位点,降低特征提取的繁复度,提高蛋白质糖化位点鉴定的准确度。

A method for identifying glycosylation sites of proteins

The application provides a method for protein glycosylation site identification, which includes: collecting data of protein glycosylation site, extracting peptide chain from the data of protein glycosylation site to obtain peptide chain sample set, wherein the peptide chain takes lysine as the center; coding each amino acid of the peptide chain with single heat vector respectively to obtain peptide chain training set expressed with single heat vector; training with LSTM RNNs Train the production of artificial peptide chain samples and build the artificial peptide chain sample set; divide the peptide chain in the peptide chain sample set and the artificial peptide chain sample set into a series of biological words, and construct the characteristics of the peptide chain in the peptide chain sample set and the artificial peptide chain sample set respectively through protvec based on the biological words; obtain the predictor and identify the protein glycosylation site based on CNN training. The method of protein glycosylation site identification provided in this application is used to identify protein glycosylation site, reduce the complexity of feature extraction, and improve the accuracy of protein glycosylation site identification.

【技术实现步骤摘要】
一种蛋白质糖化位点鉴定方法
本申请涉及蛋白质功能预测
,尤其涉及一种蛋白质糖化位点鉴定方法。
技术介绍
1912年,LCMaillard首次发现并描述了糖化反应。作为最重要的翻译后修饰(Post-TranslationalModifications,PTMs)过程之一,糖化反应通过糖的氧化还原或过氧化还原产生具有羰基基团的甲酰基或酮基,羰基的氧原子带负电,在高葡萄糖条件下可与蛋白质、DNA、脂质等生物分子中的亲核基发生非酶促糖化反应,形成晚期糖化终产物(AdvancedGlycationEndProducts,AGEs)。AGEs在人体内的长期积累将引发两种主要的细胞效应::(1)引起细胞外和细胞内蛋白质之间的分子间键合或交联,改变细胞外基质(ECM)蛋白质的生理特征;(2)它与细胞表面AGE受体(ReceptorforAGE,RAGE)结合时启动复杂的信号传导途径,最终导致促炎介质和活性氧的产生。研究显示,这些分子水平上的变化与糖尿病、肾炎、动脉粥样硬化、白内障、阿尔兹海默症等众多疾病的发病机制密切相关。研究显示,AGEs化合物本文档来自技高网...

【技术保护点】
1.一种蛋白质糖化位点鉴定方法,其特征在于,所述方法包括:/n收集蛋白质糖化位点数据,从所述蛋白质糖化位点数据中提取肽链获得肽链样本集,所述肽链以赖氨酸为中心,所述肽链的形式为P=A

【技术特征摘要】
1.一种蛋白质糖化位点鉴定方法,其特征在于,所述方法包括:
收集蛋白质糖化位点数据,从所述蛋白质糖化位点数据中提取肽链获得肽链样本集,所述肽链以赖氨酸为中心,所述肽链的形式为P=A-ηA-(η-1)...A-2A-1KA1A2...Aη-1Aη,K为赖氨酸,η是赖氨酸上游或下游的氨基酸数量,A为20种天然氨基酸之一;
分别采用单热向量编码所述肽链的每个氨基酸,获得使用单热向量表示的肽链训练集,其中所述赖氨酸为000000000001000000000;
根据所述肽链训练集,利用LSTMRNNs训练获得人工肽链样本,构建人工肽链样本集;
将所述肽链样本集和人工肽链样本集中各肽链分割成一系列的生物学词,基于所述生物学词分别通过ProtVec构造所述肽链样本集和人工肽链样本集中各肽链的特征;
根据基于所述生物学词分别通过ProtVec构造所述肽链样本集和人工肽链样本集中各肽链的特征,基于CNN训练获得预测器,基于所述预测器鉴定蛋白质糖化位点。


2.根据权利要求1所述的蛋白质糖化位点鉴定方法,其特征在于,所述方法还包括:
当所述肽链中赖氨酸上游或下游的氨基酸数量小于η时,使用符号X对扩展所述肽链,其中X的单热向量编码为000000000000000000001。


3.根据权利要求1所述的蛋白质糖化位点鉴定方法,其...

【专利技术属性】
技术研发人员:杨润涛陈金桂张承进张丽娜宋勇
申请(专利权)人:山东大学
类型:发明
国别省市:山东;37

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1