一种蛋白质磷酸化修饰位点-疾病关系识别方法、系统、装置及存储介质制造方法及图纸

技术编号:25712211 阅读:35 留言:0更新日期:2020-09-23 02:58
本发明专利技术公开了一种蛋白质磷酸化修饰位点‑疾病关系识别方法、系统、装置及存储介质,该方法包括:获取信息;构建关系数据集和非关系数据集;构建关系特征向量和非关系特征向量;输入关系特征向量和非关系特征向量得到识别结果。该系统包括:获取模块,数据集模块、特征向量模块和输出模块。该装置包括存储器以及用于执行上述蛋白质磷酸化修饰位点‑疾病关系识别方法的处理器。通过使用本发明专利技术,可高效、准确的在蛋白质组识别大量蛋白质磷酸化修饰位点‑疾病的关系信息。本发明专利技术作为一种蛋白质磷酸化修饰位点‑疾病关系识别方法、系统、装置及存储介质,可广泛应用于蛋白质磷酸化修饰位点识别领域。

【技术实现步骤摘要】
一种蛋白质磷酸化修饰位点-疾病关系识别方法、系统、装置及存储介质
本专利技术涉及蛋白质磷酸化修饰位点识别领域,尤其涉及一种蛋白质磷酸化修饰位点-疾病关系识别方法、系统、装置及存储介质。
技术介绍
蛋白质磷酸化修饰是目前所有翻译后修饰类型中数据量最大、人体内分布最广泛的一种蛋白质翻译后修饰类型。据估计,在人体中,大约有70%的蛋白质可以发生磷酸化。蛋白质磷酸化修饰几乎参与了所有的生物学过程,如细胞的增殖、发育、分化和凋亡,信号转导,新陈代谢,以及转录调控等。由于蛋白质磷酸化在生物体细胞中扮演了至关重要的角色,所以通常和复杂或者重大疾病的发生、发展有着密切的关系。例如,研究表明α-synuclein蛋白、线粒体激酶蛋白PINK1和Parkin蛋白相关氨基酸位点的磷酸化对形成路易小体,激活、降解和转运帕金森病相关蛋白等具有至关重要的作用。因此,深入研究蛋白质磷酸化修饰位点与疾病之间的关系,不仅有助于阐明蛋白质的序列、结构与功能关系的,而且对于疾病的预防、诊断和治疗,以及药物研发等具有重要的研究意义和应用价值。但是,目前仅识别了非常少量的蛋白质本文档来自技高网...

【技术保护点】
1.一种蛋白质磷酸化修饰位点-疾病关系识别方法,其特征在于,包括以下步骤:/n获取疾病信息、蛋白质磷酸化修饰位点信息、氨基酸序列片段信息和临床症状信息,并标记得到关系信息;/n基于蛋白质磷酸化修饰位点与疾病的关系信息,构建蛋白质磷酸化修饰位点与疾病的关系数据集和非关系数据集;/n根据关系数据集和非关系数据集、蛋白质磷酸化修饰位点对应的氨基酸序列片段信息和临床症状信息,构建蛋白质磷酸化修饰位点与疾病的关系特征向量和非关系特征向量;/n将关系特征向量和非关系特征向量输入到随机森林模型,得到蛋白质磷酸化修饰位点与疾病关系的结果。/n

【技术特征摘要】
1.一种蛋白质磷酸化修饰位点-疾病关系识别方法,其特征在于,包括以下步骤:
获取疾病信息、蛋白质磷酸化修饰位点信息、氨基酸序列片段信息和临床症状信息,并标记得到关系信息;
基于蛋白质磷酸化修饰位点与疾病的关系信息,构建蛋白质磷酸化修饰位点与疾病的关系数据集和非关系数据集;
根据关系数据集和非关系数据集、蛋白质磷酸化修饰位点对应的氨基酸序列片段信息和临床症状信息,构建蛋白质磷酸化修饰位点与疾病的关系特征向量和非关系特征向量;
将关系特征向量和非关系特征向量输入到随机森林模型,得到蛋白质磷酸化修饰位点与疾病关系的结果。


2.根据权利要求1所述一种蛋白质磷酸化修饰位点-疾病关系识别方法,其特征在于,所述蛋白质磷酸化修饰位点信息包括与何种疾病相关和与疾病关系属于何种类型,所述氨基酸序列片段信息包括发生磷酸化修饰的氨基酸类型和磷酸化修饰氨基酸在对应蛋白质序列中的位置,所述临床症状信息包括疾病临床症状、疾病名称、同义词和疾病在医学数据库中的ID号。


3.根据权利要求2所述一种蛋白质磷酸化修饰位点-疾病关系识别方法,其特征在于,所述基于蛋白质磷酸化修饰位点与疾病的关系信息,构建蛋白质磷酸化修饰位点与疾病的关系数据集和非关系数据集这一步骤,其具体包括:
基于蛋白质磷酸化修饰位点与疾病的关系信息,生成蛋白质磷酸化修饰位点与疾病的关系对并构建蛋白质磷酸化修饰位点与疾病的关系数据集;
随机抽取蛋白质磷酸化修饰位点信息和疾病信息,得到随机关系并检查该随机关系是否存在于关系数据集;
判断到随机关系不存在于关系数据集,生成蛋白质磷酸化修饰位点与疾病的非关系对;
将蛋白质磷酸化修饰位点与疾病的非关系对收录到蛋白质磷酸化修饰位点与疾病的非关系数据集;
重复生成非关系对和收录的步骤直至生成的非关系数据集与关系数据集大小相等。


4.根据权利要求3所述一种蛋白质磷酸化修饰位点-疾病关系识别方法,其特征在于,所述将关系特征向量和非关系特征向量输入到随机森林模型还包括构建随机森林模型,所述构建随机森林模型包括以下步骤:
根据蛋白质磷酸化修饰位点与疾病的关系对,得到关系对特征;
根据蛋白质磷酸化修饰位点与疾病的非关系对,得到非关系对特征;
选取部分关系对特征、非关系对特征、关系对信息和非关系对信息输入到随机森林模型进行训练;
根据剩余的关系对特征、非关系对特征、关系对信息和非关系对信息对随机森林模型进行测试,完成随机森林模型的构建。


5.根据权利要求4所述一种蛋白质磷酸化修饰位点-疾病关系识别方法,其特征在于,所述根据蛋白质磷酸化修饰位点与疾病的关...

【专利技术属性】
技术研发人员:李占潮
申请(专利权)人:广东药科大学中山大学
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1