The invention discloses a method, apparatus and equipment for determining the lipid function of a protein. By acquiring the amino acid sequence characteristics of the target protein and inputting the amino acid sequence characteristics of the target protein into the machine learning model, the lipid function of the target protein can be determined according to the output results of the machine learning model, in which the machine learning model has been based on the calendar. The corresponding relationship between the amino acid sequence characteristics of historic proteins and the known lipid functions of historic proteins was trained. In this way, the function of protein and lipid is determined by the trained machine learning model, which replaces the traditional manual test method in biology and saves the cost of material, time and manpower.
【技术实现步骤摘要】
一种确定蛋白质脂质功能的方法、装置和设备
本专利技术涉及信息处理
,特别是涉及一种确定蛋白质脂质功能的方法、装置和设备。
技术介绍
脂质结合蛋白(Lipidbindingproteins,LBP)不仅能够用于实现细胞脂质摄取、脂质转运和脂质代谢等生理机能,而且在基因表达调控、细胞信号传导、治疗靶点等方面也起到关键作用。因此,对于各种蛋白质来说,有必要确定其在脂质结合方面所具备的脂质功能。目前,蛋白质的脂质功能主要通过人工试验验证的方式确定。但是,人工试验要耗费较多的耗材、时间及人力,因此成本较高。
技术实现思路
本专利技术所要解决的技术问题是,提供一种确定蛋白质脂质功能的方法、装置和设备,以使得蛋白质脂质功能在无需人工试验的情况下就能够确定,从而节省耗材、时间及人力等方面的成本。第一方面,本专利技术实施例提供了一种确定蛋白质脂质功能的方法,包括:获取目标蛋白质的氨基酸序列特征;将所述目标蛋白质的氨基酸序列特征输入到机器学习模型中并根据所述机器学习模型的输出结果确定所述目标蛋白质的脂质功能;其中,所述机器学习模型已基于历史蛋白质的氨基酸序列特征与所述历史蛋白质的已知脂质功能之间的对应关系进行了训练。可选地,所述氨基酸序列特征为:所述氨基酸序列的位置特异性特征;所述获取目标蛋白质的氨基酸序列特征,包括:获取所述目标蛋白质的氨基酸序列的位置特异性得分矩阵;根据所述位置特异性得分矩阵,确定所述目标蛋白质的氨基酸序列的位置特异性特征。可选地,所述获取所述目标蛋白质的氨基酸序列的位置特异性得分矩阵,包括:在蛋白质序列数据库中查找所述目标蛋白质的同源蛋白质的氨基酸序列 ...
【技术保护点】
1.一种确定蛋白质脂质功能的方法,其特征在于,包括:获取目标蛋白质的氨基酸序列特征;将所述目标蛋白质的氨基酸序列特征输入到机器学习模型中并根据所述机器学习模型的输出结果确定所述目标蛋白质的脂质功能;其中,所述机器学习模型已基于历史蛋白质的氨基酸序列特征与所述历史蛋白质的已知脂质功能之间的对应关系进行了训练。
【技术特征摘要】
1.一种确定蛋白质脂质功能的方法,其特征在于,包括:获取目标蛋白质的氨基酸序列特征;将所述目标蛋白质的氨基酸序列特征输入到机器学习模型中并根据所述机器学习模型的输出结果确定所述目标蛋白质的脂质功能;其中,所述机器学习模型已基于历史蛋白质的氨基酸序列特征与所述历史蛋白质的已知脂质功能之间的对应关系进行了训练。2.根据权利要求1所述的方法,其特征在于,所述氨基酸序列特征为:所述氨基酸序列的位置特异性特征;所述获取目标蛋白质的氨基酸序列特征,包括:获取所述目标蛋白质的氨基酸序列的位置特异性得分矩阵;根据所述位置特异性得分矩阵,确定所述目标蛋白质的氨基酸序列的位置特异性特征。3.根据权利要求2所述的方法,其特征在于,所述获取所述目标蛋白质的氨基酸序列的位置特异性得分矩阵,包括:在蛋白质序列数据库中查找所述目标蛋白质的同源蛋白质的氨基酸序列;将所述目标蛋白质的氨基酸序列与所述同源蛋白质的氨基酸序列进行多序列比对,得到所述目标蛋白质的氨基酸序列的位置特异性得分矩阵。4.根据权利要求2所述的方法,其特征在于,所述根据所述位置特异性得分矩阵,确定所述目标蛋白质的氨基酸序列的位置特异性特征,包括:在所述位置特异性得分矩阵中查找每种氨基酸的最大位置特异性得分所在的行;根据所述每种氨基酸的最大位置特异性得分所在的行形成矩阵,作为所述目标蛋白质的氨基酸序列的位置特异性特征。5.根据权利要求1所述的方法,其特征在于,还包括:获取蛋白质序列标注数据库中标注了已知脂质功能的初始样本蛋白质;从所述初始样本蛋...
【专利技术属性】
技术研发人员:汤一凡,崔朝辉,赵立军,张霞,
申请(专利权)人:东软集团股份有限公司,
类型:发明
国别省市:辽宁,21
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。