【技术实现步骤摘要】
基于多维特征的蛋白质性质预测方法、装置和计算设备
本专利技术涉及药物虚拟筛选领域,尤其涉及一种基于多维特征的蛋白质性质预测方法、装置和计算设备。
技术介绍
众所周知,药物研发是一个漫长的过程,存在着研发周期长,研发成果率低,研发费用高的困境。而随着计算机技术的更新以及大数据技术的发展,人工智能正在各行各业中发挥巨大的应用价值,在制药行业也受到了广泛的关注。在新药发现过程中,虚拟筛选可以提高活性分子的富集,通过对化合物的性质进行预测,可以节约大量的人力、物力,缩短药物研发周期,加速研究成果的转化,因此近年来已引起科研机构和制药公司的高度重视。在进行虚拟药物筛选时,需要将蛋白质进行矢量化以提取其特征表示,使计算机可以理解蛋白数据。但目前的蛋白特征提取都比较单一,缺少能从多个角度提取蛋白的通用工具,极大限制了对生物大分子的机器学习建模。
技术实现思路
为此,本专利技术提供了一种基于多维特征的蛋白质性质预测方法、装置和计算设备,以力图解决或至少缓解上面存在的至少一个问题。根据本专利技术的一个方面, ...
【技术保护点】
1.一种基于多维特征的蛋白质性质预测方法,适于在计算设备中执行,所述计算设备包括蛋白质性质预测模型,该模型的输入为组装后的蛋白质特征、输出为预测的性质属性,所述方法包括步骤:/n获取待测蛋白质的序列数据和结构数据;/n从所述序列数据和结构数据中分别提取所述待测蛋白质的氨基酸序列特征、指定残基特征和三维结构图特征,所述氨基酸序列特征包括氨基酸组成和物理化学性质,所述指定残基特征包括指定残基的自身属性和环境属性,所述三维结构图特征包括残基节点属性和边属性;以及/n将所述氨基酸序列特征、指定残基特征和三维结构图特征组装为蛋白质特征,并采用所述蛋白质性质预测模型对所述蛋白质特征进行 ...
【技术特征摘要】
1.一种基于多维特征的蛋白质性质预测方法,适于在计算设备中执行,所述计算设备包括蛋白质性质预测模型,该模型的输入为组装后的蛋白质特征、输出为预测的性质属性,所述方法包括步骤:
获取待测蛋白质的序列数据和结构数据;
从所述序列数据和结构数据中分别提取所述待测蛋白质的氨基酸序列特征、指定残基特征和三维结构图特征,所述氨基酸序列特征包括氨基酸组成和物理化学性质,所述指定残基特征包括指定残基的自身属性和环境属性,所述三维结构图特征包括残基节点属性和边属性;以及
将所述氨基酸序列特征、指定残基特征和三维结构图特征组装为蛋白质特征,并采用所述蛋白质性质预测模型对所述蛋白质特征进行处理,得到所述待测蛋白质的预测性质。
2.如权利要求1所述的方法,其中,所述氨基酸序列特征包括以下至少一种:
氨基酸的出现频率、连续N个氨基酸的群组特征、序列二进制特征、氨基酸指数特征、氨基酸指数的自动相关性、蛋白质序列顺序相关性、氨基酸结构和性质分布特征。
3.如权利要求1或2所述的方法,其中,
三维结构图表示为节点和边,每个节点代表一个残基,并标注有蛋白质链的编号、残基编号和氨基酸类型,每条边代表两个残基之间的相互作用。
4.如权利要求3所述的方法,其中,所述相互作用包括以下至少一种:
疏水作用、二硫键、氢键、离子键、芳环相互作用、芳环和硫的相互作用、阳离子和π键的相互作用、以及骨架原子作用。
5.如权利要求1-4中任一项所述的方法,其中,所述自身属性包括以下至少一种:
残基的溶剂可及表面积、残基中所有原子的温度因子均值、残基中所有原子与溶剂可及表面的距离均值、以及残基肽...
【专利技术属性】
技术研发人员:王天元,翟珂,黄健,张琳,赖力鹏,温书豪,马健,
申请(专利权)人:北京晶派科技有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。