一种智能化药物靶点亲和力预测方法与流程技术

技术编号:27659161 阅读:17 留言:0更新日期:2021-03-12 14:25
本发明专利技术公开了一种智能化药物靶点亲和力预测方法与流程,包括以下步骤:S1:数据提取,S2:数值化处理,S3:冗余信息处理,S4:数据拼接处理,S5:亲和力预测,S6:药物分子因素预测。本发明专利技术中,通过变分自动编码器实现对蛋白质序列特征向量存在许多冗余信息的去除,降低特征维度,提高预测的准确率和效率,同时通过数理统计方法建立药物化学机构与靶点的定量构效关系,实现计算药物化学结构亲和力预测,实现对药物与靶点亲和力进行双重方式预测分析,可以对预测的结果进行整合分析,显著提高预测的准确性。

【技术实现步骤摘要】
一种智能化药物靶点亲和力预测方法与流程
本专利技术涉及药物靶点亲和力分析预测
,尤其涉及一种智能化药物靶点亲和力预测方法与流程。
技术介绍
药物靶点是指药物在体内的作用结合位点,包括基因位点、受体、酶、离子通道、核酸等生物大分子。现代新药研究与开发的关键首先是寻找、确定和制备药物筛选靶—分子药靶。药物靶点是指药物在体内的作用结合位点,包括基因位点、受体、酶、离子通道、核酸等生物大分子。选择确定新颖的有效药靶是新药开发的首要任务。迄今已发现作为治疗药物靶点的总数约500个,其中受体尤其是G-蛋白偶联的受体(GPCR)靶点占绝大多数,另还有酶、抗菌、抗病毒、抗寄生虫药的作用靶点。药物靶点亲和力预测方法与流程就是一种对药物与靶点之间的作用关系进行分析预测药物与靶点之间的亲和力,在对药物与靶点之间相互作用关系分析过程中,蛋白质序列特征向量存在许多冗余信息,特征维度搞,影响分类预测的准确率和效率,同时在进行分析缺少对药物分子化学结构进行分析,导致预测的结果准确性差。
技术实现思路
本专利技术的目的在于提供一种智能化药物靶点亲和力预测方法与流程,实现对蛋白质序列特征向量存在许多冗余信息的去除,降低特征维度,提供预测的准确率和效率,同时通过数理统计方法建立药物化学机构与靶点的定量构效关系,实现计算药物化学结构亲和力预测,实现对药物与靶点亲和力进行双重方式预测分析,可以对预测的结果进行整合分析,显著提高预测的准确性。为了实现上述目的,本专利技术采用了如下技术方案:一种智能化药物靶点亲和力预测方法与流程,包括以下步骤:S1:数据提取,从生物信息公共数据库中收集药物化合物分子数据和蛋白质序列;S2:数值化处理,分别对药物化合物分子和蛋白质氨基酸序列进行数值化处理,获取药物化合物分子指纹特征向量X和蛋白质序列特征向量Y;S3:冗余信息处理,去除蛋白质序列特征向量Y冗余信息,提取用于训练、学习和分类的高级特征,降低特征维度,提高药物与靶点相互预制预测的准确率;S4:数据拼接处理,将蛋白质序列特征向量Y和药物化合物分子指纹特征向量X进行拼接,获取药物靶点融合特征数据Y;S5:亲和力预测,根据获取的融合特征数据Y,通过深度学习卷积神经网络分类器对药物靶点相互作用进行分析,实现对药物靶点亲和力预测;S6:药物分子因素预测,获取药物化合物分子化学结构特征,通过数理统计方法建立药物化学机构与靶点的定量构效关系,实现计算药物化学结构亲和力预测。作为上述技术方案的进一步描述:所述步骤S2中药物化合物分子和蛋白质氨基酸序列进行数值化处理的使用的方法分别为分子指纹特征的药物化合物分子表征方法和得分特异性矩阵的蛋白质氨基酸序列表征方法。作为上述技术方案的进一步描述:所述步骤S3去除蛋白质序列特征向量Y冗余信息具体方法为采用变分自动编码器提取蛋白质序列高级特征,降低维度,去除冗余信息。作为上述技术方案的进一步描述:所述步骤S4中数据拼接的规则为药物化合物分子指纹特征向量X在前,蛋白质序列特征向量Y在后。作为上述技术方案的进一步描述:所述步骤S4中数据拼接处理具体方法为,通过串联规则将药物化合物药物化合物分子指纹特征向量X(x1、x2...xn)和蛋白质序列特征向量Y(y1、y2...yn)进行同一规则拼接,获得药物靶点融合特征数据Z(x1、x2...xn,y1、y2...yn)。作为上述技术方案的进一步描述:所述步骤S5亲和力预测具体方法为将融合特征数据Y作为卷积神经网络的输入,对融合特征数据Y进行训练生成分类器模型,利用反向传播、梯度下降方法调整分类器网络权值,然后获取最终亲和力预测结果。作为上述技术方案的进一步描述:所述步骤S6中药物化合物分子特征包括电性参数、物化参数和构型参数。本专利技术提供了一种智能化药物靶点亲和力预测方法与流程。具备以下有益效果:该智能化药物靶点亲和力预测方法与流程通过变分自动编码器实现对蛋白质序列特征向量存在许多冗余信息的去除,降低特征维度,提高预测的准确率和效率,同时通过数理统计方法建立药物化学机构与靶点的定量构效关系,实现计算药物化学结构亲和力预测,实现对药物与靶点亲和力进行双重方式预测分析,可以对预测的结果进行整合分析,显著提高预测的准确性。附图说明图1为本专利技术提出的一种智能化药物靶点亲和力预测方法与流程示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例仅仅是本专利技术一部分实施例,而不是全部的实施例。参照图1,一种智能化药物靶点亲和力预测方法与流程,包括以下步骤:S1:数据提取,从生物信息公共数据库中收集药物化合物分子数据和蛋白质序列;S2:数值化处理,分别对药物化合物分子和蛋白质氨基酸序列进行数值化处理,获取药物化合物分子指纹特征向量X和蛋白质序列特征向量Y;S3:冗余信息处理,去除蛋白质序列特征向量Y冗余信息,提取用于训练、学习和分类的高级特征,降低特征维度,提高药物与靶点相互预制预测的准确率;S4:数据拼接处理,将蛋白质序列特征向量Y和药物化合物分子指纹特征向量X进行拼接,获取药物靶点融合特征数据Y;S5:亲和力预测,根据获取的融合特征数据Y,通过深度学习卷积神经网络分类器对药物靶点相互作用进行分析,实现对药物靶点亲和力预测;S6:药物分子因素预测,获取药物化合物分子化学结构特征,通过数理统计方法建立药物化学机构与靶点的定量构效关系,实现计算药物化学结构亲和力预测。步骤S2中药物化合物分子和蛋白质氨基酸序列进行数值化处理的使用的方法分别为分子指纹特征的药物化合物分子表征方法和得分特异性矩阵的蛋白质氨基酸序列表征方法。药物化合物分子和蛋白质氨基酸序列都是以一种复杂的字符编码保存在生物的数据库中,计算机智能算法难以运算,通过分子指纹特征的药物化合物分子表征方法和得分特异性矩阵的蛋白质氨基酸序列表征方法有效的将药物分子与蛋白质序列进行数值化表征,提取出药物化合物分子与靶标蛋白氨基酸序列的生物信息和本质属性,为实验运算提供数据保障。步骤S3去除蛋白质序列特征向量Y冗余信息具体方法为采用变分自动编码器提取蛋白质序列高级特征,降低维度,去除冗余信息。蛋白质序列特征向量Y存在许多冗余信息,特征维度高,影响预测的准确率与效率,通过变分自动编码器有效提取用于训练、学习、分类的高级特征,尽可能减少特征的维度,提高预测的准确率。步骤S4中数据拼接的规则为药物化合物分子指纹特征向量X在前,蛋白质序列特征向量Y在后。步骤S4中数据拼接处理具体方法为,通过串联规则将药物化合物药物化合物分子指纹特征向量X(x1、x2...xn)和蛋白质序列特征向量Y(y1、y2...yn)进行同一规则拼接,获得药物靶点融合特征数据Z(x1、x2...xn,y1、y2...yn)。由于药物化合本文档来自技高网...

【技术保护点】
1.一种智能化药物靶点亲和力预测方法与流程,其特征在于,包括以下步骤:/nS1:数据提取,从生物信息公共数据库中收集药物化合物分子数据和蛋白质序列;/nS2:数值化处理,分别对药物化合物分子和蛋白质氨基酸序列进行数值化处理,获取药物化合物分子指纹特征向量X和蛋白质序列特征向量Y;/nS3:冗余信息处理,去除蛋白质序列特征向量Y冗余信息,提取用于训练、学习和分类的高级特征,降低特征维度,提高药物与靶点相互预制预测的准确率;/nS4:数据拼接处理,将蛋白质序列特征向量Y和药物化合物分子指纹特征向量X进行拼接,获取药物靶点融合特征数据Y;/nS5:亲和力预测,根据获取的融合特征数据Y,通过深度学习卷积神经网络分类器对药物靶点相互作用进行分析,实现对药物靶点亲和力预测;/nS6:药物分子因素预测,获取药物化合物分子化学结构特征,通过数理统计方法建立药物化学机构与靶点的定量构效关系,实现计算药物化学结构亲和力预测。/n

【技术特征摘要】
1.一种智能化药物靶点亲和力预测方法与流程,其特征在于,包括以下步骤:
S1:数据提取,从生物信息公共数据库中收集药物化合物分子数据和蛋白质序列;
S2:数值化处理,分别对药物化合物分子和蛋白质氨基酸序列进行数值化处理,获取药物化合物分子指纹特征向量X和蛋白质序列特征向量Y;
S3:冗余信息处理,去除蛋白质序列特征向量Y冗余信息,提取用于训练、学习和分类的高级特征,降低特征维度,提高药物与靶点相互预制预测的准确率;
S4:数据拼接处理,将蛋白质序列特征向量Y和药物化合物分子指纹特征向量X进行拼接,获取药物靶点融合特征数据Y;
S5:亲和力预测,根据获取的融合特征数据Y,通过深度学习卷积神经网络分类器对药物靶点相互作用进行分析,实现对药物靶点亲和力预测;
S6:药物分子因素预测,获取药物化合物分子化学结构特征,通过数理统计方法建立药物化学机构与靶点的定量构效关系,实现计算药物化学结构亲和力预测。


2.根据权利要求1所述的一种智能化药物靶点亲和力预测方法与流程,其特征在于,所述步骤S2中药物化合物分子和蛋白质氨基酸序列进行数值化处理的使用的方法分别为分子指纹特征的药物化合物分子表征方法和得分特异性矩阵的蛋白质氨基酸序列表征方法。


3.根据权利要求1所述的一种智能化...

【专利技术属性】
技术研发人员:王忠云贾蒙杜雨赵连凤黄妙玲
申请(专利权)人:南京希瑞斯细胞工程有限公司
类型:发明
国别省市:江苏;32

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1