药物和靶点匹配的判断方法、系统、设备及介质技术方案

技术编号:38324093 阅读:8 留言:0更新日期:2023-07-29 09:06
本发明专利技术涉及自然语言处理领域及数字医疗领域,提供一种药物和靶点匹配的判断方法、系统、设备及介质。方法包括:获取药物分子序列和靶点蛋白质序列;将药物分子序列和靶点蛋白质序列分别输入至第一模型中,对药物分子序列和靶点蛋白质序列进行多模态处理,得到第一置信度得分;将药物分子序列和靶点蛋白质序列分别输入至第二模型中,对药物分子序列和靶点蛋白质序列进行特征提取和特征拼接,得到第二置信度得分;将第一置信度得分和第二置信度得分进行加权求和,得到总置信度得分,并在总置信度得分大于或等于预设的置信度阈值时,判定药物与靶点匹配。实现了快速准确的确定新药物和拟判断靶蛋白之间的靶向关系,有效提升了药物筛选的效率。选的效率。选的效率。

【技术实现步骤摘要】
药物和靶点匹配的判断方法、系统、设备及介质


[0001]本专利技术涉及自然语言处理领域及数字医疗领域,特别涉及一种药物和靶点匹配的判断方法、系统、设备及介质。

技术介绍

[0002]一颗新药从实验室研发到商业化销售,需要经过药物发现、临床前研究、临床研究和审批上市四个阶段。药物和靶蛋白匹配的判断是药物发现的重要手段,指的是采用适当的方法,对可能作为药物使用的化合物,以及药物可能治疗的靶蛋白进行生物活性、药理作用及药用价值的评估过程。
[0003]新药研发的过程难度巨大,业内一直流传着“三十定律”,即一款药物从实验室研发到临床获批平均耗时十年,耗资十亿美金,成功率仅10%。据统计,目前这个定律里的时间和资金还在增长,某些药物的耗资远远超过了十亿美金。传统的判断药物是否能对靶蛋白具有靶向治疗作用的方式,通常是使用细胞水平筛选。即通过用候选药物处理靶细胞,再通过生化实验判断药物对靶细胞是否具有治疗的作用。
[0004]专利技术人意识到,上述判断药物是否对靶蛋白具有靶向治疗的方式,对于新的药物和拟判断靶蛋白,需要多次实验才能确定两者的靶向关系,且实验结果具有随机性,因此,无法快速准确的确定新药物和拟判断靶蛋白之间的靶向关系。

技术实现思路

[0005]本专利技术的目的在于提供一种药物和靶点匹配的判断方法、系统、设备及介质。以解决现有的判断药物是否对靶蛋白有效的方法中,判断药物和靶蛋白靶向关系速度和准确性较低的问题。
[0006]第一方面,提供了一种药物和靶点匹配的判断方法,包括:/>[0007]获取药物分子序列和靶点蛋白质序列;
[0008]将所述药物分子序列和靶点蛋白质序列分别输入至第一模型级联的两个Bert网络中,分别对所述药物分子序列和靶点蛋白质序列进行多模态处理,得到第一置信度得分;其中,所述第一模型用于获取所述药物分子序列和所述靶点蛋白质序列的位置编码关系;
[0009]将所述药物分子序列和靶点蛋白质序列分别输入至第二模型的双通道GNN网络中,分别对所述药物分子序列和靶点蛋白质序列进行特征提取和特征拼接,得到第二置信度得分;其中,所述第二模型用于获取所述药物分子序列和所述靶点蛋白质序列的关联关系;
[0010]将所述第一置信度得分和所述第二置信度得分进行加权求和,得到总置信度得分,并在所述总置信度得分大于或等于预设的置信度阈值时,判定药物与靶点匹配。
[0011]第二方面,提供了一种种药物和靶点匹配的判断系统,包括:
[0012]数据获取模块,用于获取药物分子序列和靶点蛋白质序列;
[0013]第一置信度得分获取模块,用于将所述药物分子序列和靶点蛋白质序列分别输入
至第一模型级联的两个Bert网络中,分别对所述药物分子序列和靶点蛋白质序列进行多模态处理,得到第一置信度得分;其中,所述第一模型用于获取所述药物分子序列和所述靶点蛋白质序列的位置编码关系;
[0014]第二置信度得分获取模块,用于将所述药物分子序列和靶点蛋白质序列分别输入至第二模型的双通道GNN网络中,分别对所述药物分子序列和靶点蛋白质序列进行特征提取和特征拼接,得到第二置信度得分;其中,所述第二模型用于获取所述药物分子序列和所述靶点蛋白质序列的关联关系;
[0015]匹配判断模块,用于将所述第一置信度得分和所述第二置信度得分进行加权求和,得到总置信度得分,并在所述总置信度得分大于或等于预设的置信度阈值时,判定药物与靶点匹配。
[0016]第三方面,提供了一种计算机设备,包括存储器、处理器以及存储在存储器中并可在处理器上运行的计算机程序,处理器执行计算机程序时实现上述药物和靶点匹配的判断方法的步骤。
[0017]第四方面,提供了一种计算机可读存储介质,计算机可读存储介质存储有计算机程序,计算机程序被处理器执行时实现上述药物和靶点匹配的判断方法的步骤。
[0018]本专利技术的药物和靶点匹配的判断方法、系统、设备及介质。通过将获取到的药物分子序列和靶点蛋白质序列输入至第一模型级联的两个Bert网络中,通过对所述药物分子序列和靶点蛋白质序列分别进行多模态处理,得到第一置信度得分。与此同时,还需将所述药物分子序列和靶点蛋白质序列分别输入至第二模型的双通道GNN网络中,分别对所述药物分子序列和靶点蛋白质序列进行特征提取和特征拼接,得到第二置信度得分。然后将所述第一置信度得分和所述第二置信度得分进行加权求和,得到总置信度得分,并在所述总置信度得分大于或等于预设的置信度阈值时,判定药物与靶点匹配。实现了快速准确的确定新药物和拟判断靶蛋白之间的靶向关系,有效提升了药物筛选的效率。通过使用Bert网络,对药物分子序列和靶点蛋白质序列分别进行位置编码和特征嵌入,从而能够提升药物分子序列和靶点蛋白质的有序性。避免输入Bert模型时,由于初始化处理是对序列进行随机打乱,导致药物分子序列或靶点蛋白质序列出现错乱,影响后续判断结果。通过使用图神经网络,虽然网络层数较少,但可以充分利用药物分子序列或靶蛋白序列中各原子之间的键连接关系,从而极大提升了判定的准确度,缩短了判定时间。使用图神经网络和Bert网络有效级联,由于模型较小,大大提高了判断药物和靶点匹配度的规模和速度,减少了计算机耗费的计算资源,大大提升了新药研发的效率,为降本增效提供了可能。
附图说明
[0019]为了更清楚地说明本专利技术实施例的技术方案,下面将对本专利技术实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图:
[0020]图1显示为本专利技术一实施例中药物和靶点匹配的判断方法的一应用环境示意图;
[0021]图2显示为本专利技术一实施例中药物和靶点匹配的判断方法的流程示意图;
[0022]图3显示为本专利技术一实施例中获取药物分子矩阵的流程示意图;
[0023]图4显示为本专利技术一实施例中获取第二置信度得分的流程示意图;
[0024]图5显示为本专利技术一实施例中获取药物特征向量的流程示意图;
[0025]图6显示为本专利技术一实施例中第一GNN网络处理过程的流程示意图;
[0026]图7显示为本专利技术一实施例中药物和靶点匹配的判断系统的结构框图;
[0027]图8是本专利技术一实施例中计算机设备的一结构示意图;
[0028]图9是本专利技术一实施例中计算机设备的另一结构示意图。
具体实施方式
[0029]下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0030]本专利技术实施例提供的药物和靶点匹配的判断方法,可应用在如图1的应用环境中,其中,客户端通过网络与服务端进行通信,服务端可以向客户端发送药物与靶点本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种药物和靶点匹配的判断方法,其特征在于,包括:获取药物分子序列和靶点蛋白质序列;将所述药物分子序列和靶点蛋白质序列分别输入至第一模型级联的两个Bert网络中,分别对所述药物分子序列和靶点蛋白质序列进行多模态处理,得到第一置信度得分;其中,所述第一模型用于获取所述药物分子序列和所述靶点蛋白质序列的位置编码关系;将所述药物分子序列和靶点蛋白质序列分别输入至第二模型的双通道GNN网络中,分别对所述药物分子序列和靶点蛋白质序列进行特征提取和特征拼接,得到第二置信度得分;其中,所述第二模型用于获取所述药物分子序列和所述靶点蛋白质序列的关联关系;将所述第一置信度得分和所述第二置信度得分进行加权求和,得到总置信度得分,并在所述总置信度得分大于或等于预设的置信度阈值时,判定药物与靶点匹配。2.根据权利要求1所述的药物和靶点匹配的判断方法,其特征在于,所述将所述药物分子序列和靶点蛋白质序列分别输入至第一模型级联的两个Bert网络中,分别对所述药物分子序列和靶点蛋白质序列进行多模态处理,得到第一置信度得分,包括:将所述药物分子序列输入至所述第一模型的第一Bert网络,编码所述药物分子序列,得到药物分子矩阵;将所述靶点蛋白质序列输入至所述第一模型的第二Bert网络,编码所述靶点蛋白质序列,得到靶点蛋白质矩阵;计算所述药物分子矩阵和所述靶点蛋白质矩阵的L1范数,或所述药物分子矩阵和所述靶点蛋白质矩阵的L2范数,并将所述L1范数或所述L2范数作为第一置信度得分。3.根据权利要求2所述的药物和靶点匹配的判断方法,其特征在于,所述将所述药物分子序列输入至所述第一模型的第一Bert网络,编码所述药物分子序列,得到药物分子矩阵,包括:将所述药物分子序列输入至所述第一Bert网络中,对所述药物分子序列进行特征嵌入,得到药物嵌入矩阵;基于所述药物分子序列中各原子的前后位置关系,对所述药物嵌入矩阵进行位置编码,得到药物编码矩阵;将所述药物嵌入矩阵和所述药物编码矩阵进行特征融合,输出药物分子矩阵。4.根据权利要求1所述的药物和靶点匹配的判断方法,其特征在于,所述将所述药物分子序列和靶点蛋白质序列分别输入至第二模型的双通道GNN网络中,分别对所述药物分子序列和靶点蛋白质序列进行特征提取和特征拼接,得到第二置信度得分,包括:将所述药物分子序列输入至所述第二模型的第一GNN网络,获取药物特征向量;将所述靶点蛋白质序列输入至所述第二模型的第二GNN网络,获取靶点蛋白质特征向量;将所述药物特征向量和所述靶点蛋白质特征向量进行拼接,输入至所述第二模型的全连接层,获取所述药物特征向量和所述靶点蛋白质特征向量的匹配度值,并将所述匹配度值作为第二置信度得分。5.根据权利要求4所述的药物和靶点匹配的判断...

【专利技术属性】
技术研发人员:徐艳丽谷志广郝碧波李春宇李响谢国彤
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1