一种药物-疾病-靶点三元组靶点实体补全方法及应用技术

技术编号:36221956 阅读:16 留言:0更新日期:2023-01-04 12:20
本发明专利技术提供了一种药物

【技术实现步骤摘要】
一种药物

疾病

靶点三元组靶点实体补全方法及应用


[0001]本专利技术涉及生物医学以及人工智能领域,尤其涉及一种药物

疾病

靶点三元组靶点实体补全方法及应用。

技术介绍

[0002]近几年,有越来越多的生物医学数据库被开发出来,这些数据库一般包含许多异构的生物网络,生物网络通常包含许多药物、靶点和疾病实体之间的复杂关系,这些数据为大规模的,基于网络嵌入机器学习的,这些实体之间未知关系的探索提供了可能。然而,现有的大多数方法主要捕捉了药物、靶点和疾病这三种实体中两种之间的关系。更重要的是,这些方法忽略了由这些实体组成的异构网络中所隐含的多关系层次拓扑信息,通过捕捉这些信息可能会对探索这些实体间的关系有所帮助。
[0003]现有技术通常在欧式空间中分析异构药物

疾病

靶点网络中实体间的关系,例如,罗等人收集了包含药物

疾病

靶点关联的数据集DTINet,然后使用网络扩散算法和归纳矩阵补全策略去推断未知的药物和靶点间的相互作用(Luo Y,Zhao X,Zhou J,et al;2017)。陈等人使用基于网络嵌入的候选排名算法将基因,疾病及它们相关的本体数据映射到同一向量空间,用以筛选高置信疾病

基因对(Chen J,Althagafi A,Hoehndorf R.,2021)。Moon等人从基于DTINet建立的异构网络中提取药物r/>‑
疾病

靶点三元组,然后提出了基于欧式平移的知识图谱三元组补全方法DDTE来建立候选靶点与给定药物和疾病之间的关系(Moon C,Jin C,Dong X,et al.2021)。然而,这些方法背后的异构网络会包含隐式的层级结构,这些层级结构被嵌入进复杂的生物和化学实体间的交互关系中,而这些重要的关系很难被基于欧式空间的图学习(网络嵌入)方法所捕捉。
[0004]因此,现有技术还有待于改进和发展。

技术实现思路

[0005]鉴于上述现有技术的不足,本专利技术的目的在于提供一种药物

疾病

靶点三元组靶点实体补全方法及应用,旨在解决现有欧式空间中,基于药物

疾病

靶点异构网络,给定药物和疾病以推断靶点的方法无法有效利用异构网络中隐式层级结构的问题。
[0006]本专利技术的技术方案如下:
[0007]一种药物

疾病

靶点三元组靶点实体补全方法,其中,包括步骤:
[0008]构建具有药物

疾病

靶点实体的异构网络,并为所述异构网络中的药物和靶点实体搜集特征数据;
[0009]将构建的所述异构网络根据三元组生成逻辑拆分成药物

疾病

靶点三元组集合;
[0010]使用双曲药物和靶点编码器分别对搜集到的所述异构网络中的药物和靶点实体所对应的特征数据进行编码,生成双曲药物嵌入查找表和双曲靶点嵌入查找表;
[0011]将所述药物

疾病

靶点三元组以及所述双曲药物嵌入查找表、双曲靶点嵌入查找表和疾病编号送入双曲三元组解码器,计算每个三元组中靶点实体嵌入与药物

疾病组合
表示的洛伦兹距离相似度,用以训练模型;
[0012]将待测的药物

疾病组合表示以及所有候选靶点的双曲嵌入送入双曲三元组解码器,以获得待测的药物和疾病的候选靶点的概率排序。
[0013]所述的药物

疾病

靶点三元组靶点实体补全方法,其中,所述构建具有药物

疾病

靶点实体的异构网络具体步骤为:利用已知数据构建药物

疾病

靶点的异构网络,其中,所述已知数据中药物、疾病、靶点实体作为所述异构网络的节点,实体之间的已知关系作为所述异构网络节点之间的边。
[0014]所述的药物

疾病

靶点三元组靶点实体补全方法,其中,为所述异构网络中的药物实体搜集半径为3的摩根扩展连接指纹特征数据,靶点实体搜集氨基酸序列相似度特征数据以及基因本体

蛋白质相互作用网络特征数据。
[0015]所述的药物

疾病

靶点三元组靶点实体补全方法,其中,所述三元组生成逻辑为:将所述药物、疾病、靶点实体之间的已知关系作为所述药物

疾病

靶点网络之间的边,若一组药物、疾病、靶点实体之间均具有边,便构成一个药物

疾病

靶点三元组。
[0016]所述的药物

疾病

靶点三元组靶点实体补全方法,其中,根据所述三元组生成逻辑,将药物

疾病

靶点异构网络拆分成包含原始网络隐含层次信息的三元组集。
[0017]所述的药物

疾病

靶点三元组靶点实体补全方法,其中,所述方法基于双曲空间,所述双曲空间为洛伦兹空间,所述双曲药物和靶点编码器以及所述双曲三元组解码器均工作在一个具有恒定负曲率的洛伦兹空间上。
[0018]所述的药物

疾病

靶点三元组靶点实体补全方法,其中,在所述洛伦兹空间上定义一个完全洛伦兹线性转换层,作为欧式空间中线性转换层的对应;通过所述完全洛伦兹线性转换层,改变双曲空间中特征/坐标的维度或位置,同时保证输入和输入仍保留在所述双曲空间上。
[0019]所述的药物

疾病

靶点三元组靶点实体补全方法,其中,所述完全洛伦兹线性转换层的公式为:
[0020][0021]其中,λ是一个固定超参数,用于控制运算过程中的数值尺度大小;σ是Sigmoid激活函数;和是层内转换矩阵的权重;b是可训练偏置;∈是一个固定值,用于保证大于0;c是洛伦兹空间的负曲率;x和y分别是所述完全洛伦兹线性转换层的输入和输出。
[0022]所述的药物

疾病

靶点三元组靶点实体补全方法,其中,模型完成训练以后,针对待测的药物

疾病组合,获取需要与之匹配的候选靶点所对应的双曲嵌入、组合中药物的双曲嵌入以及对应的疾病编号,并将上述信息送入双曲三元组解码器,获得每个候选靶点的相似度概率分数。
[0023]一种药物

疾病

靶点三元组靶点实体补全方法的应用,其中,将如上任一所述的药物

疾病

靶点本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种药物

疾病

靶点三元组靶点实体补全方法,其特征在于,包括步骤:构建具有药物

疾病

靶点实体的异构网络,并为所述异构网络中的药物和靶点实体搜集特征数据;将构建的所述异构网络根据三元组生成逻辑拆分成药物

疾病

靶点三元组集合;使用双曲药物和靶点编码器分别对搜集到的所述异构网络中的药物和靶点实体所对应的特征数据进行编码,生成双曲药物嵌入查找表和双曲靶点嵌入查找表;将所述药物

疾病

靶点三元组以及所述双曲药物嵌入查找表、双曲靶点嵌入查找表和疾病编号送入双曲三元组解码器,计算每个三元组中靶点实体嵌入与药物

疾病组合表示的洛伦兹距离相似度,用以训练模型;将待测的药物

疾病组合表示以及所有候选靶点的双曲嵌入送入双曲三元组解码器,以获得待测的药物和疾病的候选靶点的概率排序。2.根据权利要求1所述的药物

疾病

靶点三元组靶点实体补全方法,其特征在于,所述构建具有药物

疾病

靶点实体的异构网络具体步骤为:利用已知数据构建药物

疾病

靶点的异构网络,其中,所述已知数据中药物、疾病、靶点实体作为所述异构网络的节点,实体之间的已知关系作为所述异构网络节点之间的边。3.根据权利要求1所述的药物

疾病

靶点三元组靶点实体补全方法,其特征在于,为所述异构网络中的药物实体搜集半径为3的摩根扩展连接指纹特征数据,靶点实体搜集氨基酸序列相似度特征数据以及基因本体

蛋白质相互作用网络特征数据。4.根据权利要求1所述的药物

疾病

靶点三元组靶点实体补全方法,其特征在于,所述三元组生成逻辑为:将所述药物、疾病、靶点实体之间的已知关系作为所述药物

疾病

靶点网络之间的边,若一组药物、疾病、靶点实体之间均具有边,便构成...

【专利技术属性】
技术研发人员:岳杨雷皇书石玮琳石远平张芳育
申请(专利权)人:重庆康洲大数据集团有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1