图谱嵌入系统和装置制造方法及图纸

技术编号:39047950 阅读:8 留言:0更新日期:2023-10-10 12:00
提供了用于生成图谱的嵌入的方法和装置。所述图谱包括多个节点,并且每个节点包括到所述多个节点中的另一个或多个的连接。所述方法包括和/或所述装置被配置为:接收表示所述图谱的至少一部分的数据;将所述图谱的所述节点转换为非欧几里得几何;基于因果损失函数和与所述非欧几里得几何关联的链接预测函数,迭代地更新基于转换后的所述非欧几里得几何中的节点的嵌入模型。节点的嵌入模型。节点的嵌入模型。

【技术实现步骤摘要】
【国外来华专利技术】图谱嵌入系统和装置
[0001]本申请涉及用于将图谱或图谱结构嵌入非欧几里得空间的装置、系统和方法和/或其应用。

技术介绍

[0002]基于观测数据的大规模因果推理在机器学习中越来越重要。传统上,这种实体之间关系的推理依赖于应用于嵌入在潜在欧几里得空间中的知识图谱实体的基于距离的方法。不幸的是,除了假阳性导致错误地归因的直接因果关系之外,当前的方法经常不能完全解释因果关系,或者由于混杂因素和中介因素而漏掉因果关系。
[0003]希望生成克服上述间题的改进的图谱嵌入,用于链接预测或机器学习算法、模型等的更改进的训练和/或输入。
[0004]下面描述的实施例不限于解决上述已知方法的任何或所有缺点的实施方式。

技术实现思路

[0005]提供本
技术实现思路
是为了以简化形式介绍概念的选择,这些概念将在下面的详细描述中进一步描述。本
技术实现思路
并不旨在鉴定所要求保护的主题的关键特征或必要特征,也不旨在用于确定所要求保护的主题的范围;促进本专利技术的实施和/或用于实现基本相似的技术效果的变体和可替代的特征应该被认为落入本文公开的本专利技术的范围。
[0006]提供了用于图谱中的有向链接预测的方法、装置和系统,该图谱包括知识图谱和/或使用非欧几里得几何/空间/流形中的知识图谱嵌入的任何有向图谱,非欧几里得几何/空间/流形例如为但不限于伪黎曼(pseudo

Riemannian)流形。例如,可以使用闵可夫斯基(Minkowski)、反德西特(anti

de Sitter)和/或德西特(de Sitter)时空等。通过在这些几何形状和/或非平凡拓扑结构(例如圆柱形拓扑结构)内嵌入知识图谱,并应用包括链接预测函数(如本文所述的三重费米

狄拉克函数)的特有的损失函数或成本函数,嵌入方法、装置、系统使得算法能够预测有向边、连接或链接,这是因为利用了捕获任何关系的方向性的几何形状的类时间维度。
[0007]在第一方面,本公开提供了一种生成图谱的嵌入的计算机实现的方法,其中,所述图谱包括多个节点,并且每个节点包括到所述多个节点中的另一个或多个的连接,所述方法包括:接收表示所述图谱的至少一部分的数据;将所述图谱的所述节点转换为非欧几里得几何;基于因果损失函数和与所述非欧几里得几何关联的链接预测函数,迭代地更新基于转换后的所述非欧几里得几何中的节点的嵌入模型。
[0008]任选地,第一方面的计算机实现的方法,其中:转换所述图谱的所述节点还包括将所述图谱的所述节点转换为所述非欧几里得几何的坐标;并且其中,所述嵌入模型基于使用所述因果损失函数在节点坐标上操作的非欧几里得随机梯度下降算法。
[0009]作为一种选择,第一方面的计算机实现的方法,其中,更新所述嵌入模型还包括通过至少基于所述嵌入和所述链接预测函数最小化所述因果损失函数来更新节点坐标。
[0010]作为另一种选择,第一方面的计算机实现的方法,还包括迭代地更新所述嵌入模
型,直到确定所述嵌入模型待被训练;已经达到最大迭代次数,和/或直到已经满足所有节点坐标的平均损失阈值;并且输出表示训练后的图谱嵌入的数据。
[0011]作为另一种选择,第一方面的计算机实现的方法,其中,所述图谱是有向图谱。
[0012]作为一种选择,第一方面的计算机实现的方法,其中,所述图谱是循环有向图谱。
[0013]作为一种选择,第一方面的计算机实现的方法,其中,所述图谱是非循环有向图谱。
[0014]作为另一种选择,第一方面的计算机实现的方法,其中,所述非欧几里得几何是伪黎曼几何。
[0015]任选地,第一方面的计算机实现的方法,其中,所述非欧几里得几何是伪黎曼几何或伪黎曼空间。
[0016]作为一种选择,第一方面的计算机实现的方法,其中,所述伪黎曼几何或伪黎曼空间是闵可夫斯基几何或闵可夫斯基空间。
[0017]作为一种选择,第一方面的计算机实现的方法,其中,所述伪黎曼几何或伪黎曼空间是反德西特几何或反德西特空间。
[0018]作为一种选择,第一方面的计算机实现的方法,其中,所述非欧几里得几何或非欧几里得空间是双曲几何或双曲空间。
[0019]任选地,第一方面的计算机实现的方法,其中,所述图谱是包括多个实体节点和多个边/连接/链接的实体

实体图谱,其中每个实体节点通过边/连接/链接连接到另一个实体节点,每个边/连接/链接表示所述每个实体节点与所连接的所述其它实体节点之间的关系。
[0020]作为一种选择,第一方面的计算机实现的方法,其中,所述实体

实体图谱中的实体节点表示来自以下组的任何实体:基因;疾病;化合物/药物;蛋白质;生物实体;途径;生物过程;细胞系;细胞类型;症状;临床试验;任何其它生物医学概念;或与所述实体

实体图谱中的另一实体至少具有实体

实体关系的任何其它实体。
[0021]作为另一种选择,第一方面的计算机实现的方法,还包括:从训练的实体模型输出所述图谱的所述嵌入,以用于下游过程,所述下游过程包括来自以下组中的一个或多个:药物发现;药物优化;和/或用于任何其它ML模型或训练任何其它ML模型以在药物发现或优化过程中预测或分类。
[0022]作为一种选择,第一方面的计算机实现的方法,还包括:基于将表示第一节点和第二节点的数据输入到所述链接预测函数中,预测所述图谱的所述嵌入中的节点或实体节点之间的链接关系;以及从所述链接预测函数接收所述第一节点与所述第二节点之间存在链接关系的可能性的指示。
[0023]在第二方面,本公开提供了一种用于图谱中的链接预测的计算机实现的方法,还包括:生成根据第一方面的任何特征的图谱嵌入;以及从所述图谱嵌入中选择至少第一节点坐标和第二节点坐标;基于向链接预测函数输入所选择的第一节点坐标和第二节点坐标来输出有向链接预测,其中,所述有向链接预测包括所述第一节点坐标与所述第二节点坐标之间存在链接关系的可能性的指示。
[0024]在第三方面,本公开提供了一种用于预测图谱中实体之间的有向关系的计算机实现的方法,还包括:基于根据第一和/或第二方面的任何特征的图谱生成图谱嵌入;以及从
所述图谱嵌入中选择至少第一实体节点坐标和第二实体节点坐标,所述至少第一实体节点坐标和第二实体节点坐标与所述图谱的至少第一实体和第二实体相关联;基于向链接预测函数输入所选择的至少第一实体节点坐标和第二实体节点坐标来输出有向关系预测,其中,所述有向关系预测包括所述至少第一实体节点坐标与第二实体节点坐标之间存在链接关系的可能性的指示。
[0025]作为一种选择,第一、第二和/或第三方面的计算机实现的方法,其中,对于具有时空流形的非欧几里得空间,所述链接预测函数基于费米

狄拉克函数。
[0026]作为一种选择,第一、第二和/或第三方面的计算机实现的方法,其中,所述链接预测函数基于三重费米

狄拉克函数,所述三本文档来自技高网
...

【技术保护点】

【技术特征摘要】
【国外来华专利技术】1.一种生成图谱的嵌入的计算机实现的方法,其中,所述图谱包括多个节点,并且每个节点包括到所述多个节点中的另一个或多个的连接,所述方法包括:接收表示所述图谱的至少一部分的数据;将所述图谱的所述节点转换为非欧几里得几何;基于因果损失函数和与所述非欧几里得几何关联的链接预测函数,迭代地更新基于转换后的所述非欧几里得几何中的节点的嵌入模型。2.根据权利要求1所述的计算机实现的方法,其中:转换所述图谱的所述节点还包括将所述图谱的所述节点转换为所述非欧几里得几何的坐标;以及其中,所述嵌入模型基于使用所述因果损失函数在节点坐标上操作的非欧几里得随机梯度下降算法。3.根据权利要求1或2所述的计算机实现的方法,其中,更新所述嵌入模型还包括通过至少基于所述嵌入和所述链接预测函数最小化所述因果损失函数来更新节点坐标。4.根据权利要求1至3中任一项所述的计算机实现的方法,还包括迭代地更新所述嵌入模型,直到确定所述嵌入模型待被训练;已经达到最大迭代次数,和/或直到已经满足所有节点坐标的平均损失阈值;并且输出表示训练后的图谱嵌入的数据。5.根据前述权利要求中任一项所述的计算机实现的方法,其中,所述图谱是有向图谱。6.根据前述权利要求中任一项所述的计算机实现的方法,其中,所述图谱是循环有向图谱。7.根据权利要求1至5中任一项所述的计算机实现的方法,其中,所述图谱是非循环有向图谱。8.根据前述权利要求中任一项所述的计算机实现的方法,其中,所述非欧几里得几何是伪黎曼几何。9.根据前述权利要求中任一项所述的计算机实现的方法,其中,所述非欧几里得几何是伪黎曼几何或伪黎曼空间。10.根据前述权利要求中任一项所述的计算机实现的方法,其中,所述伪黎曼几何或伪黎曼空间是闵可夫斯基几何或闵可夫斯基空间。11.根据前述权利要求中任一项所述的计算机实现的方法,其中,所述伪黎曼几何或伪黎曼空间是反德西特几何或反德西特空间,或德西特几何或德西特空间。12.根据前述权利要求中任一项所述的计算机实现的方法,其中,所述非欧几里得几何或非欧几里得空间是双曲几何或双曲空间。13.根据前述权利要求中任一项所述的计算机实现的方法,其中,所述图谱是包括多个实体节点和多个连接的实体

实体图谱,其中每个实体节点通过连接连接到其它实体节点,每个连接表示所述每个实体节点与所连接的所述其它实体节点之间的关系。14.根据前述权利要求中任一项所述的计算机实现的方法,其中,所述实体

实体图谱中的实体节点表示来自以下组的任何实体:基因;疾病;化合物/药物;蛋白质;生物实体;途径;生物过程;细胞系;细胞类型;症状;临床试验;任何其它生物医学概念;或与所述实体

实体图谱中的另一实体至少具有实体

实体关系的任何其它实体。15.根据前述权利要求中任一项所述的计算机实现的方法,还包括:从训练的实体模型
输出所述图谱的所述嵌入,以用于下游过程,所述下游过程包括来自以下组中的一个或多个:药物发现;药物优化;和/或用于任何其它ML模型或训练任何其它ML模型以在药物发现或优化过程中预测或分类。16.根据前述权利要求中任一项所述的计算机实现的方法,还包括:基于将表示第一节点和第二节点的数据输入到所述链接预测函数中,预测所述图谱的所述嵌入中的节点或实体节点之间的链接关系;以及从所述链接预测函数接收所述第一节点与所述第二节点之间存在链接关系的可能性的指示。17.一种用于图谱中的链接预测的计算机实现的方法,还包括:生成根据权利要求1至16中任一项所述的图谱嵌入;以及从所述图谱嵌入中选择至少第一节点坐标和第二节点坐标;基于向链接预测函数输入所选择的第一节点坐标和第二节点坐标来输出有向链接预测,其中,所述有向链接预测包括所述第一节点坐标与所述第二节点坐标之间存在链接关系的可能性的指示。18.一种用于预测图谱中实体之间的有向关系的计算机实现的方法,还包括:基于根据权利要求1至17中任一项所述的图谱生成图谱嵌入;以及从所述图谱嵌入中选择至少第一实体节点坐标和第二实体节点坐标,所述至少第一实体节点坐标和第二实体节点坐标与所述图谱的至少第一实体和第二实体相关联;基于向链接预测函数输入所选择的至少第一实体节点坐标和第二实体节点坐标来输出有向关系预测,其中,所述有向关系预测包括所述至少第一实体节点坐标与第二实体节点坐标之间存在链接关系的可能性的指示。19.根据前述权利要求中任一项所述的计算机实现的方法,其中,对于具有时空流形的非欧几里得空间,所述链接预测函数基...

【专利技术属性】
技术研发人员:A
申请(专利权)人:伯耐沃伦人工智能科技有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1