System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 检索方法、检索数据的装置、电子设备制造方法及图纸_技高网

检索方法、检索数据的装置、电子设备制造方法及图纸

技术编号:40195325 阅读:12 留言:0更新日期:2024-01-26 23:58
本公开涉及一种检索方法、检索数据的装置、电子设备及计算机可读存储介质。该检索方法包括:获取输入对象对应的图数据,所述图数据中的各节点对应的节点数据包括所述节点在三维空间中的位置信息;利用图编码器对图数据进行编码,以获取用于表征图数据的三维空间结构和节点特征中的至少一项的数据序列;以及在图数据库中检索与用于表征所述图数据的数据序列相似的数据序列,并基于检索到的数据序列确定与所述输入对象相似的输出对象。本公开利用图编码器对具有三维空间结构的输入对象关联的图数据进行编码,并生成了足够准确的数据序列,从而能够在图数据库中准确的检测出在三维结构和/或节点特性上与输入对象相似的输出对象。

【技术实现步骤摘要】

本公开涉及人工智能服务领域和云领域,更具体地涉及一种检索方法、检索数据的装置、电子设备及计算机可读存储介质。


技术介绍

1、随着人工智能技术的快速发展,它在药物研发领域展现出巨大应用前景和发展潜力。基于深度学习的人工智能算法,能够对海量的生命科学数据进行高效分析,实现对蛋白质序列和结构的准确建模和预测。这为药物发现提供了强有力的技术支撑。例如,在药物筛选中,人工智能可以快速比对数以万计的化合物库,找到与疾病相关靶点结合更紧密的潜在药物分子。这极大缩短了新药研发周期。另外,人工智能还可用于分析病毒蛋白变异,预测变异对药效的影响,并据此设计出对新的病毒株同样有效的药物。未来人工智能在新药研发中的应用空间还将不断扩大,并完成从药物设计、药效预测、到临床试验设计等全流程的智能化协助。

2、在目前的基于人工智能的新药研发中,仍存在一些技术瓶颈有待突破。首先,现有的基于人工智能的药物发现模型的预测准确度不高,无法有效筛选出有效的候选化合物。其次,大部分的基于人工智能药物发现模型的结构复杂,在运算过程中需要大量计算资源支撑,训练和预测的速度较慢,效率太低。此外,目前还缺少一个集成化的在线药物发现平台,研发人员难以直接在线上直接对药物(尤其是具有复杂蛋白质结构的药物)进行搜索并获得可视化的结果,从而对研发人员造成不便。

3、因此,需要对相关技术进行进一步地改进。


技术实现思路

1、本公开实施例提供了一种检索方法、检索数据的装置、电子设备及计算机可读存储介质。

2、本公开实施例提供了一种检索方法,用于在图数据库中检索输入对象,所述检索方法包括:获取输入对象对应的图数据,所述图数据中的各节点对应的节点数据包括所述节点在三维空间中的位置信息;利用图编码器对图数据进行编码,以获取用于表征图数据的三维空间结构和节点特征中的至少一项的数据序列;以及在所述图数据库中检索与用于表征所述图数据的数据序列相似的数据序列,并基于检索到的数据序列确定与所述输入对象相似的输出对象。

3、本公开实施例提供了一种检索数据的装置,用于在图数据库中检索输入对象,所述装置包括:图数据建构模块,被配置为:获取输入对象对应的图数据,所述图数据中的各节点对应的节点数据包括所述节点在三维空间中的位置信息;编码模块,被配置为:利用图编码器对图数据进行编码,以获取用于表征图数据的三维空间结构和节点特征中的至少一项的数据序列;以及比对模块,被配置为:在所述图数据库中检索与用于表征所述图数据的数据序列相似的数据序列,并基于检索到的数据序列确定与所述输入对象相似的输出对象。

4、本公开实施例公开了一种电子设备,包括:一个或多个处理器;和一个或多个存储器,其中,所述存储器中存储有计算机可执行程序,当由所述处理器执行所述计算机可执行程序时,执行上述的方法。

5、本公开实施例提供了一种计算机可读存储介质,其上存储有计算机指令,该计算机指令被处理器执行时实现上述方法。

6、根据本公开的另一方面,提供了一种计算机程序产品或计算机程序,该计算机程序产品或计算机程序包括计算机指令,该计算机指令存储在计算机可读存储介质中。计算机设备的处理器从计算机可读介质读取该计算机指令,处理器执行该计算机指令,使得该计算机设备执行上述各个方面或者上述各个方面的各种可选实现方式中提供的方法。

7、本公开实施例利用图编码器对具有三维空间结构的输入对象关联的图数据进行编码,并生成了足够准确的数据序列,从而能够在图数据库中准确的检测出在三维结构和/或节点特性上与输入对象相似的输出对象。

8、尤其在生命科学数据分析领域,根据本公开的实施例利用等变量子化编码器对蛋白质结构进行编码,以生成足够准确的用于表征复杂蛋白质结构的序列,以准确地检索出与输入蛋白质在结构上最相似的候选蛋白质。此外,在本公开的一些实施例中,可以基于序列比较来进行蛋白质的检索,进而提高检索效率。此外,本公开的一些实施例还提出了一种能够对该检索模型进行训练的方案。本公开的这些实施例至少部分地基于氨基酸预测损失和坐标对齐损失,来对检索模型进行训练,得到了精度更高、性能更好的检索模型。

本文档来自技高网...

【技术保护点】

1.一种检索方法,用于在图数据库中检索输入对象,所述检索方法包括:

2.如权利要求1所述的检索方法,其中,所述输入对象具有在三维空间中的三个维度上排布的多个内部组件,所述输入对象对应的图数据中的每个节点对应于所述输入对象的一个或多个内部组件,所述每个节点对应的节点数据还包括用于标识所述输入对象中一个或多个内部组件的标识数据,所述输入对象对应的图数据中的每个边数据用于表示该输入对象中的两个内部组件之间的关联关系。

3.如权利要求1所述的检索方法,其中,所述输入对象对应的图数据满足旋转等变性、平移等变性和缩放等变性中的至少一项。

4.如权利要求1所述的检索方法,其中,所述输入对象为蛋白质,所述获取输入对象对应的图数据包括:

5.如权利要求4所述的检索方法,其中,所述基于所述图数据中的各个节点的节点数据,确定所述图数据中的各条边数据包括:

6.如权利要求1所述的检索方法,其中,所述图编码器包括等变图神经网络和离散化器,所述利用图编码器对图数据进行编码包括:

7.如权利要求6所述的方法,其中,所述等变图神经网络包括多个隐藏层或感知器,每个隐藏层或感知器均对每个节点的节点特征向量和位置特征向量进行编码,其中,除第一个隐藏层或感知器以外的每个隐藏层或感知器的编码包括:

8.如权利要求7所述的方法,其中,所述基于所述节点特征向量和位置特征向量,确定所述第二节点对于所述第一节点的传播消息包括:

9.如权利要求8所述的方法,其中,所述第一节点与多个所述第二节点相邻,所述基于所述传播消息,确定所述隐藏层或感知器编码的节点特征向量包括:

10.如权利要求8所述的方法,其中,所述第一节点与多个所述第二节点相邻,所述基于所述传播消息,确定所述隐藏层或感知器编码的位置特征向量包括:

11.如权利要求1所述的方法,其中,所述在图数据库中检索与用于表征所述图数据的数据序列相似的数据序列包括:

12.如权利要求1所述的方法,其中,所述图编码器的训练包括:

13.如权利要求4所述的方法,其中,利用图解码器来辅助所述图编码器的训练,其中,所述图编码器的训练包括:

14.一种检索数据的装置,用于在图数据库中检索输入对象,所述装置包括:

15.一种电子设备,包括:

16.一种计算机可读存储介质,其上存储有计算机指令,所述计算机指令被处理器执行时实现如权利要求1-13中的任一项所述的方法。

...

【技术特征摘要】

1.一种检索方法,用于在图数据库中检索输入对象,所述检索方法包括:

2.如权利要求1所述的检索方法,其中,所述输入对象具有在三维空间中的三个维度上排布的多个内部组件,所述输入对象对应的图数据中的每个节点对应于所述输入对象的一个或多个内部组件,所述每个节点对应的节点数据还包括用于标识所述输入对象中一个或多个内部组件的标识数据,所述输入对象对应的图数据中的每个边数据用于表示该输入对象中的两个内部组件之间的关联关系。

3.如权利要求1所述的检索方法,其中,所述输入对象对应的图数据满足旋转等变性、平移等变性和缩放等变性中的至少一项。

4.如权利要求1所述的检索方法,其中,所述输入对象为蛋白质,所述获取输入对象对应的图数据包括:

5.如权利要求4所述的检索方法,其中,所述基于所述图数据中的各个节点的节点数据,确定所述图数据中的各条边数据包括:

6.如权利要求1所述的检索方法,其中,所述图编码器包括等变图神经网络和离散化器,所述利用图编码器对图数据进行编码包括:

7.如权利要求6所述的方法,其中,所述等变图神经网络包括多个隐藏层或感知器,每个隐藏层或感知器均对每个节点的节点特征向量和位置特征向量进行编码,...

【专利技术属性】
技术研发人员:荣鈺吴黎明吴凡迪黄文炳
申请(专利权)人:腾讯科技深圳有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1