本发明专利技术提供一种代谢路径查询方法、装置、设备和存储介质。该方法的一种具体实施方式包括:获取待查询组学数据和待查询实体名称;将上述待查询组学数据映射到预设代谢网络中的实体节点,上述预设代谢网络包括至少两个实体节点,其中,每个实体节点对应有实体节点类型;基于上述预设代谢网络和与上述待查询组学数据映射的各实体节点,生成映射后代谢网络;在上述映射后代谢网络中查询以上述待查询实体名称对应的实体节点为起点的代谢路径。该方法实现了在图数据库中对代谢路径进行查询,并具有良好的准确率和效率。有良好的准确率和效率。有良好的准确率和效率。
【技术实现步骤摘要】
代谢路径查询方法、装置、设备和存储介质
[0001]本专利技术涉及数据查询领域,尤其涉及代谢路径查询方法、装置、设备和存储介质。
技术介绍
[0002]随着计算机技术的发展,建立行之有效的信息系统以充分有效地管理和利用各类信息资源,是进行科学研究和决策管理的前提条件,因此,作为信息系统核心和基础的数据库技术得到越来越广泛的应用。
[0003]在生物医药领域,系统生物学中一大重要任务为对生物化学反应的解析、注释和连接。随着已知生化反应数量的增长,传统研究代谢反应通路的手段逐渐无法满足需求。Human
‑
GEM等基因组规模代谢模型的构建推进了计算生物学对于代谢反应的模拟,但类似模型仍需要大量人工整理和维护,且不同模型之间由于格式规范不统一很难整合分析。此外,近年来基因组学、代谢组学、转录组学等技术手段的发展和数据规模的增长使得多种疾病的早期检测成为可能。因此,开发用于对多组学数据在代谢反应通路上的映射和整合分析,特别是查询代谢路径的方法迫在眉睫。
技术实现思路
[0004]本专利技术提供了一种代谢路径查询方法,可用于解决相关技术中查询效率低、运算时间长的问题。
[0005]第一方面,本专利技术的实施例提供了一种代谢路径查询方法,上述方法包括:获取待查询组学数据和待查询实体名称;将上述待查询组学数据映射到预设代谢网络中的实体节点,上述预设代谢网络包括至少两个实体节点,其中,每个实体节点对应有实体节点类型;基于上述预设代谢网络和与上述待查询组学数据映射的各实体节点,生成映射后代谢网络;在上述映射后代谢网络中查询以上述待查询实体名称对应的实体节点为起点的代谢路径。
[0006]在一些可选的实施方式中,在上述生成映射后代谢网络之后,上述方法还包括:计算上述映射后代谢网络中节点类型为反应节点的实体节点的反应活性水平;以及上述在上述映射后代谢网络中查询以上述待查询实体名称对应的实体节点为起点的代谢路径之后,上述方法还包括:对于查询到的每条代谢路径,执行以下路径评分计算操作:基于该条代谢路径的起始代谢物节点与终止代谢物节点之间的相似度,确定该条代谢路径的第一指标值;基于该条代谢路径中的反应节点对应的反应活性水平,确定该条代谢路径的第二指标值;基于该条代谢路径的路径长度,确定该条代谢路径的第三指标值;按照第一预设权重、第二预设权重和第三预设权重对该条代谢路径的第一指标值、第二指标值和第三指标值进行加权求和,得到该条代谢路径的路径评分。
[0007]在一些可选的实施方式中,上述方法还包括:将查询得到的各代谢路径中路径评分满足预设评分条件的代谢路径确定为查询结果代谢路径;输出各上述查询结果代谢路径。
[0008]在一些可选的实施方式中,上述代谢网络具有节点和节点间的连接关系,其中,多个上述节点之间基于上述预设实体关系有方向地相连,其中,上述节点类型包括:反应节点、通路节点、代谢物节点、基因产物节点、基因产物组节点、基因产物复合体节点、细胞区室节点、引文节点、物种节点、额外信息节点。
[0009]在一些可选的实施方式中,上述计算上述映射后代谢网络中节点类型为反应节点的实体节点的反应活性水平,包括:对于上述映射后代谢网络中每个反应节点,执行以下活性水平计算操作:以该反应节点为根节点,在上述映射后代谢网络中进行深度优先搜索或广度优先搜索,得到搜索路径;确定所得到的各搜索路径所包括的基因产物节点;对于所确定的每个基因产物节点,确定与该基因产物节点对应的来源实体节点,其中,上述映射后代谢网络中存在从与该基因产物节点对应的来源实体节点指向该基因产物节点的连接线,上述来源实体节点为基因产物组节点或者基因产物复合体节点;基于所得到的各来源实体节点的节点数据,按照预设计算规则计算该反应节点对应的活性水平。
[0010]在一些可选的实施方式中,上述待查询实体名称为待查询代谢物实体名称,上述预设实体关系为消耗代谢反应;以及上述在上述映射后代谢网络中查询以上述待查询实体名称对应的实体节点为起点的代谢路径,包括:在上述映射后代谢网络中查询以上述待查询实体名称对应的代谢物实体节点为起点和终点的代谢路径,响应于上述代谢路径查询过程中满足至少一个终止查询条件,结束上述代谢路径查询。
[0011]在一些可选的实施方式中,上述至少一个终止查询条件,包括:代谢路径达到预设长度;代谢路径的当前终点实体节点为代谢物节点,且上述映射后代谢网络中不存在以该当前终点实体节点为起点以反应节点为终点的连接线;代谢路径经过的反应节点或代谢物节点属于预设黑名单实体节点集合。
[0012]第二方面,本专利技术的实施例提供了一种代谢路径查询装置,包括:获取单元,被配置成获取待查询组学数据和待查询实体名称;映射单元,被配置成将上述待查询组学数据映射到预设代谢网络中的实体节点,上述预设代谢网络包括至少两个实体节点;生成单元,被配置成基于上述预设代谢网络和与上述待查询组学数据映射的各实体节点,生成映射后代谢网络;查询单元,被配置成在上述映射后代谢网络中查询以上述待查询实体名称对应的实体节点为起点的代谢路径。
[0013]第三方面,本专利技术的实施例提供了一种电子设备,包括:一个或多个处理器;存储装置,其上存储有一个或多个程序,当上述一个或多个程序被上述一个或多个处理器执行时,使得上述一个或多个处理器实现如第一方面中任一实现方式描述的方法。
[0014]第四方面,本专利技术的实施例提供了一种计算机可读存储介质,其上存储有计算机程序,其中,上述计算机程序被一个或多个处理器执行时实现如第一方面中任一实现方式描述的方法。
[0015]为了提高现有代谢路径查询方法的效果,本专利技术的实施例提供的代谢路径查询方法、装置、电子设备和存储介质,通过将用户传入的多组学数据映射到图数据库的对应节点上,构建代谢网络,在给定代谢物(待查询实体名称)时寻找反应网络中消耗该代谢物的可能路径,首先从给定代谢物节点出发,按照图数据库中的实体关系进行搜索,返回所有可能的消耗该代谢物的反应路径。对于返回的所有可能反应路径,随后按照每条路径中反应活性水平、最终代谢物与起始代谢物结构相似度结构及路径长度在用户给定权重下进行打
分,最终得分最高的路径被返回作为代谢路径结果。该方法实现了在图数据库中对代谢路径进行查询,并具有良好的准确率和效率。
附图说明
[0016]通过阅读参照以下附图所作的对非限制性实施例所作的详细描述,本专利技术的其他特征、目的和优点将会变得更明显。附图仅用于示出具体实施方式的目的,而并不认为是对本专利技术的限制。在附图中:
[0017]图1是本专利技术的一个实施例可以应用于其中的示例性系统架构图。
[0018]图2是根据本专利技术的代谢路径查询方法的一个实施例的流程图。
[0019]图3是根据本专利技术的代谢路径查询装置的一个实施例的结构示意图。
[0020]图4是适于用来实现本专利技术的实施例的电子设备的计算机系统的结构示意图。
具体实施方式
[0021]下面结合附图和实施例对本专利技术作进一步的详细说明。可以本文档来自技高网...
【技术保护点】
【技术特征摘要】
1.一种代谢路径查询方法,所述方法包括:获取待查询组学数据和待查询实体名称;将所述待查询组学数据映射到预设代谢网络中的实体节点,所述预设代谢网络包括至少两个实体节点,其中,每个实体节点对应有实体节点类型;基于所述预设代谢网络和与所述待查询组学数据映射的各实体节点,生成映射后代谢网络;在所述映射后代谢网络中查询以所述待查询实体名称对应的实体节点为起点的代谢路径。2.根据权利要求1所述的方法,在所述生成映射后代谢网络之后,所述方法还包括:计算所述映射后代谢网络中节点类型为反应节点的实体节点的反应活性水平;以及所述在所述映射后代谢网络中查询以所述待查询实体名称对应的实体节点为起点的代谢路径之后,所述方法还包括:对于查询到的每条代谢路径,执行以下路径评分计算操作:基于该条代谢路径的起始代谢物节点与终止代谢物节点之间的相似度,确定该条代谢路径的第一指标值;基于该条代谢路径中的反应节点对应的反应活性水平,确定该条代谢路径的第二指标值;基于该条代谢路径的路径长度,确定该条代谢路径的第三指标值;按照第一预设权重、第二预设权重和第三预设权重对该条代谢路径的第一指标值、第二指标值和第三指标值进行加权求和,得到该条代谢路径的路径评分。3.根据权利要求2所述的方法,其中,所述方法还包括:将查询得到的各代谢路径中路径评分满足预设评分条件的代谢路径确定为查询结果代谢路径;输出各所述查询结果代谢路径。4.根据权利要求1所述的方法,所述代谢网络具有节点和节点间的连接关系,其中,多个所述节点之间基于所述预设实体关系有方向地相连,其中,所述节点类型包括:反应节点、通路节点、代谢物节点、基因产物节点、基因产物组节点、基因产物复合体节点、细胞区室节点、引文节点、物种节点、额外信息节点。5.根据权利要求2所述的方法,所述计算所述映射后代谢网络中节点类型为反应节点的实体节点的反应活性水平,包括:对于所述映射后代谢网络中每个反应节点,执行以下活性水平计算操作:以该反应节点为根节点,在所述映射后代谢网络中进行深度优先搜索或广度优先搜索,得到搜索路径;确定所得到的各搜索路径所...
【专利技术属性】
技术研发人员:周易,高欣,
申请(专利权)人:百图生科苏州智能科技有限公司,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。