一种场景图构建方法、目标检索方法和相关装置制造方法及图纸

技术编号:46373331 阅读:5 留言:0更新日期:2025-09-15 12:51
本申请公开了一种场景图构建方法、目标检索方法和相关装置,包括:构建拓扑节点集合和拓扑边集合;对于拓扑节点集合中的每个拓扑节点,将该拓扑节点的视觉信息、文本信息和空间位置信息的集合,作为该拓扑节点的多模态数据;对于拓扑节点集合中的每个拓扑节点,基于该拓扑节点的视觉信息,确定该拓扑节点对应的物体节点的多模态数据和该拓扑节点对应的连接边集合;基于每个拓扑节点的多模态数据、每个物体节点的多模态数据、拓扑边集合和每个拓扑节点对应的连接边集合,构建目标场景图。该目标场景图具备语义一致性与空间连续性,显著提升场景图在复杂环境中的表达能力与跨场景的泛化性能。

【技术实现步骤摘要】

本申请涉及具身智能环境感知领域,特别是涉及一种场景图构建方法、目标检索方法和相关装置


技术介绍

1、具体智能领域中的场景图作为表达室内环境结构的信息载体,为物体定位、具身问答和目标导航等下游任务提供有效支持,使得智能体可以在缺少明确任务经验时,依据多模态感知输入和上下文线索做出合理决策。

2、但是,传统方案中常用场景图存在多种问题。例如,“楼房-房间-物体”结构的树状场景图中的房间节点,通常被赋予一个抽象的语义标签并聚合大量的物体节点,导致房间层次的语义特征复杂且混乱、显著特征与表达能力被削弱;物体节点之间的边通常缺乏对邻近性和可见性等空间关系的显示建模;单个物体节点缺乏有效的上下文交互机制,使得树状场景图存在语义表达混乱和层级脱节的问题。

3、又例如,传统方案中的场景图通常采用独立构建的、缺乏语义关联的拓扑图表示环境的空间可达性,导致场景图中的可导航路径点不能提供周围环境的完整语义,限制了智能体对局部细节的理解能力;如果观测信息仅包含语义信息而缺乏拓扑结构,智能体就无法捕捉完整的空间连通性,使得智能体的空间推理与规划能力降低,导本文档来自技高网...

【技术保护点】

1.一种场景图构建方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述对于所述拓扑节点集合中的每个拓扑节点,基于该拓扑节点的视觉信息,确定该拓扑节点对应的物体节点的多模态数据和该拓扑节点对应的连接边集合,包括:

3.根据权利要求2所述的方法,其特征在于,所述方法还包括:

4.根据权利要求1所述的方法,其特征在于,所述基于场景结构数据,构建拓扑节点集合和拓扑边集合,包括:

5.一种目标检索方法,其特征在于,所述方法包括:

6.根据权利要求5所述的方法,其特征在于,所述从所述语义环境数据库中确定与所述目标...

【技术特征摘要】

1.一种场景图构建方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述对于所述拓扑节点集合中的每个拓扑节点,基于该拓扑节点的视觉信息,确定该拓扑节点对应的物体节点的多模态数据和该拓扑节点对应的连接边集合,包括:

3.根据权利要求2所述的方法,其特征在于,所述方法还包括:

4.根据权利要求1所述的方法,其特征在于,所述基于场景结构数据,构建拓扑节点集合和拓扑边集合,包括:

5.一种目标检索方法,其特征在于,所述方法包括:

6.根据权利要...

【专利技术属性】
技术研发人员:马锐飞许一凡张超于魁飞
申请(专利权)人:北京数原数字化城市研究中心
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1