【技术实现步骤摘要】
一种基于场景先验的智能体目标搜索的方法
[0001]本专利技术涉及主动视觉感知领域,尤其是涉及一种基于场景先验的智能体目标搜索的方法。
技术介绍
[0002]近年来,机器人研究领域一直致力于扩大机器人探索环境、了解环境、与环境交互以及与人沟通的能力。传统的导航方法通常使用环境地图进行导航,并将导航任务分为三个步骤:绘制地图、定位和路径规划。这种方法通常需要提前构建3D地图,以及可靠的地图定位和路径跟踪。但是,在某些情况下,人工地标是不可知的,或者机器人处于GPS缺失的环境中,这样自我运动估计或获取场景信息就遭遇很大的困难。很长时间以来,机器人导航问题基本上是通过一系列距离传感器来解决的,比如光线检测和测距,红外辐射,或声纳导航和测距,这些适用于小范围静态环境中(各种距离传感器受限于他们独自的物理属性)。但是,在动态、复杂和大范围环境下,机器人的建图与导航可能面对很多挑战。
[0003]最近,针对各种控制和感知问题的数据驱动机器学习策略的成功为克服以前方法的局限性开辟了一条新途径。这些方法无需构建地图对环境的依赖程度较 ...
【技术保护点】
【技术特征摘要】
1.一种基于场景先验的智能体目标搜索的方法,其特征在于,用于机器人的目标搜索,包括以下步骤:S1:确认目标编码信息和待搜索目标;S2:通过机器人获取待搜索场景的环境图像,根据环境图像构建深度图像矩阵、语义图像矩阵;S3:对环境图像进行对象关系特征分析,识别环境中的物体并确认与待搜索目标关系可能性最大的物体,提取对象关系特征向量;S4:根据深度图像矩阵、语义图像矩阵获取空间语义点云,并根据空间语义点云和环境中的物体信息构建空间语义融合矩阵;S5:根据空间语义融合矩阵获取语义地图特征向量;S6:根据对象关系特征向量、语义地图特征向量及目标编码信息生成融合特征向量;S7:构建目标搜索的价值网络和目标网络,根据融合特征向量对价值网络和目标网络进行训练,完成训练后基于训练好的价值网络进行目标搜索。2.根据权利要求1所述的一种基于场景先验的智能体目标搜索的方法,其特征在于,所述的步骤S2具体包括:S21:通过机器人获取待搜索场景的环境图像,所述的环境图像包括环境的RGB图像和深度图像;S22:将深度图像记作深度图像矩阵;S23:利用预训练好的语义分割网络对环境图像进行计算,生成语义图像矩阵。3.根据权利要求1所述的一种基于场景先验的智能体目标搜索的方法,其特征在于,所述的步骤S3具体包括:S31:获取场景图谱G={V,E},V为图谱节点,表示场景中不同的物体种类,E为图谱边,表示两个类别物体间的位置关系,使用视觉基因组数据集作为来源,根据待搜索场景中出现的所有对象的类别构建知识图,将每一个类别都表示为图中的一个节点,在视觉基因组数据集中对象关系出现频率大于3的两个节点间使用边来链接生成图结构并用二进制邻接矩阵A表示;S32:构建图卷积神经网络,输入为环境图像的RGB图像,输出为空间关系特征,将空间关系特征映射到512维得到对象关系特征向量。4.根据权利要求1所述的一种基于场景先验的智能体目标搜索的方法,其特征在于,所述的步骤S4的具体步骤包括:S41:生成一个(C+2)*(224*224)的全0矩阵,该矩阵代表空间语义融合矩阵M,所述的空间语义融合矩阵含有C+2个图层,其中224*224代表每一个图层的尺寸;S42:考虑机器人的位置和姿态P(x
t
,y
t
,z
t
,θ
t
)生成空间点云;S43:所述的空间点云的尺寸为C*W*L*H,其中C为空间语义点云的通道,每一个通道都代表了一个语义类别,W*L*H则分别为空间语义点云的宽、长、高,在高的维度求和并将三维点云映射到二维上,得到尺寸为C*W*L的二维映射特征图,作为空间语义融合矩阵的前C层;S44:在空间语义融合矩阵的C+1层记录机器人行走的路径,在C+2层中标记与待搜索目标关系可能性最大的物体;S45:实时获取机器人的最新空间点云、路径和与待搜索目标关系可能性最大的物体,
对空间语义融合矩阵进行更新。5.根据权利要求4所述的一种基于场景先验的智能体目标搜索的方法,其特征在于,所述的空间点云的获取方式为:其中,x、y、z分别为点云坐标,f
x<...
【专利技术属性】
技术研发人员:赵怀林,陆升阳,梁兰军,侯煊,
申请(专利权)人:上海应用技术大学,
类型:发明
国别省市:
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。