一种基于自然语言指令的三维点云场景目标定位方法技术

技术编号：41819904 阅读：19 留言：0更新日期：2024-06-24 20:35

本发明专利技术涉及人工智能与计算机视觉领域，提供了一种基于自然语言指令的三维点云场景目标定位方法，包括：筛选出包含三维视觉场景中物体类别的关系三元组；确定物体类别的层级属性，构建层次化知识图谱；对给定的自然语言描述进行解析，获得多个两阶语义三元组；对两阶语义三元组中的物体增加层级属性，获得层次化两阶语义三元组；确定待识别三维点云场景中物体的初始视觉特征；输出物体的预测得分；从高到低筛选出多个预测得分对应的物体，作为候选物体；输出候选物体与第一高阶语义三元组的匹配得分；确定待识别三维点云场景中的目标物体。本发明专利技术提高了预测精度，且具有更强的鲁棒性。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及人工智能与计算机视觉领域，具体涉及一种基于自然语言指令的三维点云场景目标定位方法。

技术介绍

1、近年来，随着智能机器人和现实场景人机交互的蓬勃发展，基于自然语言描述的三维点云场景内目标定位研究越来越受到人们的关注。人类通过自然语言的方式对移动机器人发出指令，移动机器人根据自然语言描述信息在所处的三维场景中定位出目标物体，将大幅度提升移动机器人的智能化水平。

2、目前基于自然语言描述的三维点云场景内目标定位存在如何降低模型过度依赖目标物体标签、如何抽象出自由式语言描述关系特征、如何跨模态地对自然语言和三维点云信息进行融合处理等问题。目前基于文本语言描述引导的三维点云目标检测方法仍然高度依赖目标物体标签，然而这些标签数据不仅昂贵而且还需要耗费大量的人工标注时间；此外目前的方法没有将复杂无规则的自然语言抽象到一个清晰的结构中，并且将结构中的自然语言特征与三维点云场景进行细粒度的跨模态特征对齐。上述不足均限制了三维目标定位精度，制约了移动机器人以更智能的方式理解人类自然语言并执行相应的后续任务。

>技术实现思路本文档来自技高网...

【技术保护点】

1.一种基于自然语言指令的三维点云场景目标定位方法，其特征在于，包括：
2.如权利要求1所述的一种基于自然语言指令的三维点云场景目标定位方法，其特征在于，所述将所述初始视觉特征以及所述第一低阶语义三元组输入构建好的多级注意力模型，输出所述物体的预测得分包括：
3.如权利要求2所述的一种基于自然语言指令的三维点云场景目标定位方法，其特征在于，所述多级注意力模型的训练包括：
4.如权利要求3所述的一种基于自然语言指令的三维点云场景目标定位方法，其特征在于，所述根据正样本生成多个视觉负样本以及多个语言负样本包括：
5.如权利要求1所述的一种基于自...

【技术特征摘要】

1.一种基于自然语言指令的三维点云场景目标定位方法，其特征在于，包括：
2.如权利要求1所述的一种基于自然语言指令的三维点云场景目标定位方法，其特征在于，所述将所述初始视觉特征以及所述第一低阶语义三元组输入构建好的多级注意力模型，输出所述物体的预测得分包括：
3.如权利要求2所述的一种基于自然语言指令的三维点云场景目标定位方法，其特征在于，所述多级注意力模型的训练包括：
4.如权利要求3所述的一种基于自然语言指令的三维点云场景目标定位方法，其特征在于，所述根据正样本生成多个视觉负样本以及多个语言负样本包括：
5.如权利要求1所述的一种基于自然语言指令的三维点云场景目标定位方法，其特征在于，所述将所述候选物体以及所述第一高阶语义三元组输入训练好的高阶语义三元组对齐网络，输出所述候选物体与所述第一高阶语义三元组的匹配得分包括：
6....

【专利技术属性】
技术研发人员：冯明涛，程嘉明，董伟生，吴成中，王耀南，张亮，
申请(专利权)人：西安电子科技大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人

上一篇：一种茶叶加工工艺做青用摇青装置制造方法及图纸
下一篇：一种抗重螺栓预紧力调节专用扳手制造技术

相关技术

一种基于分压器结构的TSV键合后检测...

联合频率-相位-线性调频的高频SSV...

一种抗共谋的隐私保护数据训练方法及数...

一种基于导波结构的宽带2-bits可...

一种基于分布式目标的火星电离层探测S...

基于MSVL语言的C++标准I/O库...

基于高效视觉状态空间解码的医学图像分...

一种结构强度试验中疲劳裂纹自动分割与...

一种支持公开验证输入的私有集合交集基...

一种宽频带多极化可编程反射阵天线制造...

网友询问留言已有0条评论

还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1

发布您的意见

相关领域技术

基于摄影信息的爆破参数优化方法、装置...

一种轻量化的疲劳驾驶检测跟踪方法技术

图像融合系统、方法、装置、设备、介质...

一种用于激活函数量化后的多段非线性查...

一种基于人工智能的云值守智能决策系统...

一种支持非连续构式提取的自动学习方法...

基于手机信令大数据的城市群组合出行链...

一种互联网信息数据安全保障装置制造方...