一种图像标注方法技术

技术编号：45905556 阅读：12 留言：0更新日期：2025-07-22 21:30

本发明专利技术提供了一种图像标注方法，包括：通过深度相机采集物体的RGB图像和深度图像，并进行预处理；将处理后的深度图像转换为点云数据并配准至对应的RGB图像像素；构建多维度置信度评估模型，融合空间距离、深度方差与时序稳定性特征计算点云数据置信度；为所述物体的二维图像进行标注,得到包含物体空间位置信息的二维提示词。根据本发明专利技术实施例提供的技术方案，解决了视觉语言模型在三维位置识别与理解方面的缺陷，使视觉语言模型能够准确感知复杂场景中物体的距离及其空间关系，显著提升智能机器人在装配操作、目标抓取等任务中的三维空间理解与决策能力。

全部详细技术资料下载

【技术实现步骤摘要】

【】本专利技术属于机器人环境感知领域，涉及一种图像标注方法。

技术介绍

0、
技术介绍

1、近十年来，人工智能技术与机器人技术的深度融合推动了机器人在复杂环境中自主操作能力的显著提升，成为学术界和工业界的研究热点。在机器人智能化发展的过程中，环境感知被视为核心技术环节。高效、精准的环境感知技术不仅能够显著提升机器人在复杂任务中的执行能力，还能增强其与人类及其他设备的协作水平，从而推动智能机器人技术的广泛应用与深入发展。

2、传统的机器人环境感知方法主要包括基于二维图像处理、点云分析以及多源信息融合的策略。这些方法在特定且可控的环境条件下能够实现较高的感知性能。然而，当应用于复杂且动态变化的实际场景时，传统方法往往难以同时满足感知速度与定位精准度的要求。具体而言，基于二维图像的分割方法只能获取平面上的信息，缺乏对场景深度的感知能力，限制了其在三维环境中的应用效果；点云重建技术虽然能够提供丰富的三维空间信息，但在处理动态场景时，其实时处理能力不足，难以实现快速响应。此外，多源信息融合策略通常涉及复杂的计算过程，导致...

【技术保护点】

1.一种图像标注方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述步骤S2对RGB图像进行预处理，获取RGB图像分割区域，包括：

3.根据权利要求1所述的方法，其特征在于，所述步骤S3对深度图像进行预处理，包括：

4.根据权利要求1所述的方法，其特征在于，所述步骤S4中的深度图像反投影变换公式为：

5.根据权利要求1所述的方法，其特征在于，所述步骤S5中的投影配准公式为：

6.根据权利要求1所述的方法，其特征在于，所述步骤S6将每个RGB图像分割区域所包含的多个目标点划分为一个子点云，包括：

7...

【技术特征摘要】

1.一种图像标注方法，其特征在于，包括：

2.根据权利要求1所述的方法，其特征在于，所述步骤s2对rgb图像进行预处理，获取rgb图像分割区域，包括：

3.根据权利要求1所述的方法，其特征在于，所述步骤s3对深度图像进行预处理，包括：

4.根据权利要求1所述的方法，其特征在于，所述步骤s4中的深度图像反投影变换公式为：

5.根据权利要求1所述的方法，其特征在于，所...

【专利技术属性】
技术研发人员：贾庆轩，唐国钦，吕子航，黄泽远，陈钢，王一帆，殷诗航，
申请(专利权)人：北京邮电大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人