一种基于改进的YOLO6D算法的位姿估计系统及方法技术方案

技术编号：30162087 阅读：22 留言：0更新日期：2021-09-25 15:16

本发明专利技术提供了一种基于改进的YOLO6D算法的位姿估计系统及方法，涉及计算机视觉技术领域。该系统包括视觉传感器、客户端和服务器端。使用该系统的基于改进的YOLO6D算法的位姿估计方法包括如下步骤：采集包含目标物体的原始图像；对包含目标物体的原始图像进行处理得到边缘清晰的目标物体图像；构建YOLO6D模型的训练数据集；对YOLO6D模型进行改进，包括：为对称目标物体和非对称目标物体定义两种不同的损失函数；利用所述训练数据集对改进的YOLO6D模型进行训练，获得位姿估计模型；利用所述姿态估计模型实时估计图像中目标物体的位姿。该系统及方法可提高对称物体的位姿估计准确率、可防止过拟合、降低了对外部设备的性能要求。降低了对外部设备的性能要求。降低了对外部设备的性能要求。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于改进的YOLO6D算法的位姿估计系统及方法

[0001]本专利技术涉及计算机视觉
，特别是涉及一种基于改进的YOLO6D算法的位姿估计系统及方法。

技术介绍

[0002]位姿估计是指利用视觉传感器获取的信息，从中估计目标物体与传感器之间的距离与姿态。它不仅需要对图像中的目标物体进行定位，还需要检测目标物体在三维空间中的旋转自由度。该技术目前主要的应用领域是增强现实领域，随着计算机视觉与地图构建(SLAM)技术的日益发展，基于视觉的位姿估计方法在增强现实系统开发中的应用越来越广泛。
[0003]目前，位姿估计方法主要分为基于关键点与模版匹配的方法和基于深度学习的方法。基于关键点与模版匹配的方法对光线较为敏感，且无法处理物体间有遮挡的问题，对检测环境要求较为苛刻。
[0004]为克服这些位姿估计中存在的问题，应用上主流的是采用基于深度学习的位姿估计方法。基于深度学习的位姿估计一般分为单阶段检测算法和双阶段检测算法两类。双阶段检测虽然检测准确度较高，但受限于检测步骤的多阶段，速度较慢。在增强现实领域对实时性要求较高，因此单阶段检测算法更适用于此领域。单阶段检测算法也被称为基于回归分析的检测算法，其将检测问题视为对目标位置和类别信息的回归分析问题，通过一个神经网络模型可直接输出检测结果。随着单阶段检测算法的发展，目前的单阶段的目标检测算法在保持速度优势的同时，检测精度也达到了双阶段目标检测的水平。
[0005]YOLO6D属于一种基于深度学习的单阶段检测算法，因其具有强大的特征抽象与表达...

【技术保护点】

【技术特征摘要】
1.一种基于改进的YOLO6D算法的位姿估计系统，其特征在于，所述系统包括：视觉传感器，用于实时采集目标物体的图像，并将图像发送给客户端；客户端，用于实时捕获图像并发送给服务器端，以及接收服务器端发送的目标物体位姿估计结果；服务器端，用于构建YOLO6D模型的训练数据集；对YOLO6D模型进行改进；利用所述训练数据集对改进的YOLO6D模型进行训练，获得位姿估计模型；利用所述姿态估计模型实时估计图像中目标物体的位姿，并将目标物体位姿估计结果发送给客户端。2.根据权利要求1所述的基于改进的YOLO6D算法的位姿估计系统，其特征在于，所述视觉传感器是单目摄像机。3.使用权利要求1所述的基于改进的YOLO6D算法的位姿估计系统的基于改进的YOLO6D算法的位姿估计方法，其特征在于，所述方法包括以下步骤：采集包含目标物体的原始图像；对包含目标物体的原始图像进行处理得到边缘清晰的目标物体图像；构建YOLO6D模型的训练数据集；对YOLO6D模型进行改进，包括：为对称目标物体和非对称目标物体定义两种不同的损失函数；利用所述训练数据集对改进的YOLO6D模型进行训练，获得位姿估计模型；利用所述姿态估计模型实时估计图像中目标物体的位姿。4.根据权利要求3所述的基于改进的YOLO6D算法的位姿估计方法，其特征在于，所述构建YOLO6D模型的训练数据集的方法为：对公开的位姿估计数据集进行数据量扩充，获得新的位姿估计数据集；自制虚拟数据集；将新的位姿估计数据集和虚拟数据集进行整合，从整合后的数据集中划分出若干图像作为训练数据集。5.根据权利要求4所述的基于改进的YOLO6D算法的位姿估计方法，其特征在于，所述对公开的位姿估计数据集进行数据量扩充的方法为：根据数据集中提供的掩模提取目标物体的图像像素，做换背景...

【专利技术属性】
技术研发人员：张楚宁，高天寒，江欣蓓，
申请(专利权)人：东北大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人