用于训练机器学习模型以生成描述符图像的装置和方法制造方法及图纸

技术编号：37670183 阅读：11 留言：0更新日期：2023-05-26 04:31

训练机器学习模型生成关于对象的图像的描述符图像的方法，包括：形成图像对，每个都有从不同视角示出对象的第一和第二图像；通过机器学习模型为每个图像对生成关于第一图像的在第一图像中示出的对象的部位分派描述符的第一描述符图像和关于第二图像的在第二图像中示出的对象的部位分派描述符的第二描述符图像；针对每个图像对采样描述符对，其分别有分派给同一部位的第一描述符图像中的z第一描述符和第二描述符图像中的第二描述符；适配机器学习模型以减少损失，对于每个采样的描述符对，损失包含：根据第一和第二描述符间的距离度量的距离与根据第一描述符和出现在采样的描述符对中的第二描述符图像的描述符间的距离度量的所有距离之和的比例。离度量的所有距离之和的比例。离度量的所有距离之和的比例。

全部详细技术资料下载

【技术实现步骤摘要】
用于训练机器学习模型以生成描述符图像的装置和方法

[0001]本公开涉及用于训练机器学习模型以生成关于对象的图像的描述符图像的装置和方法。
现有技术
[0002]为了使机器人能够灵活地制造或加工对象而期望：机器人能够操纵对象，而不管该对象在机器人的工作空间中的放置方位（Stellung）。因此，机器人应该能够识别对象的哪些部分处在哪些位置，从而使机器人可以例如在正确部位抓取到该对象，以便将该对象例如固到另一个对象上，或在当前位置焊接该对象。这意味着，机器人应该能够例如从由固定在机器人上的摄像机所记录的一个或多个图像中识别出对象的姿态（位置和取向），或确定用于拾取或加工的部位的位置。实现此目的的一种方案在于，针对对象的多个部分（即图像平面中表示的对象的像素）确定描述符，即，在预定义描述符空间中的点（向量），其中机器人被训练成，与对象的当前姿态无关地给对象的相同部分分派（zuweisen）相同的描述符，并且因此识别出图像中对象的拓扑，从而例如得知对象的哪个角在图像中处于哪里。在了解摄像机姿态的情况下，则又可以推断出该对象的姿态。拓扑的识别可以通过相应训练的机器学习模型来实现。
[0003]对此的一个例子是在 Peter Florence 等人的出版物“Dense Object Nets: Learning Dense Visual Object Descriptors By and For Robotic Manipulation”（以下简称为“参考文献1”）中描述的密集对象网络。密集对象网络以自监督的方式被训练...

【技术保护点】

【技术特征摘要】
1.一种用于训练机器学习模型以生成关于一个或多个对象的图像的描述符图像的方法，所述方法包括：形成图像对，其中每个图像对具有第一图像和第二图像，所述第一图像和所述第二图像从不同视角示出所述一个或多个对象；通过机器学习模型针对每个图像对生成关于第一图像的第一描述符图像以及关于第二图像的第二描述符图像，其中所述第一描述符图像在所述一个或多个对象的在所述第一图像中示出的部位分派描述符，其中所述第二描述符图像在所述一个或多个对象的在所述第二图像中示出的部位分派描述符；针对每个图像对而采样描述符对，所述描述符对分别具有被分派给同一部位的来自第一描述符图像的第一描述符和来自第二描述符图像的第二描述符；适配机器学习模型以减少如下损失，其中对于每个所采样的描述符对，所述损失包含：根据第一描述符和第二描述符之间的距离度量的距离与根据第一描述符和出现在所采样的描述符对中的第二描述符图像的所述描述符之间的距离度量的所有距离之和的比例，其中所述方法还包括以下步骤：记录摄像机图像中的一个或多个对象；通过增强所述摄像机图像的至少一部分来获得附加图像，以及由所述摄像机图像和所述附加图像形成图像对，其中所述对中的每一个对包括摄像机图像和通过增强获得的摄像机图像，其中所述增强包括下列各项中的一项或多项：改变尺寸和裁剪、透视和仿射扭曲、水平和垂直镜像、旋转、添加模糊、添加颜色噪声和转换为灰度。2.根据权利要求1所述的方法，其中，针对改变尺寸和裁剪、透视和仿射扭曲、水平和垂直镜像、旋转、添加模糊、添加...

【专利技术属性】
技术研发人员：D，
申请(专利权)人：罗伯特，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人