用于训练机器学习模型以针对显示一个或多个对象的图像产生描述符图像的方法技术

技术编号:44567412 阅读:21 留言:0更新日期:2025-03-11 14:25
根据各种实施方式,描述用于训练机器学习模型以针对显示一个或多个对象的图像产生描述符图像的方法,具有:记录多个摄像机图像,其中每个摄像机图像显示一个或多个对象;由多个摄像机图像构成训练图像对,其中每个训练图像对具有第一训练图像和第二训练图像;从第一训练图像或第一训练图像的变换版本中的关键点的位置与关键点的所估计的位置之间的距离中为训练图像对和至少一个关键点确定损失,所述位置通过从第一训练图像转变到第二训练图像并且转变回第一训练图像或其变换版本来确定;以及适配机器学习模型,用以减少总损失,所述总损包含至少针对训练图像对和关键点的一部分的所确定的损失。

【技术实现步骤摘要】

本公开涉及用于训练机器学习模型以针对显示一个或多个对象的图像产生描述符图像的方法


技术介绍

1、为了使得能够通过机器人灵活地制造或处理对象,值得期望的是,机器人能够操纵对象,而不顾对象放置在机器人的工作空间中的姿势。因此,机器人应该能够识别对象的哪些部分位于哪些位置,使得所述机器人例如可以在正确的部位处抓取对象,以便例如将所述对象紧固或者焊接在另一对象上。这意味着,机器人应该能够例如从通过紧固在机器人处的摄像机记录的一个或多个图像中识别对象的位姿(位置和取向),或者确定用于记录或处理的部位的位置。用于对此进行实现的一种方案在于,为对象的部分(即在图像平面中表示的对象的像素)确定描述符、即预定义的描述符空间中的点(向量),其中机器人被训练用于与对象的当前位姿无关地将相同的描述符指派给对象的相同部分,并且从而识别对象在图像中的拓扑,使得于是例如知道对象的哪个角位于图像中。在知道摄像机的位姿的情况下,于是又可以推断出对象的位姿。可以利用相应地被训练的机器学习模型实现对拓扑的识别。


技术实现思路

>1、用于高效地训练本文档来自技高网...

【技术保护点】

1.一种用于训练机器学习模型(112)以针对显示一个或多个对象(113)的图像产生描述符图像的方法,具有:

2.根据权利要求1所述的方法,其中估计所述第一训练图像或所述第一训练图像的变换版本中的点的位置,其方式是对于所述第一训练图像或所述第一训练图像的变换版本中的多个点中的每一个估计该点对应于机器学习模型(112)将会将所估计的描述符指派给的点的概率,其中概率被估计得越大,所估计的描述符就越接近机器学习模型(112)指派给第一训练图像或第一训练图像的变换版本的多个点中的相应点的描述符,并且该点的位置的每个坐标估计为第一训练图像或第一训练图像的变换版本的多个点的坐标的值的加权和...

【技术特征摘要】

1.一种用于训练机器学习模型(112)以针对显示一个或多个对象(113)的图像产生描述符图像的方法,具有:

2.根据权利要求1所述的方法,其中估计所述第一训练图像或所述第一训练图像的变换版本中的点的位置,其方式是对于所述第一训练图像或所述第一训练图像的变换版本中的多个点中的每一个估计该点对应于机器学习模型(112)将会将所估计的描述符指派给的点的概率,其中概率被估计得越大,所估计的描述符就越接近机器学习模型(112)指派给第一训练图像或第一训练图像的变换版本的多个点中的相应点的描述符,并且该点的位置的每个坐标估计为第一训练图像或第一训练图像的变换版本的多个点的坐标的值的加权和,其中坐标的每个值以对于所述值描述其位置的点确定的概率来加权。

3.根据权利要求1或2所述的方法,其中针对多个关键点中的每一个确定损失所针对的每个训练图像对的总损失作为加权和包含针对所述关键点确定的损失,其中每个所确定的损失越低地被加权,在针对相应的关键点确定损失时机器学习模型(112)将会将所估计的描述符指派给的第一训练图像或第一训练图像的变换版本中的点的位置的估计和/或机器学习模型(112)将会将所估计的描述符指派给的第二训练图像中的点的位置的估计的方...

【专利技术属性】
技术研发人员:D·阿德里安A·G·库普奇克M·斯皮斯
申请(专利权)人:罗伯特·博世有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1