System.ArgumentOutOfRangeException: 索引和长度必须引用该字符串内的位置。 参数名: length 在 System.String.Substring(Int32 startIndex, Int32 length) 在 zhuanliShow.Bind() 吊具位姿的预测方法、装置及电子设备制造方法及图纸_技高网

吊具位姿的预测方法、装置及电子设备制造方法及图纸

技术编号:40743874 阅读:4 留言:0更新日期:2024-03-25 20:02
本发明专利技术提供了一种吊具位姿的预测方法、装置及电子设备,涉及自动化检测的技术领域,该方法包括:获取吊具的像素坐标数据;将像素坐标数据输入至预先训练好的位姿预测模型,通过编码模型的隐藏层输出隐藏状态数据,以及,通过编码模型的输出层输出编码数据;将编码数据输入至解码模型,通过解码模型输出像素坐标数据对应的位姿预测数据;以及,将隐藏状态数据作为初始数据输入至编码模型的隐藏层进行循环输入。本发明专利技术提供的吊具位姿的预测方法、装置及电子设备,编码模型和解码模型为基于LSTM网络构建的循环神经网络,而循环神经网络在预测任务方面,能够泛化各种复杂的工况,进而保证预测的精度,也有助于自动化作业的成功率的提升。

【技术实现步骤摘要】

本专利技术涉及自动化检测的,尤其是涉及一种吊具位姿的预测方法、装置及电子设备


技术介绍

1、近年来,岸桥自动化技术在港口物流领域异军突起,其作为提升作业效率、削减成本和增强操作安全性的重要手段备受瞩目。

2、这一技术的核心在于充分利用多种先进的检测技术与控制技术,以实现对吊具、集装箱、集卡及其他目标的位置、状态及周围环境的准确感知与控制,从而实现自动化抓放箱流程。

3、然而,尽管在检测技术上已能够精确定位当前图像中的吊具目标,但受限于相机捕捉图像、通信传输、算法处理等一系列环节产生的延迟,当前推理出的结果相较于真实世界有一定延迟,这导致检测算法推理出来的吊具位姿无法真正代表真实世界的位姿,存在一定的滞后性,也在一定程度上影响了自动化作业的成功率。


技术实现思路

1、有鉴于此,本专利技术的目的在于提供一种吊具位姿的预测方法、装置及电子设备,以缓解上述技术问题。

2、第一方面,本专利技术实施例提供了一种吊具位姿的预测方法,所述方法包括:获取吊具的像素坐标数据;其中,所述像素坐标数据为检测设备提供的吊具的位姿图像中所包含的数据;且,所述位姿图像为基于时间序列拍摄的图像;将所述像素坐标数据输入至预先训练好的位姿预测模型;其中,所述位姿预测模型包括编码模型和与所述编码模型连接的解码模型;所述编码模型和所述解码模型为基于lstm网络构建的循环神经网络;通过所述编码模型的隐藏层输出所述像素坐标数据对应的隐藏状态数据,以及,通过所述编码模型的输出层输出所述像素坐标数据对应的编码数据;将所述编码数据输入至所述解码模型,通过所述解码模型输出所述像素坐标数据对应的位姿预测数据;以及,响应下一时间序列对应的像素坐标数据输入,将所述隐藏状态数据作为初始数据输入至所述编码模型的隐藏层进行循环输入。

3、结合第一方面,本专利技术实施例提供了第一方面的第一种可能的实施方式,其中,上述位姿预测模型的编码模型包括隐藏层和与该隐藏层连接的输出层,所述编码模型的隐藏层和输出层分别包括与预设数据长度匹配的节点;所述解码模型包括依次连接的输入层、隐藏层和输出层;所述编码模型的隐藏层连接至所述解码模型的隐藏层;所述编码模型的输出层连接至所述解码模型的输入层。

4、结合第一方面的第一种可能的实施方式,本专利技术实施例提供了第一方面的第二种可能的实施方式,其中,上述将所述编码数据输入至所述解码模型,通过所述解码模型输出所述像素坐标数据对应的位姿预测数据的步骤,包括:将所述编码数据输入至所述解码模型的输入层,以及,将所述隐藏状态数据作为所述解码模型的初始数据输入到所述解码模型的隐藏层,通过所述解码模型输出所述像素坐标数据对应的位姿预测数据。

5、结合第一方面的第二种可能的实施方式,本专利技术实施例提供了第一方面的第三种可能的实施方式,其中,上述解码模型的输入层包括与隐藏层的节点连接的query查询节点;且,所述解码模型的输出层中的节点中,除最后一个节点外,其余节点的输出端连接至相邻的下一个所述query查询节点的输入端。

6、结合第一方面的第三种可能的实施方式,本专利技术实施例提供了第一方面的第四种可能的实施方式,其中,上述将所述编码数据输入至所述解码模型的输入层,以及,将所述隐藏状态数据作为所述解码模型的初始数据输入到所述解码模型的隐藏层,通过所述解码模型输出所述像素坐标数据对应的位姿预测数据的步骤,包括:将所述编码数据输入至所述解码模型的首个query查询节点,同时,将所述隐藏状态数据作为所述解码模型的初始数据输入到所述解码模型的隐藏层,以使所述解码模型执行单步预测,输出单步预测结果;将所述单步预测结果输入至下一个所述query查询节点做循环预测,直至最后一个所述query查询节点输出循环预测结果;对每个所述单步预测结果和所述循环预测结果进行输出处理,以输出所述位姿预测数据。

7、结合第一方面的第四种可能的实施方式,本专利技术实施例提供了第一方面的第五种可能的实施方式,其中,上述解码模型的输出层包括与所述解码模型的隐藏层连接的随机失活层,以及与所述随机失活层连接的全连接层,所述全连接层的输出端连接至输出节点。

8、结合第一方面的第五种可能的实施方式,本专利技术实施例提供了第一方面的第六种可能的实施方式,其中,上述对每个所述单步预测结果和所述循环预测结果进行输出处理,以输出所述位姿预测数据的步骤,包括:将每个所述单步预测结果,以及,所述循环预测结果输入至所述随机失活层,通过所述随机失活层以及与所述随机失活层连接的全连接层进行输出处理,以通过所述输出节点输出所述位姿预测数据。

9、第二方面,本专利技术实施例还提供一种吊具位姿的预测装置,所述装置包括:获取模块,用于获取吊具的像素坐标数据;其中,所述像素坐标数据为检测设备提供的吊具的位姿图像中所包含的数据;且,所述位姿图像为基于时间序列拍摄的图像;第一输入模块,用于将所述像素坐标数据输入至预先训练好的位姿预测模型;其中,所述位姿预测模型包括编码模型和与所述编码模型连接的解码模型;所述编码模型和所述解码模型为基于lstm网络构建的循环神经网络;输出模块,用于通过所述编码模型的隐藏层输出所述像素坐标数据对应的隐藏状态数据,以及,通过所述编码模型的输出层输出所述像素坐标数据对应的编码数据;第二输入模块,用于将所述编码数据输入至所述解码模型,通过所述解码模型输出所述像素坐标数据对应的位姿预测数据;以及,响应下一时间序列对应的像素坐标数据输入,将所述隐藏状态数据作为初始数据输入至所述编码模型的隐藏层进行循环输入。

10、第三方面,本专利技术实施例还提供一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述第一方面所述的方法的步骤。

11、第四方面,本专利技术实施例还提供一种计算机可读存储介质,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行上述第一方面所述的方法的步骤。

12、本专利技术实施例带来了以下有益效果:

13、本专利技术实施例提供的吊具位姿的预测方法、装置及电子设备,能够获取吊具的像素坐标数据;然后将像素坐标数据输入至预先训练好的位姿预测模型,通过位姿预测模型的编码模型的隐藏层输出像素坐标数据对应的隐藏状态数据,以及,通过编码模型的输出层输出像素坐标数据对应的编码数据;然后将编码数据输入至解码模型,通过解码模型输出像素坐标数据对应的位姿预测数据;以及,响应下一时间序列对应的像素坐标数据输入,将隐藏状态数据作为初始数据输入至编码模型的隐藏层进行循环输入,且,本专利技术中,位姿预测模型包括的编码模型和解码模型为基于lstm网络构建的循环神经网络,而循环神经网络在预测任务方面,能够泛化各种复杂的工况,同时,在响应下一时间序列对应的像素坐标数据输入时,能够将隐藏状态数据作为初始数据输入至编码模型的隐藏层进行循环输入,可以将吊具从初始到最终的完整轨迹信息传递下来,使后续的编码模型能够编码到更多的历史信息,进而保证预测的本文档来自技高网...

【技术保护点】

1.一种吊具位姿的预测方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述位姿预测模型的编码模型包括隐藏层和与该隐藏层连接的输出层,所述编码模型的隐藏层和输出层分别包括与预设数据长度匹配的节点;

3.根据权利要求2所述的方法,其特征在于,将所述编码数据输入至所述解码模型,通过所述解码模型输出所述像素坐标数据对应的位姿预测数据的步骤,包括:

4.根据权利要求3所述的方法,其特征在于,所述解码模型的输入层包括与隐藏层的节点连接的Query查询节点;

5.根据权利要求4所述的方法,其特征在于,将所述编码数据输入至所述解码模型的输入层,以及,将所述隐藏状态数据作为所述解码模型的初始数据输入到所述解码模型的隐藏层,通过所述解码模型输出所述像素坐标数据对应的位姿预测数据的步骤,包括:

6.根据权利要求5所述的方法,其特征在于,所述解码模型的输出层包括与所述解码模型的隐藏层连接的随机失活层,以及与所述随机失活层连接的全连接层,所述全连接层的输出端连接至输出节点。

7.根据权利要求6所述的方法,其特征在于,对每个所述单步预测结果和所述循环预测结果进行输出处理,以输出所述位姿预测数据的步骤,包括:

8.一种吊具位姿的预测装置,其特征在于,所述装置包括:

9.一种电子设备,包括存储器、处理器及存储在所述存储器上并可在所述处理器上运行的计算机程序,其特征在于,所述处理器执行所述计算机程序时实现上述权利要求1-7任一项所述的方法的步骤。

10.一种计算机可读存储介质,其特征在于,所述计算机可读存储介质上存储有计算机程序,所述计算机程序被处理器运行时执行上述权利要求1-7任一项所述的方法的步骤。

...

【技术特征摘要】

1.一种吊具位姿的预测方法,其特征在于,所述方法包括:

2.根据权利要求1所述的方法,其特征在于,所述位姿预测模型的编码模型包括隐藏层和与该隐藏层连接的输出层,所述编码模型的隐藏层和输出层分别包括与预设数据长度匹配的节点;

3.根据权利要求2所述的方法,其特征在于,将所述编码数据输入至所述解码模型,通过所述解码模型输出所述像素坐标数据对应的位姿预测数据的步骤,包括:

4.根据权利要求3所述的方法,其特征在于,所述解码模型的输入层包括与隐藏层的节点连接的query查询节点;

5.根据权利要求4所述的方法,其特征在于,将所述编码数据输入至所述解码模型的输入层,以及,将所述隐藏状态数据作为所述解码模型的初始数据输入到所述解码模型的隐藏层,通过所述解码模型输出所述像素坐标数据对应的位姿预测数据的步骤,包括:

...

【专利技术属性】
技术研发人员:董欣宇杨庆研郑军
申请(专利权)人:聚时科技上海有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1