一种操作命令生成方法、装置及电子设备和存储介质制造方法及图纸

技术编号：25087889 阅读：17 留言：0更新日期：2020-07-31 23:32

本申请公开了一种操作命令生成方法、装置及一种电子设备和计算机可读存储介质，该方法包括：获取训练集；其中，所述训练集包括多个标注操作命令的视频段，所述操作命令包括操作者的手部、主体对象、动作和受体对象；提取每个所述视频段的RGB特征和光流特征，并对所述RGB特征和所述光流特征进行融合得到融合特征；基于每个所述视频段对应的融合特征和标注的操作命令训练LSTM网络，以便利用训练完成的LSTM网络输出目标视频段对应的操作命令。本申请提供的操作命令生成方法，提高了生成操作命令的效率和准确度。

全部详细技术资料下载

【技术实现步骤摘要】
一种操作命令生成方法、装置及电子设备和存储介质
本申请涉及机器人
，更具体地说，涉及一种操作命令生成方法、装置及一种电子设备和一种计算机可读存储介质。
技术介绍
从视频中学习操作是机器人获得新技能的一种重要方式。在相关技术中，利用基于语法的解析器对原始视频进行解析，首先将原始视频分解为原子命令，以识别其中的动作、主体对象和受体对象，并组合为初始命令。其次，从现实环境中，通过计算主体对象和受体对象与机器人之间的最小实际欧氏距离决定使用左手还是右手。最后，根据预定义的命令序列语法，解析器可以组合原子命令来生成用于机器人的通用命令。在上述方案中，需要设计和训练多个复杂的网络，例如动作识别网络、物体分类网络、主体对象分类网络和受体对象分类网络等。而组成操作命令的手部(左手或右手)并不能直接通过视频中的信息进行学习，效率和准确度较低。因此，如何提高生成操作命令的效率和准确度是本领域技术人员需要解决的技术问题。
技术实现思路
本申请的目的在于提供一种操作命令生成方法、装置及一种电子设备和一种计算机可读存储介质，提高了生成操作命令的效率和准确度。为实现上述目的，本申请提供了一种操作命令生成方法，包括：获取训练集；其中，所述训练集包括多个标注操作命令的视频段，所述操作命令包括操作者的手部、主体对象、动作和受体对象；提取每个所述视频段的RGB特征和光流特征，并对所述RGB特征和所述光流特征进行融合得到融合特征；基于每个所述视频段对应的融合特征和标注的操作命令训练...

【技术保护点】
1.一种操作命令生成方法，其特征在于，包括：/n获取训练集；其中，所述训练集包括多个标注操作命令的视频段，所述操作命令包括操作者的手部、主体对象、动作和受体对象；/n提取每个所述视频段的RGB特征和光流特征，并对所述RGB特征和所述光流特征进行融合得到融合特征；/n基于每个所述视频段对应的融合特征和标注的操作命令训练LSTM网络，以便利用训练完成的LSTM网络输出目标视频段对应的操作命令。/n

【技术特征摘要】
1.一种操作命令生成方法，其特征在于，包括：
获取训练集；其中，所述训练集包括多个标注操作命令的视频段，所述操作命令包括操作者的手部、主体对象、动作和受体对象；
提取每个所述视频段的RGB特征和光流特征，并对所述RGB特征和所述光流特征进行融合得到融合特征；
基于每个所述视频段对应的融合特征和标注的操作命令训练LSTM网络，以便利用训练完成的LSTM网络输出目标视频段对应的操作命令。

2.根据权利要求1所述操作命令生成方法，其特征在于，所述提取每个所述视频段的RGB特征和光流特征，包括：
利用opencv工具箱从每个所述视频段中抽取RGB图像和光流图像；
利用双流3D卷积神经网络从每个所述RGB图像中提取每个所述视频段的所述RGB特征、从每个所述光流图像中提取每个所述视频段的所述光流特征。

3.根据权利要求1所述操作命令生成方法，其特征在于，对所述RGB特征和所述光流特征进行融合得到融合特征，包括：
对所述RGB特征和所述光流特征进行向量拼接得到所述融合特征。

4.根据权利要求1至3中任一项所述操作命令生成方法，其特征在于，所述训练完成的LSTM网络包括第一LSTM层、第二LSTM层和softmax层；
所述第一LSTM层的输入包括所述目标视频段的融合特征，输出包括隐藏的编码器向量序列；
所述第二LSTM层的输入包括所述隐藏的编码器向量序列，输出包括解码器向量序列；
所述softmax层的输入包括所述解码器向量序列，输出包括所述目标视频段对应的操作命令。

5.一种操作命令生成装置，其特征在于，包括：
获取模块，用于获取训练集；其中，所述训练集包括多个标注操作命令的视频段，所述操作命令包括操作者的手部、主体对象、动作和受体对象；
提取模块，用于提取每个所...

【专利技术属性】
技术研发人员：刘文印，莫秀云，陈俊洪，梁达勇，朱展模，
申请(专利权)人：广东工业大学，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人