一种基于注意力机制的手势位置预估方法及相关装置制造方法及图纸

技术编号：26731343 阅读：15 留言：0更新日期：2020-12-15 14:33

本申请公开了一种基于注意力机制的手势位置预估方法及相关装置，方法包括：获取第一时间的第一手势图像；采用预置RNN隐含层处理第一手势图像，得到隐含向量，并根据隐含向量和预置初始位置计算得到注意力分配系数；根据隐含向量和注意力分配系数计算手势隐含状态分布规律；采用预置全连接层处理手势隐含状态分布规律，得到手势预估位置；获取第二时间的第二手势图像，将第二手势图像代替第一手势图像，将手势预估位置代替预置初始位置，返回采用预置RNN隐含层处理第一手势图像的步骤，直至得到所有手势预估位置。本申请能够解决现有技术存在大量白噪声，导致手势位置显示效果较差的技术问题。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于注意力机制的手势位置预估方法及相关装置
本申请涉及图像处理
，尤其涉及一种基于注意力机制的手势位置预估方法及相关装置。
技术介绍
在远程维修中经常需要对工人的手部动作进行实时跟踪，从而确保维修操作动作的准确性，而手势动作的实时跟踪对图像的处理和手势的预估要求较高，由于人眼在屏幕上不同区域的注视特性不同，因此，不能用简单的映射关系来描述屏幕上的位置与人眼位置的关系，一般采用的是将笛卡尔坐标系转化为世界坐标系来实现位置的映射，但是该方法的映射过程会存在大量白噪声，影响实际效果。
技术实现思路
本申请提供了一种基于注意力机制的手势位置预估方法及相关装置，用于解决现有技术存在大量白噪声，导致手势位置显示效果较差的技术问题。有鉴于此，本申请第一方面提供了一种基于注意力机制的手势位置预估方法，包括：获取第一时间的第一手势图像，所述第一时间包括连续的多个时刻；采用预置RNN隐含层处理所述第一手势图像，得到隐含向量，并根据所述隐含向量和预置初始位置计算得到注意力分配系数；根据所述隐含向量和所述注意力分配系数计算手势隐含状态分布规律；采用预置全连接层处理所述手势隐含状态分布规律，得到手势预估位置；获取第二时间的第二手势图像，将所述第二手势图像代替所述第一手势图像，将所述手势预估位置代替所述预置初始位置，返回所述采用预置RNN隐含层处理所述第一手势图像的步骤，直至得到所有所述手势预估位置。可选的，所述获取第一时间的第一手势图像，所述第一时间包括连续...

【技术保护点】
1.一种基于注意力机制的手势位置预估方法，其特征在于，包括：/n获取第一时间的第一手势图像，所述第一时间包括连续的多个时刻；/n采用预置RNN隐含层处理所述第一手势图像，得到隐含向量，并根据所述隐含向量和预置初始位置计算得到注意力分配系数；/n根据所述隐含向量和所述注意力分配系数计算手势隐含状态分布规律；/n采用预置全连接层处理所述手势隐含状态分布规律，得到手势预估位置；/n获取第二时间的第二手势图像，将所述第二手势图像代替所述第一手势图像，将所述手势预估位置代替所述预置初始位置，返回所述采用预置RNN隐含层处理所述第一手势图像的步骤，直至得到所有所述手势预估位置。/n

【技术特征摘要】
1.一种基于注意力机制的手势位置预估方法，其特征在于，包括：
获取第一时间的第一手势图像，所述第一时间包括连续的多个时刻；
采用预置RNN隐含层处理所述第一手势图像，得到隐含向量，并根据所述隐含向量和预置初始位置计算得到注意力分配系数；
根据所述隐含向量和所述注意力分配系数计算手势隐含状态分布规律；
采用预置全连接层处理所述手势隐含状态分布规律，得到手势预估位置；
获取第二时间的第二手势图像，将所述第二手势图像代替所述第一手势图像，将所述手势预估位置代替所述预置初始位置，返回所述采用预置RNN隐含层处理所述第一手势图像的步骤，直至得到所有所述手势预估位置。

2.根据权利要求1所述的基于注意力机制的手势位置预估方法，其特征在于，所述获取第一时间的第一手势图像，所述第一时间包括连续的多个时刻，包括：
在预置视频素材的每一秒处获取预置数量的初始手势图像；
从所述初始手势图像中选取一张最优手势图像作为对应时刻的预置手势图像；
获取连续预置秒对应的所述预置手势图像作为所述第一手势图像，所述预置秒为所述第一时间，其中一秒为一个时刻。

3.根据权利要求1所述的基于注意力机制的手势位置预估方法，其特征在于，所述根据所述隐含向量和所述注意力分配系数计算手势隐含状态分布规律，包括：
采用预置公式根据所述隐含向量和所述注意力分配系数计算手势隐含状态分布规律，所述预置公式为：

其中，ct为t时刻的手势隐含状态分布规律，Tx为选取手势图像的数量，αt,i为t时刻第i张图像对应的注意力分配系数，为第i张图像对应的隐含向量。

4.根据权利要求1所述的基于注意力机制的手势位置预估方法，其特征在于，所述获取第二时间的第二手势图像，将所述第二手势图像代替所述第一手势图像，将所述手势预估位置代替所述预置初始位置，返回所述采用预置RNN隐含层处理所述第一手势图像的步骤，直至得到所有所述手势预估位置，之后还包括：
根据所述手势预估位置在显示器上进行预估手势位置显示操作。

5.一种基于注意力机制的手势位置预估装置，其特征在于，包括：
获取模块，用于获取第一时间的第一手势图像，所述第一时间...

【专利技术属性】
技术研发人员：房小兆，韩娜，周郭许，谢胜利，滕少华，
申请(专利权)人：广东工业大学，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人