用于执行手势检测的系统和设备技术方案

技术编号：23399404 阅读：21 留言：0更新日期：2020-02-22 11:45

用于执行手势检测的系统和设备。本文描述的系统和方法利用深度学习算法来识别由投影仪提供的投影的用户界面上的手势和其他动作。包含深度信息和颜色信息的摄像机记录在所投影的用户界面上检测到的手势和动作。所述深度学习算法可以被配置为在检测到动作时使用以节省硬件系统的处理周期。

Systems and devices for performing gesture detection

全部详细技术资料下载

【技术实现步骤摘要】
用于执行手势检测的系统和设备
本公开总体上涉及手势检测，并且更具体地，涉及投影系统上的手势检测。
技术介绍
投影仪-摄像机系统可以将诸如桌面和墙壁之类的任何表面转变为交互式显示器。一个基本问题是识别投影的用户界面(UI)控件上的手势动作。使用手指模型或遮挡图案的相关技术方法具有许多问题(problem)，包括具有亮度难题(issue)和反射的环境照明条件、投影的视频图像中的伪影和噪声以及深度摄像机的不准确性。
技术实现思路
在本公开中，这里描述的示例实现方式通过采用具有深度摄像机的深度神经网络方法提供更鲁棒的识别器来解决相关技术中的问题。具体地，示例实现方式利用具有从颜色通道和深度通道计算的光流的卷积神经网络(CNN)。示例实现方式涉及也过滤掉显示表面附近没有活动的帧的处理流水线，这节省了计算周期和能量。在利用带标签数据集的本文描述的示例实现方式的测试中，实现了高准确度(例如，～95％的准确度)。本公开的各方面可以包括：一种系统，该系统涉及：投影仪系统，其被配置为投影用户界面(UI)；摄像机系统，其被配置为记录所投影的用户界面上的交互；以及处理器，其被配置为在检测到由所述摄像机系统记录的交互时，基于被训练以从由所述摄像机系统记录的所述交互中识别手势动作的深度学习算法的应用来确定动作命令的执行。本公开的各方面可以包括：一种系统，该系统涉及：用于对用户界面(UI)进行投影的装置；用于记录所投影的用户界面上的交互的装置；以及用于在检测到所记录的交互时，基于被训练以从记录的交互中识别手势动...

【技术保护点】
1.一种用于执行手势检测的系统，该系统包括：/n投影仪系统，该投影仪系统被配置为对用户界面UI进行投影；/n摄像机系统，该摄像机系统被配置为记录所投影的用户界面上的交互；以及/n处理器，该处理器被配置为：/n在检测到由所述摄像机系统记录的交互时，基于被训练以从由所述摄像机系统记录的所述交互中识别手势动作的深度学习算法的应用来确定动作命令的执行。/n

【技术特征摘要】
20180809 US 16/059,6591.一种用于执行手势检测的系统，该系统包括：
投影仪系统，该投影仪系统被配置为对用户界面UI进行投影；
摄像机系统，该摄像机系统被配置为记录所投影的用户界面上的交互；以及
处理器，该处理器被配置为：
在检测到由所述摄像机系统记录的交互时，基于被训练以从由所述摄像机系统记录的所述交互中识别手势动作的深度学习算法的应用来确定动作命令的执行。

2.根据权利要求1所述的系统，其中，所述处理器被配置为：
通过根据来自所述摄像机系统的深度信息确定在所投影的用户界面的UI控件附近是否发生了交互，来进行由所述摄像机系统记录的所述交互的检测；
针对在所投影的用户界面的所述UI控件附近发生了所述交互的确定，确定检测到所述交互，基于所述深度学习算法的所述应用进行所述动作命令的所述执行的确定，并且执行与根据所述深度学习算法确定的所识别的手势动作相对应的所述动作命令；以及
针对在所投影的用户界面的所述UI控件附近尚未发生所述交互的确定，确定没有检测到所述交互并且不进行所述深度学习算法的所述应用。

3.根据权利要求1所述的系统，其中，所述处理器被配置为通过以下步骤，基于被训练以从由所述摄像机系统记录的所述交互中识别手势动作的所述深度学习算法的所述应用来确定所述动作命令的执行：
针对所述摄像机系统的颜色通道和深度通道，计算所投影的UI内的区域的光流；以及
将所述深度学习算法应用于所述光流以识别手势动作。

4.根据权利要求1所述的系统，其中，所述处理器是被配置为执行所述深度学习算法的所述应用的图形处理器单元GPU或现场可编程门阵列FPGA。

5.根据权利要求1所述的系统，其中，所述投影仪系统被配置为将所述UI投影在桌面上或墙面上。

6.根据权利要求1所述的系统，其中，针对包括与光流相关联的带标签手势动作的数据库来训练所述深度学习算法。

7.一种用于执行手势检测的系统，该系统包括：
投影仪系统，该投影仪系统被配置为对用户界面UI进行投影；
摄像机系统，该摄像机系统被配置为记录所投影的用户界面上的交互；以及
处理器，该处理器被配置为：
在检测到由所述摄像机系统记录的交互时：
针对所述摄像机系统的颜色通道和深度通道，计算所投影的UI内的区域的光流；
将深度学习算法应用于所述光流以利用UI控件来识别手势动作，所述深度学习算法被训练以从所述光流中识别手势动作；并且
针对正被识别的所述手势动作，执行与所识别的手势动作和所述UI控件相对应的命令。

8.根据权利要求1所述的系统，其中，所述处理器被配置为：
通过根据来自所述摄像机系统的深度信息确定在所投影的用户界面的所述UI控件附近是否发生了交互，来进行由所述摄像机系统记录的所述交互的检测；
针对在所投影的用户界面的所述UI控件附近发生了所述交互的确定，确定检测到所述交互，基于所述深度学习算法的所...

【专利技术属性】
技术研发人员：P·邱，金哲暄，
申请(专利权)人：富士施乐株式会社，
类型：发明
国别省市：日本;JP

全部详细技术资料下载我是这个专利的主人