基于手势的查词方法、查词设备及计算机可读存储介质技术

技术编号：35441970 阅读：23 留言：0更新日期：2022-11-03 11:53

本发明专利技术的实施方式提供了一种基于手势的查词方法、查词设备及计算机可读存储介质。该查词方法包括：基于在待检测区域连续采集的多帧全局图像中每帧全局图像的第一手势类型和第一手指位置，预判未来一帧或多帧的预判手势类型；以及根据所述预判手势类型，确定是否触发查词操作。根据本发明专利技术实施方式的基于手势的查词方法，可以通过预判来提前确定是否触发查词操作，从而可以实现对用户查词手势的快速响应，以及缩短用户可感知的耗时，为用户带来了更好的体验。更好的体验。更好的体验。

全部详细技术资料下载

【技术实现步骤摘要】
基于手势的查词方法、查词设备及计算机可读存储介质

[0001]本专利技术的实施方式涉及人工智能
，更具体地，本专利技术的实施方式涉及基于手势的查词方法、查词设备及计算机可读存储介质。

技术介绍

[0002]本部分旨在为权利要求书中陈述的本专利技术的实施方式提供背景或上下文。此处的描述可包括可以探究的概念，但不一定是之前已经想到或者已经探究的概念。因此，除非在此指出，否则在本部分中描述的内容对于本申请的说明书和权利要求书而言不是现有技术，并且并不因为包括在本部分中就承认是现有技术。
[0003]随着人工智能技术的发展，计算机视觉(Computer Vision，即CV)相关技术广泛应用于各类教育和效率工具类产品中。基于计算机视觉的手势人机交互是重要的交互方式，在此类交互场景下，系统往往需要从实时获取的视频流中检测特定的手势，作为某些指令或功能的触发信号。然而，在很多场景下，手势信号所触发的指令需要耗时较久的计算或数据存取等操作，使得用户所能感知到的“系统对手势的响应”，最早只能出现在该耗时操作完成的时刻，这可能导致用户的体验不佳。

技术实现思路

[0004]为此，非常需要一种改进的基于计算机视觉的手势信号触发方法，以减少用户所能感知到的响应延时，从而提高用户的使用体验。
[0005]在本上下文中，本专利技术的实施方式期望提供一种基于手势的查词方法、查词设备及计算机可读存储介质。
[0006]在本专利技术实施方式的第一方面中，提供了一种基于手势的查词方法，包括：基于在待检测区...

【技术保护点】

【技术特征摘要】
1.一种基于手势的查词方法，包括：基于在待检测区域连续采集的多帧全局图像中每帧全局图像的第一手势类型和第一手指位置，预判未来一帧或多帧的预判手势类型；以及根据所述预判手势类型，确定是否触发查词操作。2.根据权利要求1所述的查词方法，其中预判未来一帧或多帧的预判手势类型包括：基于所述多帧全局图像中每帧全局图像的第一手势类型和第一手指位置形成的数据序列，采用手势预判模型进行预判。3.根据权利要求1所述的查词方法，其中确定是否触发查词操作包括：响应于未来一帧或多帧的预判手势类型中存在静止查词手型，确定触发所述查词操作。4.根据权利要求1或3所述的查词方法，还包括：响应于触发所述查词操作，根据所述多帧全局图像中的最新全局图像，确定所述查词操作的查词范围；在基于所述查词范围进行查词操作的过程中，获取在所述待检测区域采集的第一当前帧全局图像，其中所述查词操作包括文本检测和/或文本识别；以及根据检测到的第一当前帧全局图像的第二手势类型，确定是否继续执行所述查词操作。5.根据权利要求4所述的查词方法，其中根据第二手势类型确定是否继续执行查词操作包括：响应于检测到的所述第二手势类型为查词手型，根据第一当前帧的第二手指位置，在所述查词范围内的文本检测结果中确定文本识别范围；或者响应于检测到的所述第二手势类型为非查词手型，停止当前查词操作。6.根据权利要求5所述的查词方法，其中所述文本检测包括文本行检测，所述文本...

【专利技术属性】
技术研发人员：肖云龙，林辉，段亦涛，
申请(专利权)人：网易有道信息技术北京有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人