基于GRU-LSTM预测模型的动态驻留眼动输入技术制造技术

技术编号：40702992 阅读：9 留言：0更新日期：2024-03-22 11:01

本发明专利技术公开了一种基于GRU‑LSTM预测模型的动态驻留眼动输入技术。在系统运行中，用户通过眼动输入设备与屏幕上的虚拟键盘进行互动，而系统则采用GRU‑LSTM算法，通过对用户的输入历史进行分析，实时预测用户可能选择的下一个字母，并智能地调整键的驻留时间。这一动态调整机制根据预测的置信度，优化输入速度和准确性。对于高度可信的预测，系统减少键的驻留时间以提高输入速度；对于置信度较低的预测，系统增加键的驻留时间以降低误操作的风险。本发明专利技术致力于提升眼动输入系统的适用性和个性化水平，为用户提供更为舒适、个性化和高效的眼动文本输入体验。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及深度学习和眼动输入领域，具体是一种基于gru-lstm预测模型的动态驻留眼动输入技术。

技术介绍

1、眼动输入技术是一种创新性的人机交互方式，通过追踪用户的眼球运动，使其能够用眼神定位虚拟键盘上的字符，从而实现计算机输入。在这一技术的演进中，尤其是在眼动输入系统的发展中，已经取得了显著进展。然而，尽管这些系统为特定用户群体带来了便利，仍然存在一些令人挑战的问题。

2、传统的眼动输入系统常常采用固定驻留时间，无法充分适应用户的个体差异和实时输入需求。这导致了一些用户在使用眼动输入时可能感到不舒适，限制了其在输入速度和用户体验方面的表现。

3、以前的研究尝试通过简单地调整键盘布局或提高输入速度来改善这些问题，但这些方法未能提供智能、个性化的解决方案。因此，眼动输入技术仍然面临提高适应性和用户体验的挑战。

技术实现思路

1、本专利技术的目的在于提供一种基于gru-lstm预测模型的动态驻留眼动输入技术，旨在推动眼动输入技术向前迈进，提供更具适应性和个性化的文本输入体验，使用户能够更自然、舒适地利用眼动进行计算机交互。

2、为实现上述目的，本专利技术提供如下技术方案：

3、一种基于gru-lstm预测模型的动态驻留眼动输入技术，方法包括以下步骤：

4、步骤s100：使用眼动仪进行眼动追踪，并与鼠标光标相关联。

5、步骤s200：设计虚拟键盘，包括虚拟键盘界面设计、驻留时间设定和虚拟键盘互动几个方面。>

6、步骤s300：训练gru-lstm模型，包括文本数据集准备、模型架构设计和训练过程几个方面。

7、步骤s400：根据gru-lstm模型的预测结果，实现驻留时间动态调整。

8、优选地，步骤s100包括：

9、步骤s110：选择高精度的眼动仪，考虑精度、采样率和佩戴舒适度等因素。在使用系统前，确保仪器位置合适，并进行校准以适应个体差异。

10、步骤s120：使用眼动数据处理算法，以毫秒级别实时捕捉用户眼球的注视位置。将捕捉到的眼动数据与鼠标光标位置进行实时关联，建立眼动与鼠标的映射关系。

11、步骤s130：使用基于卡尔曼滤波的算法，结合先验信息和实时眼动数据，实现鼠标光标位置的平滑调整，确保鼠标光标能够准确地跟随用户的眼动。

12、优选地，步骤s200包括：

13、步骤s210：使用与传统键盘相似的布局，包含26个字母键以及空格和删除键。字母按照通用的qwerty常见键盘布局排列，以便用户熟悉。将空格键和删除键放置在适当的位置，使用户能够轻松访问这两个常用功能。

14、步骤s220：当光标停留在某个字母键上超过设定的时间(例如500毫秒)，虚拟键盘上字符被选中。通过用户研究和反馈数据，确定一个平衡点，使驻留时间既不过长以影响用户输入速度，也不过短以导致误触。

15、步骤s230：当用户开始注视虚拟键盘上的键时，键的中心产生一个蓝色的圆圈，起到引导用户注意力的作用。随着用户的注视时间增加，蓝色圆圈逐渐变大，通过这种动态变化引导用户对键的关注。

16、步骤s240：当蓝色圆圈逐渐变大并达到键的边缘时，表示该键已被选中；如果用户中途移开目光，蓝色圆圈将立即消失，表示键未被选中。系统实时响应用户的眼动，确保圆圈的状态与用户注视的键的状态同步。

17、优选地，步骤s300包括：

18、步骤s310：使用penntreebank(ptb)数据集，该数据集包含大量的英语文本，适用于语言模型训练。对ptb数据集进行预处理，包括分词、去除标点符号和特殊字符，以及构建字符序列。

19、步骤s320：在输入层，将文本序列映射为字符向量，作为模型的输入。设计单向的深度gru-lstm结构，包括多个堆叠的隐藏层，以捕捉文本序列中的上下文信息。其中gru层包含2个gru层，用于学习序列中的短期依赖关系。lstm层包含2个lstm层，用于学习序列中的长期依赖关系。在输出层中，使用softmax激活函数，输出每个位置上字符的概率分布。

20、步骤s330：损失函数选择使用交叉熵损失函数，度量模型的输出与实际字符分布之间的差异。采用自适应学习率的adam优化器，以确保训练过程中的学习速率适应性强。引入dropout正则化技术，有助于防止模型过拟合，提高泛化性。

21、优选地，步骤s400包括：

22、步骤s410：根据训练好的gru-lstm模型，计算每个字符在当前位置的概率分布。

23、步骤s420：使用设计的动态调整机制，根据预测的结果，智能地调整虚拟键盘上每个字符键的驻留时间。针对预测置信度较高的字符，系统减少相应键的驻留时间，以提高输入速度；针对置信度较低的字符，系统增加相应键的驻留时间，以降低误操作的风险。

24、步骤s430：通过动态调整机制，系统结合预测的置信度，以优化输入速度和准确性，提高系统对用户输入的响应。

25、本专利技术能够取得以下有益效果：

26、1.高效眼动输入：通过结合高精度眼动追踪仪器和动态调整的虚拟键盘，系统能够实现高效的眼动输入。动态调整机制根据gru-lstm模型的预测结果智能地调整每个字符键的驻留时间，从而提高用户的输入速度。

27、2.准确性提升：利用gru-lstm模型对语言模型进行训练，系统能够更准确地预测用户的输入意图。通过动态调整机制，根据预测结果的置信度智能地调整键盘的驻留时间，降低误操作的风险，从而提升输入的准确性。

28、3.实时响应用户输入：系统实时响应用户的眼动，并根据用户的注视位置和预测结果智能地调整虚拟键盘的参数，确保系统与用户输入的同步性，提高系统对用户输入的实时响应。

本文档来自技高网...

【技术保护点】

1.基于GRU-LSTM预测模型的动态驻留眼动输入技术，其特征在于，所述方法包括以下步骤：

2.根据权利要求1所述的方法，其特征在于，步骤S100包括：

3.根据权利要求1所述的方法，其特征在于，步骤S200包括：

4.根据权利要求1所述的方法，其特征在于，步骤S300包括：

5.根据权利要求1所述的方法，其特征在于，步骤S400包括：

【技术特征摘要】

1.基于gru-lstm预测模型的动态驻留眼动输入技术，其特征在于，所述方法包括以下步骤：

2.根据权利要求1所述的方法，其特征在于，步骤s100包括：

3.根据权利要求...

【专利技术属性】
技术研发人员：殷继彬，陈迪，
申请(专利权)人：昆明理工大学，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人