【技术实现步骤摘要】
【国外来华专利技术】执行触摸运动预测的深度机器学习
本公开一般涉及机器学习。更具体地,本公开涉及执行用户输入运动预测的深度机器学习。
技术介绍
用户可以使用用户输入对象(诸如,例如一个或多个手指、由用户操作的触笔或其他用户输入对象)向计算设备提供用户输入。具体地,在一个示例中,用户可以使用用户输入对象来触摸触敏显示屏或其他触敏组件。用户输入对象与触敏显示屏的交互使得用户能够向计算设备提供用户输入。然而,在某些现有计算设备中,在触摸事件的结果显示在屏幕上之前,由触敏显示屏检测到的触摸事件必须经过相当大的处理堆栈。例如,触摸输入处理堆栈可以包括用于液晶显示器(LiquidCrystalDisplay,LCD)屏幕的固件、内核、渲染和垂直同步(VerticalSynchronization,V-Sync)的组合。处理堆栈还可以包括由消耗触摸输入的各个程序完成的软件处理。处理堆栈的大小和复杂性引入了“触摸时延”的问题,其中在触摸事件发生时和设备似乎响应触摸事件时之间发生延迟。触摸时延是影响设备性能的重大挑战。虽然利用更好的软件调度可以减少一些触摸时延,但是无论处理堆栈组织得有多好,存在用于处理触摸事件并且然后该触摸事件到达屏幕的最小时间量。
技术实现思路
本公开的实施例的方面和优点将在以下描述中部分阐述,或者可以从描述来学习,或者可以通过实施例的实践来学习。本公开的一个示例方面针对一种预测用户输入对象的运动的计算机实施的方法。该方法包括由一个或多个计算设备获得与用户输入对象相关联的第一组运动数据。第一组运动数据描述用户输入对象随时间的位置。该方法包括由一个或多个计算设备将第一组运动数据输 ...
【技术保护点】
1.一种预测用户输入对象的运动的计算机实施的方法,该方法包括:由一个或多个计算设备获得与用户输入对象相关联的第一组运动数据,所述第一组运动数据描述用户输入对象随时间的位置;由一个或多个计算设备将第一组运动数据输入到机器学习运动预测模型的递归神经网络中;以及由一个或多个计算设备接收运动预测向量作为运动预测模型的输出,其中所述运动预测向量描述用户输入对象的分别针对一个或多个未来时间的一个或多个预测的未来位置。
【技术特征摘要】
【国外来华专利技术】2016.09.08 US 15/259,9171.一种预测用户输入对象的运动的计算机实施的方法,该方法包括:由一个或多个计算设备获得与用户输入对象相关联的第一组运动数据,所述第一组运动数据描述用户输入对象随时间的位置;由一个或多个计算设备将第一组运动数据输入到机器学习运动预测模型的递归神经网络中;以及由一个或多个计算设备接收运动预测向量作为运动预测模型的输出,其中所述运动预测向量描述用户输入对象的分别针对一个或多个未来时间的一个或多个预测的未来位置。2.根据权利要求1所述的计算机实施的方法,其中,由一个或多个计算设备获得与用户输入对象相关联的第一组运动数据包括由一个或多个计算设备获得与用户的手指或由用户操作的触笔相关联的第一组运动数据,所述第一组运动数据描述手指或触笔相对于触敏屏的运动。3.根据权利要求1或2所述的计算机实施的方法,其中,由一个或多个计算设备将第一组运动数据输入到运动预测模型的机器学习递归神经网络中包括由一个或多个计算设备将第一组运动数据输入到运动预测模型的机器学习长短期记忆(LSTM)神经网络中。4.根据权利要求1-3中任一项所述的计算机实施的方法,还包括:由一个或多个计算设备接收高维上下文向量作为递归神经网络的输出;以及由一个或多个计算设备将高维上下文向量和描述一个或多个未来时间的时间向量输入到运动预测模型的前馈神经网络中;其中,由一个或多个计算设备接收运动预测向量作为运动预测模型的输出包括由一个或多个计算设备接收运动预测向量作为前馈神经网络的输出。5.根据权利要求1-3中任一项所述的计算机实施的方法,还包括:由一个或多个计算设备接收高维上下文向量作为递归神经网络的输出;以及由一个或多个计算设备将高维上下文向量和描述一个或多个未来时间的时间向量输入到运动预测模型的递归解码器神经网络中;其中,由一个或多个计算设备接收运动预测向量作为运动预测模型的输出包括由一个或多个计算设备接收运动预测向量作为递归解码器神经网络的输出。6.根据权利要求1-3中任一项所述的计算机实施的方法,其中:由一个或多个计算设备将第一组运动数据输入到机器学习递归神经网络中包括由一个或多个计算设备将第一组运动数据和描述一个或多个未来时间的时间向量输入到递归神经网络中;以及由一个或多个计算设备接收运动预测向量作为运动预测模型的输出包括由一个或多个计算设备接收运动预测向量作为递归神经网络的输出。7.根据前述权利要求中任一项所述的计算机实施的方法,其中,由一个或多个计算设备获得与用户输入对象相关联的第一组运动数据包括:由一个或多个计算设备获得第一组运动数据,其中所述第一组运动数据提供描述用户输入对象在x维中的位置的改变的至少一个值、描述用户输入对象在y维中的位置的改变的至少一个值、以及描述时间的改变的至少一个值;或者由一个或多个计算设备获得第一组运动数据,其中所述第一组运动数据提供描述用户输入对象在x维中的至少两个位置的至少两个值、描述用户输入对象在y维中的至少两个位置的至少两个值、以及描述至少两个时间的至少两个值。8.根据前述权利要求中任一项所述的计算机实施的方法,还包括:由一个或多个计算设备基于一组训练数据训练运动预测模型;其中,由一个或多个计算设备训练运动预测模型包括由一个或多个计算设备通过运动预测模型反向传播损失函数;并且其中,损失函数包括描述一个或多个误差向量分别的一个或多个长度的第一和除以一个或多个真值向量分别的一个或多个长度的第二和的误差比。9.根据前述权利要求中任一项所述的计算机实施的方法,其中:由一个或多个计算设备获得第一组运动数据包括由一个或多个计算设备迭代地获得分别更新用户输入对象随时间的位置的多个运动更新;由一个或多个计算设备将第一组运动数据输入到递归神经网络包括由一个或多个计算设备迭代地将多个运动更新中的每一个运动更新在它们被迭代地获得时输入到递归神经网络中;以及由一个或多个计算设备接收运动预测向量作为运动预测模型的输出包括由一个或多个计算设备迭代地接收多个运动预测向量作为运动预测模型的输出。10.根据前述权利要求中任一项所述的计算机实施的方法,还包括:当确定用户输入对象已经停止提供用户输入时,由一个或多个计算设备清除与递归神经网络相关联的高速缓存。11....
【专利技术属性】
技术研发人员:PC林,TH林,
申请(专利权)人:谷歌有限责任公司,
类型:发明
国别省市:美国,US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。