Sample device and method through a combination of voice and other input modes (e.g., touch, hover, gesture, gaze) and the improvement of human device interaction efficiency and accuracy to create more natural and more attractive multimodal interaction. Multimodal interaction extends the user's ability to communicate with the device. Establish a speech reference point based on a combination of prioritized or sorted inputs. Cooperative speech interaction takes place in the context of the speech reference point. Examples of collaborative speech interaction include commands, dictation, or conversational interaction. The reference point can voice in complexity from a single discrete reference point (for example, a single touch point) and the reference point to the order of reference point changes to multiple (single touch or multi touch), and e.g.gesture associated similar reference point. Building a voice reference point allows for the addition of context appropriate user interface components to further improve human device interaction in both natural and attractive experiences.
【技术实现步骤摘要】
【国外来华专利技术】与话音参考点的协同言语交互
技术介绍
计算设备持续以令人惊讶的速率激增。截至2014年九月,大概存在具有触敏屏的二十亿台智能电话和平板电脑。这些设备中的大多数具有内置麦克风和相机。用户以许多变化且令人感兴趣的方式与这些设备交互。例如,三维(3D)触摸或悬停传感器能够在用户手指或实现物(例如,笔、触笔)靠近或触摸设备的屏幕时检测它们的存在、位置和角度。关于用户手指的信息可以促进标识出用户正引用的屏幕上的对象或位置。即便使用触摸屏与设备交互的丰富性,但是与设备进行通信可能仍然是不自然或者困难的尝试。在人类与人类的世界中,与其他人类的有效交流牵涉多个同时模态,包括例如话音、眼神接触、做手势、身体语言、声调或变音,所有这些可以取决于针对其含义的上下文。尽管人类同时使用多个模态与其他人类交互,但是人类往往每次使用单个模态与其设备交互。仅使用单个模态可能限制用户的表达能力。例如,与设备的一些交互(例如,导航快捷键)仅使用话音完成,而其它交互(例如,滚动)仅使用手势完成。当在常规设备上使用话音命令时,受限的上下文可能要求用户说出已知的冗长命令或者参与繁琐的来回对话,这二者都可能是不自然或受限的。具有双重结果的单个模态输入可能抑制了解如何与接口交互,因为用户可能害怕不小心做了不可撤销的事情。
技术实现思路
提供该
技术实现思路
来以简化形式引入以下在具体实施方式中进一步描述的概念的选择。该
技术实现思路
不旨在标识所要求保护的主题的关键特征或必要特征,也不旨在用于限制所要求保护的主题的范围。示例装置和方法通过组合话音与其它输入模态(例如,触摸、悬停、手势、凝视)而在针对人类与设备的交互的常 ...
【技术保护点】
一种方法,包括:建立用于用户和设备之间的协同言语交互的话音参考点,其中设备是启用话音的,其中设备具有视觉显示器,其中设备具有至少一个非话音输入装置,并且其中话音参考点的位置至少部分地通过来自非话音输入装置的输入而确定;控制设备以提供关于话音参考点的反馈;接收与用户和设备之间的协同言语交互相关联的输入;以及控制设备以将协同言语交互处理为上下文语音命令,其中与语音命令相关联的上下文至少部分地取决于话音参考点。
【技术特征摘要】
【国外来华专利技术】2014.10.08 US 14/5091451.一种方法,包括:建立用于用户和设备之间的协同言语交互的话音参考点,其中设备是启用话音的,其中设备具有视觉显示器,其中设备具有至少一个非话音输入装置,并且其中话音参考点的位置至少部分地通过来自非话音输入装置的输入而确定;控制设备以提供关于话音参考点的反馈;接收与用户和设备之间的协同言语交互相关联的输入;以及控制设备以将协同言语交互处理为上下文语音命令,其中与语音命令相关联的上下文至少部分地取决于话音参考点。2.权利要求1所述的方法,其中话音参考点与显示在视觉显示器上的单个离散对象相关联,其中话音参考点与同时显示在视觉显示器上的两个或更多离散对象相关联,或者其中话音参考点与在视觉显示器上顺序引用的两个或更多离散对象相关联。3.权利要求1所述的方法,其中设备是蜂窝电话、平板计算机、平板手机、膝上型计算机或桌面型计算机。4.权利要求1所述的方法,其中协同言语交互是要应用于与话音参考点相关联的对象的命令,或者要键入到与话音参考点相关联的对象中的口述,或者用户和设备上的话音代理之间的会话的部分。5.权利要求1所述的方法,包括,控制设备以提供标识与话音参考点相关联的对象的视觉、触觉或听觉反馈。6.权利要求1所述的方法,包括,控制设备以至少部分地基于与话音参考点相关联的对象而呈现附加用户接口元件。7.权利要求1所述的方法,包括,至少部分地基于与话音参考点相关联的对象而选择性地操控用于运行在设备上的语音代理的主动监听模式。8.权利要求7所述的方法,包括,控制设备以在操控主动监听模式时提供视觉、触觉或听觉反馈。9.权利要求1所述的方法,其中所述至少一个非话音输入装置是触摸传感器、悬停传感器、深度...
【专利技术属性】
技术研发人员:C克莱因,
申请(专利权)人:微软技术许可有限责任公司,
类型:发明
国别省市:美国,US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。