【技术实现步骤摘要】
【国外来华专利技术】使用多模态信号分析进行命令处理
本公开整体涉及被设计用于检测和响应自然人类移动和会话查询的系统,并且更具体地涉及被设计用于识别个体所关注的实体并对其采取动作的系统,识别方法是利用从若干类型信号(诸如,姿态和注视方向)的组合得到的可能不精确的提示。
技术介绍
若干系统(包括一些计算机游戏系统)已经实现检测特定类型的人类姿态或移动的技术。然而,在许多情况下,这些系统中对移动和语音的解释通常限于非常特定的领域(诸如,正在播放的特定游戏,或需要握在手中的特定输入设备的移动)和位置(例如,与系统交互的个体可能必须位于单个房间中的特定相机角度范围内)。尽管一些虚拟现实系统可使得用户能够沉浸在选定环境中,但可在此类系统内使用自然人类行为以用于一般目的的程度也受到最大的限制。
技术实现思路
本专利技术描述了用于使用多模态信号分析来处理个人的(例如,以自然语言表达的)命令和查询的方法和装置的各种实施方案。在至少一些实施方案中,该方法可包括在至少特定时间间隔期间获取与第一信号模态(例如,个体注视的方向)相对应的第一组信号。该方法还可包括获取与不同信号模态(诸如,手指向姿态或头部移动诸如点头)相对应的第二组信号。在一些实施方案中,获取的数据组中的一者或两者可包括定时信息,例如,数据组中可指出作出各种姿态或注视方向保持稳定一段时间的特定时间。响应于命令,例如来自个体的口头命令,该命令未明确地、决定性地或最终地识别命令所指向的目标对象,该方法可包括利用第一数据组和/或第二数据组来识别所关注的一个或多个候选对象以及使得执行与一个或多个候选对象中的选定对象相关联的操作。在至少一些实施方案中 ...
【技术保护点】
1.一种方法,包括:在一个或多个计算设备处,执行以下操作:在至少第一时间间隔期间从个体获取第一组一个或多个信号,其中所述第一组一个或多个信号对应于第一信号模态并且指示相对于所述个体在所述第一时间间隔期间的位置的特定方向;在至少第二时间间隔期间从所述个体获取第二组一个或多个信号,所述第二时间间隔至少部分地与所述第一时间间隔重叠,其中所述第二组一个或多个信号对应于第二信号模态;响应于命令,其中所述命令不决定性地识别所述命令所指向的所关注的特定对象,至少部分地基于所述特定方向并至少部分地基于对所述第二组的分析,识别所述个体所关注的一个或多个候选对象;以及使得与所述所关注的一个或多个候选对象中的第一选定候选对象相关联的操作被执行。
【技术特征摘要】
【国外来华专利技术】2016.08.15 US 62/375,267;2017.08.14 US 15/676,9211.一种方法,包括:在一个或多个计算设备处,执行以下操作:在至少第一时间间隔期间从个体获取第一组一个或多个信号,其中所述第一组一个或多个信号对应于第一信号模态并且指示相对于所述个体在所述第一时间间隔期间的位置的特定方向;在至少第二时间间隔期间从所述个体获取第二组一个或多个信号,所述第二时间间隔至少部分地与所述第一时间间隔重叠,其中所述第二组一个或多个信号对应于第二信号模态;响应于命令,其中所述命令不决定性地识别所述命令所指向的所关注的特定对象,至少部分地基于所述特定方向并至少部分地基于对所述第二组的分析,识别所述个体所关注的一个或多个候选对象;以及使得与所述所关注的一个或多个候选对象中的第一选定候选对象相关联的操作被执行。2.根据权利要求1所述的方法,还包括由所述一个或多个计算设备执行以下操作:将所述第一组一个或多个信号的至少一个子组存储在缓冲器中,其中所述子组对应于与所述第一信号模态相关联的缓冲间隔,并且其中所述分析包括检查所述缓冲器的内容。3.根据权利要求1所述的方法,其中所述第一组或所述第二组中的至少一组包括指示以下各项中的一者或多者的信号:指向姿态、头部取向或移动、躯干取向或移动、使用除手之外的身体部位作出的姿态、注视方向、面部表情、一个或多个语音标记或无意识的生理反应。4.根据权利要求1所述的方法,还包括由所述一个或多个计算设备执行以下操作:从以下各项中的一者或多者获取所述第一组一个或多个信号中的至少一个信号:(a)可穿戴设备;(b)传感器,所述传感器位于所述个体占用的移动车辆内或附接到所述个体占用的移动车辆;(c)摄影机;(d)静物相机;(e)深度相机;(f)惯性传感器;(g)电磁信号检测器;(h)超声信号检测器;(i)雷达信号检测器;(j)非相机光学传感器;(k)EMG(肌电图)传感器;或(l)智能电话。5.根据权利要求1所述的方法,还包括由所述一个或多个计算设备执行以下操作:至少部分地基于对以下各项的分析来确定所述命令:(a)所述第二组一个或多个信号中的一个或多个语音信号;(b)经由触摸屏界面接收的一个或多个信号;或(c)以手语表达的一个或多个信号。6.根据权利要求1所述的方法,其中与所述第一选定候选对象相关联的所述操作包括以下各项中的一者或多者:(a)经由图形显示或自动语音指示所述第一选定候选对象的名称;(b)捕获所述第一选定候选对象的照片或视频;(c)翻译与所述第一选定候选对象相对应的一个或多个字词或符号;或(d)发起车辆的停放。7.根据权利要求1所述的方法,还包括由所述一个或多个计算设备执行以下操作:确定所述命令包括所关注的对象的非精确指示符,其中所述非精确指示符包括以下各项中的一者或多者:(a)指示代词;或(b)相对地点的副词。8.一种系统,包括:一个或多个传感器设备;和一个或多个命令处理设备;其中所述一个或多个传感器设备被配置为:在第一时间间隔的至少一部分期间从个体收集与第一信号模态相对应的第一数据组,其中所述第一数据组包括相对于所述个体的位置的方向相关信息;在至少第二时间间隔期间从所述个体收集与第二信号模态相对应的第二数据组,所述第二时间间隔至少部分地与所述第一时间间隔重叠;以及其中所述一个或多个命令处理设备被配置为:响应于确定已经发布命令,其中所述命令不最终识别所述命令所指向的所关注的特定对象,至少部分地基于对所述第一数据组和所述第二数据组的分析...
【专利技术属性】
技术研发人员:W·金茨勒,D·A·鲍曼,
申请(专利权)人:苹果公司,
类型:发明
国别省市:美国,US
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。