具有定向接口的免提装置制造方法及图纸

技术编号:14686304 阅读:111 留言:0更新日期:2017-02-23 08:17
本发明专利技术的实施方案提供一种非暂时性计算机可读介质,其包含计算机程序代码,当被运行时,所述计算机程序代码执行操作。所述操作包括检测请求与第一装置交互并且来源于源的用户动作。另外,实施方案确定所述源相对于所述第一装置的当前位置所处的方向。还基于所述第一装置的当前状态来确定对所述用户动作的响应。实施方案还包括大体上在所述源所处的所述确定方向上输出所述确定响应。

【技术实现步骤摘要】
【国外来华专利技术】相关申请的交叉引用本申请要求2014年6月3日提交的美国专利申请第14/294,328号的优先权。这个相关申请的主题特此以引用方式并入本文。背景专利
实施方案一般来说涉及用于装置的接口,并且更具体地说涉及用于提供能够进行装置免提操作的定向接口的技术。现有技术描述现今的互连装置比以前更加常见,并且此类装置的普及性正快速地持续增加。例如,人们具有移动装置(例如,智能手机)、电视机、平板计算装置、媒体播放器以及车辆导航系统并非不常见。随着越来越多的装置被构造成具有与其他装置通信的能力和逻辑,开启了为用户提供完全集成体验的新的可能性。传统上,用户可使用许多输入机构与此类装置交互。这些输入机构的示例包括装置上的按钮、键盘、触摸屏界面、远程控制件等。最近,装置已被构造成允许用户通过语音辨识来与装置进行音频通信,例如,在用户说出待由装置执行的语声命令的情况下。此类装置为用户提供许多便利,诸如通过简单地对装置说话来输入冗长的数据串的能力。然而,许多此类装置仍然依靠传统输入机构来触发语音辨识模式。例如,装置可能需要用户按压装置上的某一按钮,以便使装置处于语音辨识模式中。因此,这些装置并不提供真正的免提体验。
技术实现思路
一个实施方案提供一种非暂时性计算机可读介质,其包含计算机程序代码,当被运行时,所述计算机程序代码执行操作。所述操作包括检测请求与第一装置交互并且来源于某个源位置的用户动作。另外,所述操作包括确定源位置相对于第一装置的当前位置所处的方向。所述操作还包括基于第一装置的当前状态来确定对用户动作的响应。此外,所述操作包括大体上在源位置所处的确定方向上输出确定响应。另一个实施方案提供一种非暂时性计算机可读介质,其包含计算机程序代码,当被运行时,所述计算机程序代码执行操作。所述操作包括检测触发事件,所述触发事件包括以下各项中的至少一项:(i)检测语声触发以及(ii)在第一装置的方向上检测用户目光。另外,所述操作包括确定触发事件的源相对于第一装置的当前位置的方向。所述操作还包括通过大体上在触发事件的源所处的确定方向上将可听响应输出为可操纵声束来发起交互式语声对话。又一个实施方案提供一种包括计算机处理器和存储器的设备,所述存储器包含程序,当被计算机处理器运行时,所述程序执行操作。所述操作包括检测来源于源位置的用户动作。另外,所述操作包括确定源位置相对于所述设备的当前位置所处的方向。所述操作还包括确定对于用户动作的响应。所述操作还包括大体上在源位置所处的确定方向上输出确定响应。附图简要说明图1是框图,其示出根据本文所述的一个实施方案的、包括配置有定向交互部件的免提装置的系统。图2描绘根据本文所述的一个实施方案的物理环境,在所述物理环境中用户正与免提装置交互。图3是流程图,其示出根据本文所述的一个实施方案的、用于处理免提装置处的语声指令的方法。图4是流程图,其示出根据本文所述的一个实施方案的、通过向查询处理部件提交查询来处理免提装置处的语声指令的方法。图5是框图,其示出根据本文所述的一个实施方案的、配置有定向交互部件的免提装置。具体实施方式虽然现今许多装置使得用户能够通过使用语音辨识技术来输入命令和其他数据,但是这些装置仍然需要用户借助于另一个输入机构使所述装置处于语音辨识模式中。例如,移动装置可使得用户能够说出文本串以用于发送短消息服务(SMS)消息,但是可能需要用户首先在预先确定的一段时间内按住移动装置上的特定按钮,以便使移动装置处于语音辨识模式中。作为另一个示例,车辆可包括允许用户通过大声说出地址信息而将地址信息输入到车辆导航系统中的逻辑。然而,在用户可说出供输入的地址信息之前,可能需要用户首先按压车辆的方向盘上的按钮并且导航菜单系统。因此,这些常规装置并没有为用户提供真正的免提体验,因为它们仍然需要用户通过使用手动输入机构(例如,装置上的按钮)使装置处于语音辨识模式中。同样地,实施方案提供用于为装置的用户提供完全免提体验的技术。例如,实施方案可检测由第一用户执行的、请求与第一装置交互的用户动作。根据一个实施方案,用户动作可以是由用户说出的可听命令。在另一个实施方案中,用户动作可以是用户直接看着装置。实施方案随后可确定第一用户相对于装置的当前位置所处的方向。因此,如果用户动作包括用户对装置说出可听命令,那么装置上的逻辑便可处理来自装置上的多个麦克风中的每一个的声音数据,以便确定可听命令来源的方向。作为另一个示例,在用户动作表示用户直接看着装置的情况下,装置上的逻辑可分析从装置的一个或多个摄像机收集的图像,并且可基于所分析的图像以及指定装置上的各个摄像机位置的预定义数据来确定用户相对于装置所处的方向。实施方案随后可基于第一装置的当前状态来确定对用户动作的可听响应。例如,装置上的逻辑可确定装置当前处于睡眠状态中,并且当检测到用户正看向装置的方向时,逻辑可确定适当的可听响应是询问用户“今天我怎么帮助您?”。确定的可听响应也可以基于用户动作中指定的内容来确定。因此,例如,在用户动作表示由用户说出的可听命令时,装置上的逻辑可分析可听命令并且可确定用户正请求一条特定信息。逻辑随后可生成查询,所述查询被配置来检索这条特定信息、传输供执行的查询、接收对应的查询结果并且基于所接收的查询结果生成可听响应。例如,如果逻辑确定用户动作正请求2014年感恩节的日期,那么逻辑便可检索这个信息并且可生成说出“今年的感恩节是在11月27日”的可听响应。实施方案随后可在第一用户所处的确定方向上将确定的可听响应输出为可操纵声束。例如,装置可配置有波束成形扬声器阵列或致动的定向扬声器,随后可被配置来传输定向在特定方向上的音频波,并且装置上的逻辑可配置这些音频输出装置以在接收用户动作的方向(即,用户相对于装置所处的方向)上传输可听响应。这样做会使得可听响应能够大体上仅被用户或紧邻的其他用户听见。图1是框图,其示出根据本文所述的一个实施方案的、包括配置有定向交互部件的免提装置的系统。如图所示,系统100包括配置有定向交互部件120的免提装置110以及云计算环境130,所述云计算环境130包括经由网络125而互连的查询处理部件140。一般来说,定向交互部件120被配置来:(a)检测来自相对于定向交互部件120所位于的装置的某一方向的用户动作,并且随后(b)针对定向在所述方向上的用户动作提供可听响应。例如,用户动作的示例包括但不限于由用户说出的语声指令(例如,通过分析使用免提装置110的麦克风装置记录的音频数据来检测的)以及正看向免提装置110的方向的用户(例如,通过分析免提装置110的摄像机装置所捕捉的图像来检测的)。由定向交互部件120提供的可听响应可根据用户请求而变化。例如,如果用户在语声指令中提出具体问题(例如,“2014年的感恩节是什么时候?”),那么定向交互部件120可使用一个或多个麦克风装置来检测用户的语声指令,并且可分析从这些麦克风装置收集的数据以确定用户的问题(例如,使用语音辨识技术)。定向交互部件120随后可尝试确定具体问题的答案,并且定向交互部件120可呈现这个答案作为响应。例如,定向交互部件120可生成查询,所述查询被配置来返回针对语声指令所指定的具体问题的答案。定向交互部件120可将生成的查询提交给查询处理部件140,所述本文档来自技高网...
<a href="http://www.xjishu.com/zhuanli/55/201580029277.html" title="具有定向接口的免提装置原文来自X技术">具有定向接口的免提装置</a>

【技术保护点】
一种非暂时性计算机可读介质,其包含计算机程序代码,当被运行时,所述计算机程序代码执行包括以下各项的操作:检测请求与第一装置交互并且来源于源的用户动作;确定所述源相对于所述第一装置的当前位置所处的方向;基于所述第一装置的当前状态来确定对所述用户动作的响应;以及大体上在所确定的所述源所处的方向上输出所确定的响应。

【技术特征摘要】
【国外来华专利技术】2014.06.03 US 14/294,3281.一种非暂时性计算机可读介质,其包含计算机程序代码,当被运行时,所述计算机程序代码执行包括以下各项的操作:检测请求与第一装置交互并且来源于源的用户动作;确定所述源相对于所述第一装置的当前位置所处的方向;基于所述第一装置的当前状态来确定对所述用户动作的响应;以及大体上在所确定的所述源所处的方向上输出所确定的响应。2.如权利要求1所述的非暂时性计算机可读介质,其中所述响应包括可听响应,并且其中所述响应作为定向在所述源位置所处的所述确定的方向上的可操纵声束来输出。3.如权利要求2所述的非暂时性计算机可读介质,所述操作还包括:通过所述第一装置的一个或多个传感器装置的操作来检测用户目光大体上定向在所述第一装置的方向上,所述检测包括:捕捉包括所述源的一个或多个图像;分析所述捕捉的一个或多个图像以识别所述一个或多个图像中的一个图像内的面部;以及基于所述一个或多个图像内的所识别的面部来确定所述用户目光是否大体上定向在所述第一装置的所述方向上。4.如权利要求1所述的非暂时性计算机可读介质,其中所述响应包括一个或多个帧,并且其中大体上在所确定的所述源所处的方向上输出所确定的响应还包括:在所述源的观察范围内确定物理表面;以及使用所述第一装置的投影仪装置来将所述一个或多个帧投射到所述物理表面上。5.如权利要求1所述的非暂时性计算机可读介质,其中所述用户动作包括语声命令,并且所述操作还包括:分析所述语声命令以确定与所述语声命令对应的用户请求;以及处理所述用户请求以产生结果,其中所确定的响应提供所产生的结果的至少一个指示。6.如权利要求5所述的非暂时性计算机可读介质,其中处理所述用户请求以产生结果还包括基于所述用户请求来生成可执行查询,并且其中处理所述用户请求以产生结果还包括执行所述可执行查询以产生查询结果,并且其中确定对所述用户动作的所述响应是基于与所述查询结果的至少一部分相关联的文本而使用文本至语音合成器来执行的。7.一种非暂时性计算机可读介质,其包含计算机程序代码,当被运行时,所述计算机程序代码执行包括以下各项的操作:检测触发事件,包括以下至少一项:检测语声触发;以及检测所述第一装置的方向上的用户目光;确定所述触发事件的源相对于所述第一装置的当前位置的方向;以及通过大体上在所确定的所述触发事件的所述源所处的方向上将可听响应作为可操纵声束输出来发起交互式语声对话。8.如权利要求7所述的非暂时性计算机可读介质,所述操作还包括:通过所述第一装置的一个或多个传感器的操作来检测所述用户目光定向在所述第一装置的所述方向上。9.如权利要求7所述的非暂时性计算机可读介质,所述操作还包括:分析所述语声触发以确定与所述语声触发对应的用户请求;以及处理所述用户请求以产生结果,其中所确定的可...

【专利技术属性】
技术研发人员:D迪森索S马蒂
申请(专利权)人:哈曼国际工业有限公司
类型:发明
国别省市:美国;US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1