当前位置: 首页 > 专利查询>谷歌公司专利>正文

基于场境的语音识别语法选择方法和系统技术方案

技术编号:16530354 阅读:64 留言:0更新日期:2017-11-09 22:30
本申请涉及基于场境的语音识别语法选择方法和系统。除其它外,本说明书的主题可以实现在包括以下的方法中:接收从与第一计算设备相关联的非语言用户行为取得的地理信息。非语言用户行为暗示用户对地理位置感兴趣。该方法还包括使用取得的地理信息来识别与该地理位置相关联的语法,以及输出语法指示符以供在选择所识别的语法对来自用户的话音输入进行语音识别处理中使用。

【技术实现步骤摘要】
基于场境的语音识别语法选择方法和系统分案说明本申请属于申请日为2009年3月6日的中国专利技术专利申请No.200980115721.4的分案申请。
本说明书涉及语音识别。
技术介绍
多模式应用可以接受多种类型或模式的输入。例如,多模式应用可以从用户接受诸如键入命令和鼠标点击的输入;然而,多模式应用还可以接受诸如语音输入的其它形式的输入。语音识别系统可以使用包括特定词汇表的语法来解释语音输入。某些多模式应用实现表格填充模型,其中应用中的不同输入字段与不同语法相关联。例如,多模式应用可以将包括名称的词汇表的“名称”语法与接受人的名称的“名称”字段相关联。在某人用他或她的鼠标选择“名称”字段时,多模式应用可以选择与该字段相关联的“名称”语法。
技术实现思路
总的来说,本文档描述了选择用于在语音识别中使用的语法,其中该语法基于隐式场境(context)信息来选择,所述隐式场境信息基于一个或多个用户行为。在第一总括方面,描述了一种计算机实现的方法。该方法包括接收从与第一计算设备相关联的非语言用户行为取得的地理信息。该非语言用户行为暗示用户对地理位置感兴趣。该方法还包括使用取得的地理信息来识别与该地理位置相关联的语法,以及输出语法指示符以供在选择所识别的语法对来自用户的话音输入进行语音识别处理中使用。在第二总括方面,描述了一种计算机实现的方法,其包括基于与计算设备相关联的用户行为接收场境信息,其中语音识别处理器不提示(unprompted)该用户行为。该方法包括基于该场境信息取得地理位置,识别与该地理位置相关联的语法,以及输出语法标识符以供在选择所述语法用来处理来自所述用户的话音输入中使用在又一个总括方面,描述了一个系统。该系统包括基于与第一计算设备相关联的非语言用户行为来接收场境信息的接口。该非语言用户行为暗示用户对地理感兴趣。该系统还包括用于识别与从所接收的场境信息取得的地理位置相关联的语法的装置,以及配置为使用所识别的语法来解释从用户接收的话音输入的语音识别服务器。在此描述的系统和技术可以提供以下优势的一个或多个。首先,系统可以通过识别语法的适当子集而不是使用更大的普通语法来提高识别话音输入的速度。额外地,选择语法的子集对于在与该子集相关联的特定场境内给定的话音命令可以提高语音识别的准确性。系统还可以减少在语音识别过程中的用户交互量。此外,可以以对用户透明的方式(例如,基于与软件应用的用户交互而不是基于对语音识别系统的提示的明确用户回答)选择额外或新的语法。在下面的附图和描述中阐述了一个或多个实施例的细节。其它特征和优势从描述和附图、以及从权利要求将是显而易见的。附图说明图1是用于选择在计算机实现的语音识别中使用的语法的示例性系统的图。图2是在选择用于语音识别的语法中使用的示例性客户端和示例性音频处理系统的图。图3是用于基于场境信息来选择语法的示例性方法的流程图。图4示出了用于客户端的与音频处理系统交互的用户界面的示例性截屏。图5是可以用于实现所描述的系统和方法的计算设备的框图。在各个附图中相同的参考符号指示相同的元素。具体实施方式本文档描述了用于选择在话音识别中使用的语法的系统和技术。更具体地,应用可以基于用户与运行该应用的设备如何交互来生成场境信息。所述设备可以将所述场境信息传送给语音识别系统。语音识别系统可以识别与所述场境信息相关联的特定语法,并且可以随后在对从所述设备接收的话音输入(例如,来自所述设备的用户的语音命令)进行音频识别中使用所识别的语法。在一些实施方式中,场境信息包括地理信息。如果用户使用蜂窝电话上的移动浏览器来查看地图,则该蜂窝电话可以将与所述地图显示的地理位置有关的信息传送给语音识别系统。语音识别系统可以基于所接收的信息来识别所述地理位置,以及可以选择与所述地理位置相关联的语法,所述语法包括词的词汇表、句法等。语音识别系统可以使用所选择的语法来解释随后从所述蜂窝电话接收的话音输入。用户可以选择允许与该用户相关联的设备(例如,通过分配给该用户的唯一标识符—诸如cookie)与语音识别系统共享场境信息。如果用户不选择共享场境信息,则语音识别系统可以使用默认语法或为用于在选择在语音识别处理中使用的特定语法时使用的地理或其它场境信息明确提示用户。图1是用于选择在计算机实现的语音识别中使用的语法的示例性系统100的图。在一些实施方式中,示例性系统100基于作为用户行为的结果生成的隐式场境信息来选择语法。系统100包括客户端设备102、语法选择服务器104和语音识别服务器106。在图1的实施方式中,客户端102将场境信息传送给语法选择服务器104,其使用所述场境信息来选择语法。语法选择服务器将与所选择的语法有关的信息发送给语音识别服务器106,其使用所选择的语法来解释从客户端102接收的音频输入。例如,客户端102可以是正在运行移动浏览器108的蜂窝电话。用户可以将搜索输入到移动浏览器以识别出售“冰屋”的企业。浏览器可以显示示出了位于加拿大的南、北达科他州和明尼苏达州的相关企业的地图。用户可能先前已输入了由浏览器使用来识别用于在地图上示出的位置的位置标识符,诸如邮编。用户可以在先前会话中输入位置标识符,以及浏览器可以存储标识符以供在随后会话中使用(例如,位置标识符可以作为cookie被存储在客户端上)。在其它实施方式中,蜂窝电话运行专用应用108,而不是移动浏览器108。例如,专用应用108可以不能够浏览网页,但是可以被配置为与诸如在线地图应用的特定远程应用对接。在蜂窝电话102上运行的移动浏览器或另一个应用如标记“1”的箭头所指示可以将隐式地理信息114传送给语法选择服务器。在一些实施方式中,场境信息包括基于移动浏览器108显示的地图的隐式地理信息114。例如,隐式地理信息114可以包括识别所显示的地图的中心的坐标。在该示例中,地图的中心与在明尼苏达州的中间的位置一致。语法选择服务器104可以基于所接收的场境信息来选择116语法。在一些实施方式中,如果场境信息包括地理信息114,则语法选择服务器可以访问识别与地理位置相关联的语法112的数据存储110。特定语法可以与特定地理位置相关联。语法112中的每一个可以包括和与相应的地理位置相关联的词汇表相对应的词汇表。例如,与明尼苏达州明尼阿波利斯相关联的语法可以包括描述位于明尼阿波利斯或与明尼阿波利斯关联地发生的企业、兴趣点、事件、新闻等的词或短语。在图1中,隐式地理信息114包括位于明尼苏达州的中间的位置的坐标。语法选择服务器识别锚定在最接近于明尼苏达州的中间的位置处或具有在该位置处的中心的语法。语法选择服务器如标记“2A”和“2B”的箭头所指示可以生成识别语法的信息118。在一些实施方式中,然后,语法选择服务器104如标记“3”的箭头所指示将所识别的语法信息118传送给语音识别服务器106。用户可以对蜂窝电话102说话,蜂窝电话102如箭头“4”所指示将话音输入120传送给语音识别服务器106。语音识别服务器106可以使用语法选择服务器104已识别的语法来解释话音输入120。识别服务器106可以基于话音输入来执行一个或多个动作。在一些实施方式中,语音识别服务器106如标记“5”的箭头所指示可以基于话音输入将响应传送回蜂窝电话102。例如,本文档来自技高网...
基于场境的语音识别语法选择方法和系统

【技术保护点】
一种计算机实现的方法,包括:提供地理区域的地图以供显示;接收与话语相对应的语音数据以发起搜索;响应于接收与所述话语相对应的所述语音数据,更新所述地图以提供标识与所述话语的转录相关联的位置的视觉指示符,所述视觉指示符是基于与所述地图相关联的场境信息来生成的。

【技术特征摘要】
2008.03.07 US 12/044,3101.一种计算机实现的方法,包括:提供地理区域的地图以供显示;接收与话语相对应的语音数据以发起搜索;响应于接收与所述话语相对应的所述语音数据,更新所述地图以提供标识与所述话语的转录相关联的位置的视觉指示符,所述视觉指示符是基于与所述地图相关联的场境信息来生成的。2.如权利要求1所述的方法,其中,所述场境信息包括从所述地理区域的所述地图导出的隐式地理信息。3.如权利要求1所述的方法,其中,所述场境信息包括从先前提供以供显示的内容导出的地理信息。4.如权利要求1所述的方法,进一步包括:传送关于所述地理区域的所述地图的地理信息。5.如权利要求1所述的方法,其中,所述话语标识位置。6.如权利要求1所述的方法,其中,所述场境信息包括标识一个或多个搜索查询的搜索历史,所述一个或多个搜索查询由与一个或多个计算设备相关联的用户提交至一个或多个搜索服务。7.如权利要求1所述的方法,其中,所述转录是使用动态选择的语法来生成的,所述动态选择的语法与基于所述场境信息来识别的地理位置相关联。8.如权利要求7所述的方法,其中,进一步基于与先前所提交的一个或多个搜索查询相关联的搜索结果来识别所述地理位置。9.一种系统,包括:存储器,用于存储数据;以及硬件处理器,能够操作以执行操作,所述操作包括:提供地理区域的地图以供显示;接收与话语相对应的语音数据以发起搜索;响应于接收与所...

【专利技术属性】
技术研发人员:大卫·P·辛格尔顿德巴基特·高什
申请(专利权)人:谷歌公司
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1