当前位置: 首页 > 专利查询>声钰科技专利>正文

通过自然语言语音用户界面提供车载服务的方法和系统技术方案

技术编号:20007042 阅读:73 留言:0更新日期:2019-01-05 18:39
本发明专利技术涉及一种通过自然语言语音用户界面提供车载服务的方法和系统。语音用户界面允许用户以自然语言提出关于各种导航服务的请求,并且还可以按照合作的、会话的对话方式与用户交互,来解析该请求。除其他以外,通过动态的上下文的认识、可用的信息源、域知识、用户行为和偏好、以及外部系统和设备,该语音用户界面可以提供集成的环境,在该环境中用户能够使用自然语言会话式地进行讲话,以发出查询、命令、或与该环境中提供的与导航服务有关的其他请求。

Method and System of Providing Vehicle Service through Natural Language Voice User Interface

The invention relates to a method and system for providing on-board service through natural language voice user interface. Voice user interface allows users to request various navigation services in natural language, and can also interact with users in a cooperative, conversational way to parse the request. Through dynamic context awareness, available information sources, domain knowledge, user behavior and preferences, as well as external systems and devices, the voice user interface can provide an integrated environment in which users can make conversational statements in natural language to issue queries, commands, or other navigation services provided in the environment. Request.

【技术实现步骤摘要】
通过自然语言语音用户界面提供车载服务的方法和系统本申请是申请日为2008年7月9日、申请号为200880126525.2、专利技术名称为“在集成语言导航服务环境中提供自然语言语音用户界面”的中国专利申请的分案申请。
本专利技术涉及一种自然语言语音用户界面,该语音用户界面能够促进在集成语音导航服务环境中的合作的、会话式交互,并且具体而言,本专利技术涉及一种其中用户能够使用会话式、自然语言查询或命令来请求导航服务的自然语言语音用户界面。
技术介绍
随着技术进步,消费电子产品在日常生活中有扮演越来越重要的角色的趋势。从而,用户倾向于期望他们的电子设备(例如,现代移动电话、导航设备、个人数字助理、便携式媒体播放器、以及提供了核心应用以外的大量功能的其他设备)具有更大的功能性、可移动性以及方便性。然而,更大的功能性通常倾向于伴随有显著的学习曲线和阻碍用户充分开发设备能力的其他障碍(例如,功能通常被隐藏在难以导航的菜单或界面之中)。此外,尽管日益增加的对于移动性的需求放大了对于简单的正在进行中(on-the-go)设备交互机制的需要,但是现有的系统通常具有复杂的人机界面。例如,现有的人机界面倾向于主要利用键盘、按键、点选式(pointandclick)技术、触摸屏显示器、或其他界面机制的各种组合。然而,这些界面会通常不适合于移动设备或车辆设备(例如,导航设备),这是因为在交互的速度和精力不集中的危险会引起重大问题的环境中,这些界面是不方便的。因而,现有的系统通常达不到提供简单并直观的交互机制的目的,潜在地抑制了采用某些技术的巨大市场。因而,对于以直观方式开发技术的方法有日益增长的需求。为了解决这些和其他问题,各种现有的系统已经转向语音识别软件以简化人机交互。例如,语音识别软件可以使用户能够开发设备的那些另外可能是不熟悉的、未知的或者难于使用的应用和特征。然而,当现有语音用户界面实际工作时,它们还需要在用户的这部分上进行有效的学习。例如,现有的语音用户界面(例如,命令和控制系统)通常需要用户记住句法、词汇、短语或其他关键字或限定词以发出查询或命令。类似地,当用户可能不确定所需要的确切内容,或者设备能够提供的内容时,现有的系统不能以产生的、合作的、自然语言对话的方式来应答用户,以解析需求并推进会话。相反,很多现有的语言界面强迫用户使用预定的命令或关键字来以这些系统能够理解的方式传送请求。与之相反,对于人类交互的认知研究表明,提问或给出命令的人通常在很大程度上依赖于上下文和解答人的共有知识。类似地,解答人也倾向于依赖上下文和共有知识来告知什么会是合适的响应。然而,现有的语音用户界面没有充分地利用上下文、共有知识或其他类似信息来提供这样一种环境,在这种环境中用户和设备能够合作,通过会话的、自然语言的交互来满足互相之间的目的。此外,在近些年中,对于全球定位系统和能够导航的设备的需求显著地增长。导航设备通常倾向于当用户在驾驶、正在进行或者在具有无需用手的界面就能够提供关键优势的其他环境中时使用。例如,用户会希望避免由于将视线离开公路而造成分心,用户还会希望与导航设备进行交互,例如,计算到目的地的路线、响应于交通状况而重新计算路线、找到本地的餐馆、加油站或其他感兴趣的地点、或者执行其他的与导航相关的任务。在这些和其他情况中,有效地处理基于自然语言语音的输入能够使得用户以更安全、更简单和更有效的方式与导航设备进行交互。然而,现有的系统通常不能够提供能够在导航和其他移动环境中提供这些优势的集成的、会话式的、自然语言语音用户界面。现有的系统受到这些和其他的问题的影响。
技术实现思路
根据本专利技术的各个方面,与现有系统相关的各种问题都可以通过提供集成语音导航服务环境的会话式的、自然语言语音用户界面来解决。根据本专利技术的各个方面,自然语言语音用户界面能够解析与导航相关的语音请求(例如,计算路线、识别位置、显示地图等)。导航应用能够向用户提供交互的、到目的地或旅途基准点的数据驱动指示,其中用户能够使用自由形式的自然语言来指定目的地或旅途基准点(例如,用户能够识别全部或部分目的地,包括具体地址、大概的附近区域、城市、地点的名称或类型、商业的名称或类型、人的姓名等)。由于自由形式的语音目的地输入会以多种不同的形式来提供,所以可以对全部或部分语音目的地输入执行后处理,以识别合适的目的地地址用于计算路线(例如,“有意义”的最近似的地址)。例如,对包含全部或部分目的地的话语进行分析,以识别一个或多个可能的地址(例如,目的地的N最佳列表)。可以对该N最佳列表进行后处理,来为可能的目的地分配权重或排序(例如,基于对应于所期望的目的地的给出的可能目的地的确定程度)。因此,可以计算从用户的当前位置到N最佳列表中的可能目的地中的权重最高的一个目的地的路线。此外,当语音目的地条目包括局部目的地时,会在一个或多个随后的语言目的地条目之上逐次提炼最终目的地。导航应用还可以提供到目的地的动态的、数据驱动的指示或路线。例如,导航应用可以访问与各种用户指定以及环境数据源相关的数据,以提供沿路线的个性化数据驱动指示,该路线可以基于从数据源取得的信息重新计算或修改。因而,可以动态地获取数据以识别可替换的路线、重新计算路线或者另外提供路线服务。此外,可以根据当前路线过滤对于给定话语的可能的答复或响应。根据本专利技术的各个方面,自然语言语音用户界面会动态地产生和/或加载用于解释在话语中说了什么(例如,话语的内容)的识别语法。在动态识别语法中包含的信息可以为导航代理、自动语音识别器(AutomaticSpeechRecognizer)、上下文堆栈或语音用户界面中使用语法信息的各种其他部件使用。基于各种因素,通过有效地产生、更新、加载、扩展或另外构建动态语法能够避免处理瓶颈、能够减少冲突、并且能够优化使用识别语法解释话语的其他方面。例如,所产生的语法的大小会受系统中可用资源量的限制(例如,嵌入式设备或具有少量动态存储器的其他设备,受限制的语法大小会限制要占据的资源量)。在另一个示例中,动态语法的大小可以通过消除在上下文堆栈、共有知识,或其他本地资源中可用的冗余关键字、标准或其他信息来减少。因此,能够通过减少语法中的复杂状态来改进正确解释的有利程度(例如,当两个或多个元素可能会被混淆时,会消除这些元素中的一个或多个元素来减少混淆)。根据本专利技术的各个方面,自然语言语音用户界面可以使用地理组块(geographicalchunking)技术产生动态识别语法。可以在给定时刻确定用户的位置,以确定一个或多个地理近似(geographicproximity),该地理近似可用于为语法形成适当的拓扑域。例如,该拓扑域可以反映物理上的近似(例如,距离当前位置的距离)、民间组织(civilorganization)上的近似(例如,区、州、城市、附近地区、分支、地区等)、时间上的近似(例如,从当前位置起的行进时间量)、方向上的近似(例如,基于方向行进向量)、或它们的各种组合。从而,通过将用户的地理近似映射到一个或多个拓扑域,可以在存储器中或在存储器之外剪除、扩展或交换或者另外产生和/或加载动态语法,以提供基于位置、时间、行程或其他因素的最优识别(例如,当用户从一个区域移动到另一个区域时,可以在语法中或语法之外交换本文档来自技高网
...

【技术保护点】
1.一种用于通过自然语言语音用户界面提供车载服务的方法,所述方法由车载远程通信处理系统实施,所述车载远程通信处理系统包括多个车载设备以及利用计算机程序指令编程的一个或多个物理处理器,所述计算机程序指令在被执行时,对所述车载远程通信处理系统进行编程以执行所述方法,所述方法包括:通过所述车载远程通信处理系统连接至与所述多个车载设备分离的移动设备;通过所述车载远程通信处理系统接收第一自然语言话语;通过所述车载远程通信处理系统确定所述第一自然语言话语的第一意图;通过所述车载远程通信处理系统确定所述第一意图涉及待由所述移动设备处理的第一请求;通过所述车载远程通信处理系统将所述第一请求发送到所述移动设备;通过所述车载远程通信处理系统接收第二自然语言话语;通过所述车载远程通信处理系统确定所述第二自然语言话语的第二意图;通过所述车载远程通信处理系统确定所述第二意图涉及待由选自所述多个车载设备的车载设备处理的第二请求;通过所述车载远程通信处理系统将所述第二请求发送到所述车载设备;通过所述车载远程通信处理系统接收第三自然语言话语;通过所述车载远程通信处理系统确定所述第三自然语言话语的第三意图;通过所述车载远程通信处理系统确定所述第三意图涉及用于经由网络化的搜索引擎搜索信息的第三请求;以及响应于确定所述第三意图涉及用于经由所述网络化的搜索引擎搜索信息的所述第三请求,通过所述车载远程通信处理系统将所述第三请求发送到所述网络化的搜索引擎。...

【技术特征摘要】
2007.12.11 US 11/954,0641.一种用于通过自然语言语音用户界面提供车载服务的方法,所述方法由车载远程通信处理系统实施,所述车载远程通信处理系统包括多个车载设备以及利用计算机程序指令编程的一个或多个物理处理器,所述计算机程序指令在被执行时,对所述车载远程通信处理系统进行编程以执行所述方法,所述方法包括:通过所述车载远程通信处理系统连接至与所述多个车载设备分离的移动设备;通过所述车载远程通信处理系统接收第一自然语言话语;通过所述车载远程通信处理系统确定所述第一自然语言话语的第一意图;通过所述车载远程通信处理系统确定所述第一意图涉及待由所述移动设备处理的第一请求;通过所述车载远程通信处理系统将所述第一请求发送到所述移动设备;通过所述车载远程通信处理系统接收第二自然语言话语;通过所述车载远程通信处理系统确定所述第二自然语言话语的第二意图;通过所述车载远程通信处理系统确定所述第二意图涉及待由选自所述多个车载设备的车载设备处理的第二请求;通过所述车载远程通信处理系统将所述第二请求发送到所述车载设备;通过所述车载远程通信处理系统接收第三自然语言话语;通过所述车载远程通信处理系统确定所述第三自然语言话语的第三意图;通过所述车载远程通信处理系统确定所述第三意图涉及用于经由网络化的搜索引擎搜索信息的第三请求;以及响应于确定所述第三意图涉及用于经由所述网络化的搜索引擎搜索信息的所述第三请求,通过所述车载远程通信处理系统将所述第三请求发送到所述网络化的搜索引擎。2.如权利要求1所述的方法,所述方法还包括:通过所述车载远程通信处理系统获得指示由所述多个车载设备提供的一个或多个服务的第二信息;以及通过所述车载远程通信处理系统基于所述第二信息选择所述车载设备。3.如权利要求1所述的方法,其中,获得所述第一自然语言话语的所述第一意图包括:通过所述车载远程通信处理系统将所述第一自然语言话语作为输入提供给语音识别引擎;响应于接收到从所述第一自然语言话语识别的字或短语,作为所述语音识别引擎的输出,通过所述车载远程通信处理系统将所述字或短语作为输入提供给会话语言处理器;以及通过所述车载远程通信处理系统,基于作为输入提供给所述会话语言处理器的所述字或短语,解释所述第一自然语言话语,以确定所述第一自然语言话语的所述第一意图。4.如权利要求1所述的方法,其中,所述第一请求涉及发起电话呼叫,其中,将所述第一请求发送到所述移动设备包括:通过所述车载远程通信处理系统使所述第一请求被发送到移动电话,以基于所述第一请求发起所述电话呼叫。5.如权利要求1所述的方法,其中,所述第二请求涉及提供从第一位置到目的地的引导,以及所述车载设备是导航设备。6.如权利要求5所述的方法,所述方法还包括:通过所述车载远程通信处理系统获得车辆中的汽油低于阈值量的指示;以及通过所述车载远程通信处理系统基于所述车辆中的汽油低于所述阈值量的所述指示,计算到所述目的地的路线。7.如权利要求5所述的方法,所述方法还包括:响应于用户的指示所述路线和/或目的地的提炼的一个或多个随后的交互,通过所述车载远程通信处理系统重新计算到所述目的地的路线。8.如权利要求1所述的方法,其中,所述第二请求涉及播放音乐,并且所述车载设备是无线电设备。9.如权利要求1所述的方法,其中,所述信息涉及电影放映时间,其中,将所述第三请求发送到所述网络化的搜索引擎包括:通过所述车载远程通信处理系统基于确定所述第三意图涉及电影放映时间,使所述网络化的搜索引擎搜索电影放映时间。10.如权利要求1所述的方法,所述方法还包括:通过所述车载远程通信处理系统使涉及所述第一请求的显示信息显示在显示设备上,其中,所述显示信息指示与所述第一请求相关的服务已经被执行。11.一种用于通过自然语言语音用户界面提供车载服务的车载远程通信处理系统,所述车载远程通信处理系统包括:多个车载设备以及利用计算机程序指令编程的一个或多个物理处理器,所述计算机程序指令在被执行时,对所述车载远程通信处理系统进行编程以:连...

【专利技术属性】
技术研发人员:麦可·肯尼维克凯萨琳·张L·贝尔德文亚力·所罗门M·特加尔弗席特·古德高力L·阿姆斯特隆P·迪克里斯托柏尼·齐墨曼S·米纳克
申请(专利权)人:声钰科技
类型:发明
国别省市:美国,US

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1