当前位置: 首页 > 专利查询>声钰科技专利>正文

在集成语言导航服务环境中提供自然语言语音用户界面制造技术

技术编号:5484549 阅读:226 留言:0更新日期:2012-04-11 18:40
本发明专利技术提供一种会话式的、自然语言语音用户界面,其可以提供集成语音导航服务环境。该语音用户界面允许用户以自然语言提出关于各种导航服务的请求,并且还可以按照合作的、会话的对话方式与用户交互,来解析该请求。除其他以外,通过动态的上下文的认识、可用的信息源、域知识、用户行为和偏好、以及外部系统和设备,该语音用户界面可以提供集成的环境,在该环境中用户能够使用自然语言会话式地进行讲话,以发出查询、命令、或与该环境中提供的与导航服务有关的其他请求。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及一种自然语言语音用户界面,该语音用户界面能够促进在集成语音导 航服务环境中的合作的、会话式交互,并且具体而言,本专利技术涉及一种其中用户能够使用会 话式、自然语言查询或命令来请求导航服务的自然语言语音用户界面。
技术介绍
随着技术进步,消费电子产品在日常生活中有扮演越来越重要的角色的趋势。从 而,用户倾向于期望他们的电子设备(例如,现代移动电话、导航设备、个人数字助理、便携 式媒体播放器、以及提供了核心应用以外的大量功能的其他设备)具有更大的功能性、可 移动性以及方便性。然而,更大的功能性通常倾向于伴随有显著的学习曲线和阻碍用户充 分开发设备能力的其他障碍(例如,功能通常被隐藏在难以导航的菜单或界面之中)。此 外,尽管日益增加的对于移动性的需求放大了对于简单的正在进行中(on-the-go)设备交 互机制的需要,但是现有的系统通常具有复杂的人机界面。例如,现有的人机界面倾向于主 要利用键盘、按键、点选式(point and click)技术、触摸屏显示器、或其他界面机制的各种 组合。然而,这些界面会通常不适合于移动设备或车辆设备(例如,导航设备),这是因为在 交互的速度和精力不集中的危险会引起重大问题的环境中,这些界面是不方便的。因而,现 有的系统通常达不到提供简单并直观的交互机制的目的,潜在地抑制了采用某些技术的巨 大市场。因而,对于以直观方式开发技术的方法有日益增长的需求。为了解决这些和其他问题,各种现有的系统已经转向语音识别软件以简化人机交 互。例如,语音识别软件可以使用户能够开发设备的那些另外可能是不熟悉的、未知的或者 难于使用的应用和特征。然而,当现有语音用户界面实际工作时,它们还需要在用户的这部 分上进行有效的学习。例如,现有的语音用户界面(例如,命令和控制系统)通常需要用户 记住句法、词汇、短语或其他关键字或限定词以发出查询或命令。类似地,当用户可能不确 定所需要的确切内容,或者设备能够提供的内容时,现有的系统不能以产生的、合作的、自 然语言对话的方式来应答用户,以解析需求并推进会话。相反,很多现有的语言界面强迫用 户使用预定的命令或关键字来以这些系统能够理解的方式传送请求。与之相反,对于人类 交互的认知研究表明,提问或给出命令的人通常在很大程度上依赖于上下文和解答人的共 有知识。类似地,解答人也倾向于依赖上下文和共有知识来告知什么会是合适的响应。然 而,现有的语音用户界面没有充分地利用上下文、共有知识或其他类似信息来提供这样一 种环境,在这种环境中用户和设备能够合作,通过会话的、自然语言的交互来满足互相之间 的目的。此外,在近些年中,对于全球定位系统和能够导航的设备的需求显著地增长。导航 设备通常倾向于当用户在驾驶、正在进行或者在具有无需用手的界面就能够提供关键优势 的其他环境中时使用。例如,用户会希望避免由于将视线离开公路而造成分心,用户还会希 望与导航设备进行交互,例如,计算到目的地的路线、响应于交通状况而重新计算路线、找 到本地的餐馆、加油站或其他感兴趣的地点、或者执行其他的与导航相关的任务。在这些和其他情况中,有效地处理基于自然语言语音的输入能够使得用户以更安全、更简单和更有 效的方式与导航设备进行交互。然而,现有的系统通常不能够提供能够在导航和其他移动 环境中提供这些优势的集成的、会话式的、自然语言语音用户界面。现有的系统受到这些和其他的问题的影响。
技术实现思路
根据本专利技术的各个方面,与现有系统相关的各种问题都可以通过提供集成语音导 航服务环境的会话式的、自然语言语音用户界面来解决。根据本专利技术的各个方面,自然语言语音用户界面能够解析与导航相关的语音请求 (例如,计算路线、识别位置、显示地图等)。导航应用能够向用户提供交互的、到目的地或 旅途基准点的数据驱动指示,其中用户能够使用自由形式的自然语言来指定目的地或旅途 基准点(例如,用户能够识别全部或部分目的地,包括具体地址、大概的附近区域、城市、地 点的名称或类型、商业的名称或类型、人的姓名等)。由于自由形式的语音目的地输入会以 多种不同的形式来提供,所以可以对全部或部分语音目的地输入执行后处理,以识别合适 的目的地地址用于计算路线(例如,“有意义”的最近似的地址)。例如,对包含全部或部分 目的地的话语进行分析,以识别一个或多个可能的地址(例如,目的地的N最佳列表)。可 以对该N最佳列表进行后处理,来为可能的目的地分配权重或排序(例如,基于对应于所期 望的目的地的给出的可能目的地的确定程度)。因此,可以计算从用户的当前位置到N最佳 列表中的可能目的地中的权重最高的一个目的地的路线。此外,当语音目的地条目包括局 部目的地时,会在一个或多个随后的语言目的地条目之上逐次提炼最终目的地。导航应用 还可以提供到目的地的动态的、数据驱动的指示或路线。例如,导航应用可以访问与各种用 户指定以及环境数据源相关的数据,以提供沿路线的个性化数据驱动指示,该路线可以基 于从数据源取得的信息重新计算或修改。因而,可以动态地获取数据以识别可替换的路线、 重新计算路线或者另外提供路线服务。此外,可以根据当前路线过滤对于给定话语的可能 的答复或响应。根据本专利技术的各个方面,自然语言语音用户界面会动态地产生和/或加载用于解 释在话语中说了什么(例如,话语的内容)的识别语法。在动态识别语法中包含的信息可 以为导航代理、自动语音识别器(Automatic Speech Recognizer)、上下文堆栈或语音用户 界面中使用语法信息的各种其他部件使用。基于各种因素,通过有效地产生、更新、加载、扩 展或另外构建动态语法能够避免处理瓶颈、能够减少冲突、并且能够优化使用识别语法解 释话语的其他方面。例如,所产生的语法的大小会受系统中可用资源量的限制(例如,嵌入 式设备或具有少量动态存储器的其他设备,受限制的语法大小会限制要占据的资源量)。在 另一个示例中,动态语法的大小可以通过消除在上下文堆栈、共有知识,或其他本地资源中 可用的冗余关键字、标准或其他信息来减少。因此,能够通过减少语法中的复杂状态来改进 正确解释的有利程度(例如,当两个或多个元素可能会被混淆时,会消除这些元素中的一 个或多个元素来减少混淆)。根据本专利技术的各个方面,自然语言语音用户界面可以使用地理组块 (geographical chunking)技术产生动态识别语法。可以在给定时刻确定用户的位置,以 确定一个或多个地理近似(geographic proximity),该地理近似可用于为语法形成适当的拓扑域。例如,该拓扑域可以反映物理上的近似(例如,距离当前位置的距离)、民间组织 (civil organization)上的近似(例如,区、州、城市、附近地区、分支、地区等)、时间上的 近似(例如,从当前位置起的行进时间量)、方向上的近似(例如,基于方向行进向量)、或 它们的各种组合。从而,通过将用户的地理近似映射到一个或多个拓扑域,可以在存储器中 或在存储器之外剪除、扩展或交换或者另外产生和/或加载动态语法,以提供基于位置、时 间、行程或其他因素的最优识别(例如,当用户从一个区域移动到另一个区域时,可以在语 法中或语法之外交换信息,保证系统资源利用当前关于给定位置的信息)。根据本专利技术的各个本文档来自技高网
...
<a href="http://www.xjishu.com/zhuanli/55/200880126525.html" title="在集成语言导航服务环境中提供自然语言语音用户界面原文来自X技术">在集成语言导航服务环境中提供自然语言语音用户界面</a>

【技术保护点】
一种计算机实现的用于为导航设备提供自然语言语音用户界面的方法,该方法包括:在与所述导航设备相关联的输入机构处接收导航相关的基于语音的输入,该基于语音的输入至少包括由用户提供的自然语言话语;使用与语音识别引擎相关联的动态识别语法来产生所述自然语言话语的一个或多个初步解释;使用会话语言处理器对所述初步解释进行分析,该会话语言处理器使用共有知识和与导航上下文相关联的信息,在该导航上下文中确定所述自然语言话语的可能解释;以及将所述自然语言话语的可能解释传递到与所述导航上下文相关联的导航代理,所述导航代理可操作用于:基于所述自然语言话语的可能解释来识别包含在所述基于语音的输入中的一个或多个导航相关的请求;并且使用与多个信息源中的一个或多个信息源相关联的信息来解析所述请求,所述多个信息源至少包括导航指定信息源。

【技术特征摘要】
【国外来华专利技术】...

【专利技术属性】
技术研发人员:麦可肯尼维克凯萨琳张L贝尔德文亚力所罗门M特加尔弗席特古德高力L阿姆斯特隆P迪克里斯托柏尼齐墨曼S米纳克
申请(专利权)人:声钰科技
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1