当前位置: 首页 > 专利查询>诺基亚公司专利>正文

提供话音接口的方法和系统技术方案

技术编号:11587756 阅读:76 留言:0更新日期:2015-06-10 20:53
公开了用于提供话音接口的方法和系统。用户终端的分类器话音接口可以接收查询,可以解析查询以识别属性,并且可以基于属性处理查询以选择多个域特定话音接口的第一域特定话音接口,其中每个域特定话音接口包括处理不同类型的查询的专用信息。分类器话音接口可以进一步指示第一域特定话音接口处理查询。

【技术实现步骤摘要】
本申请是申请日为2009年9月10日、申请号为200980153496.3、专利技术名称为“提供话音接口的方法和系统”的专利技术专利申请的分案申请。
本专利技术的示例性实施方式通常涉及话音查询。更具体地,本发明的示例性实施方式涉及基于话音的用户接口。
技术介绍
持续复杂的特征已经实现在移动设备上,例如移动电话。当前的移动设备通过web接口和图形用户接口显示来提供对各种信息的访问,但用户通常限于使用小键盘来导航通过菜单层级以便选择期望的应用。除了图形用户接口以外,还存在多种支持话音的用户接口。短消息服务(SMS)口述、电子邮件口述、姓名拨号应用、对话驱动的日历应用以及音乐播放器可以交互式地指导用户通过任务。常规的口语对话系统以固定的顺序询问用户一系列固定的问题,以缩小可能回答的范围。例如,为了找到餐馆,系统例如在提供任何的回答前,可以提示用户来指定针对菜肴、街坊和价格范围等的偏好。这种类型的交互不能满足不具有良好定义的偏好或者可能期望探查可能性的空间的用户对信息寻求的需求。也已经开发了常规的算法,将对话建模为马尔可夫判定过程并且经由强化学习来优化模型。然而,这些算法依赖于复杂和成本高的训练数据,这些训练数据从大量的人机交互或此类对话的仿真导出。
技术实现思路
下文提供对本公开的一些示例性实施方式的简化总结,以便提供对本专利技术的一些示例性实施方式的基本理解。该总结并不是扩展概览,并且不旨在标识关键或重要的元素或描述权利要求的范围。下面的总结仅仅以简化的形式提出一些概念和示例性的实施方式,作为下面提供的更为详细描述的序言。本公开的一些示例性实施方式针对于用于提供分类器话音接口的设备、方法和系统。更具体地,根据本公开的一些示例性实施方式的方法、设备和系统提供接收查询,解析查询以识别属性,根据属性处理查询以选择多个域特定话音接口的第一域特定话音接口,其中每个域特定话音接口包括专用信息以处理不同类型的查询,并且指示第一域特定话音接口处理该查询。本公开的附加示例性实施方式针对于用于提供域特定话音接口的设备、方法和系统。更具体地,根据本公开的一些示例性实施方式的方法、设备和系统提供接收属性,基于属性应用评分功能来生成针对多个查询响应模板的每个的效用得分,基于效用得分选择多个查询响应模板的至少一个,并且可听地输出从至少一个查询响应模板生成的查询响应。附图说明通过参考下面的描述并考虑附图,将获得本专利技术及其优势的更为全面的理解,其中类似的参考编号指示类似的特征,并且其中:图1图示出根据本公开的示例性实施方式的用户终端;图2图示出根据本公开的示例性实施方式的一系列分层的软件应用的架构;图3图示出根据本公开的示例性实施方式的知识库;图4图示出根据本公开的示例性实施方式的域;图5图示出根据本公开的示例性实施方式的分类器话音接口和域特定话音接口;图6图示出根据本公开的示例性实施方式的用于收集和对元数据编索引以生成知识库的方法;图7图示出根据本公开的示例性实施方式的用于处理用户查询以选择用于处理查询的域特定话音接口的方法;图8图示出根据本公开的示例性实施方式的在识别的域特定话音接口处处理查询的方法。具体实施方式在各种实施方式的下面描述中,将对形成其一部分的附图做出参考,在附图中通过说明示出其中本专利技术的一个或多个示例性实施方式可以被实践的各种实施方式。将理解可以使用其他的实施方式并且在不偏离本专利技术的范围下可以做出结构和功能上的改变。图1图示出根据本公开的示例性实施方式的用户终端102。用户终端102可以可听地呈现话音接口以响应来自用户的话音命令。用户可以与话音接口进行对话以使得用户终端102执行任务。例如,话音接口可以接收来自用户的查询,可以处理查询以识别对应于查询的一个或多个适当的响应,并且可以可听地呈现一个或多个响应的动态集合或可以执行动作。因此,替代于以固定的顺序可听地呈现固定的一系列问题,话音接口可以处理查询以识别对应于查询的动态查询响应,以便可听地呈现给用户。在示例性实施方式中,用户终端102可以是移动通信设备,移动电话,或移动计算机,如所示出的,或也可以是数字视频记录器(DVR)、机顶盒(STB)、服务器计算机、计算机、硬盘、因特网浏览器设备、游戏设备、音频/视频播放器、数字照相机/摄像机、电视机、无线广播接收机、定位设备、有线或无线通信设备、和/或其任意的组合。用户终端102可以是独立的设备、例如如图1中所绘出的,或者也可以集成进另一设备中。例如,用户终端102也可以包括在汽车中以提供话音接口,从而与正在开车的用户进行交互。用户终端102也可以例如集成进汽车的仪表板中,或者经由有线的或无线的连接通信地耦合到汽车。在所绘出的例子中,用户终端102可以包括显示器104、处理器106、收发器108、用户接口110、音频收发器112、存储器114和元数据数据库116。用户接口110可以包括小键盘、触摸屏、话音接口、四箭头按键、游戏杆、数据手套、鼠标、轨迹球、触摸屏、或其他合适的设备,用于接收来自用户的输入以控制用户终端102。收发器108可以允许用户终端102通过有线信道或无线信道进行通信。音频收发器112可以包括扬声器以用于向用户输出音频并且包括麦克风以用于接收来自用户的音频输入。由用户终端102内的其他组件和处理器106使用的计算机可执行指令和数据可以存储在存储器114中,以便执行这里所述描述的任意方法步骤和功能。存储器114可以以只读存储器模块或随机存取存储器模块的任意组合来实现,可选地包括易失性和非易失性存储器二者。另外,用户终端102的一些或所有的计算机可执行指令可以体现在硬件或固件(未示出)中。例如,用户终端102可以包括一个或多个模块,这些模块包括硬件、固件、由处理器106执行的软件和/或其任意的组合。在一个示例性实施方式中,处理器106可以执行一系列分层的软件应用以提供用户终端102处的话音接口。一系列分层的应用可以包括分类器话音接口应用和一个或多个域特定话音接口应用。处理器106可以执行分类器话音接口应用以提供分类器话音接口并且可以执行一个或多个域特定话音接口应用以提供相应的域特定话音接口。一系列分层的软件应用可以以下面描述的方式来处理在用户终端102的音频收发器112处接收到的查询。...

【技术保护点】
一种用于提供话音接口的方法,包括:接收属性;基于所述属性应用评分功能以便生成针对多个查询响应的每个的效用分数;基于所述效用分数选择多个查询响应模板的至少一个查询响应模板;以及可听地输出从所述至少一个查询响应模板生成的查询响应。

【技术特征摘要】
2008.10.31 US 12/263,0121.一种用于提供话音接口的方法,包括:
接收属性;
基于所述属性应用评分功能以便生成针对多个查询响应的每个
的效用分数;
基于所述效用分数选择多个查询响应模板的至少一个查询响应
模板;以及
可听地输出从所述至少一个查询响应模板生成的查询响应。
2.根据权利要求1所述的方法,其中所述属性是多个属性之一。
3.根据权利要求2所述的方法,进一步包括基于所述用户偏好
排列所述多个属性,以便向所述多个属性的每个分配相应的权重。
4.根据权利要求3所述的方法,其中基于上下文信息来对所述
属性进行加权。
5.根据权利要求1所述的方法,进一步包括提示用户输入后续
的查询。
6.根据权利要求1所述的方法,进一步包括识别对应于第一效
用分数的域内动作。
7.根据权利要求6所述的方法,进一步包括执行所述域内动作。
8.根据权利要求6所述的方法,进一步包括识别与所述域内动
作关联的交叉域动作。
9.根据权利要求8所述的方法,进一步包括将处理移交给域特
定话音接口以执行所述交叉域动作。
10.根据权利要求9所述的方法,进一步包括从所述域特定话音
接口接收所述交叉域动作的结果。
11.一个或多个存储计算机可执行指令的计算机可读介质,当计
算机可执行指令由处理器执行时,使得所述处理器执行一种方法,
包括:
接收属性;
基于所述属性应用评分功能以便生成针对多个查询响应的每个
的效用分数;
基于所述效用分数选择多个查询响应模板的至少一个查询响应
模板;以及
可听地输出从所述至少一个查询响应模板生成的查询响应。
12.根据权利要求11所述的一个或多个计算机可读介质,存储
另外的计算机可执行指令,当由所述处理器执行时,所述计算机可
执行指令使得所述处理器执行一种方法,包括基于用户偏好排列相
对于多个属性的属性,以便向多个属性的每个分配相应的权重。
13.根据权利要求11所述的一个或多个计算机可读介质,存储
另外的计算机可执行指令,当由所述处理器执行时,所述计算机可
执行...

【专利技术属性】
技术研发人员:M·阿德勒I·基斯J·波利夫罗尼邬涛
申请(专利权)人:诺基亚公司
类型:发明
国别省市:芬兰;FI

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1