减轻、解决用户定义语音命令歧义的方法和语音处理系统技术方案

技术编号:3550964 阅读:200 留言:0更新日期:2012-04-11 18:40
一种用于减轻新的用户定义语音命令的歧义问题的方法。可以接收用于用户定义语音命令的原始命令。然后可以确定所述原始命令是否有可能与一组现有的语音命令相混淆。当不太可能混淆时,可以自动存储所述原始命令。当有可能混淆时,可以自动确定不太可能与现有命令相混淆的替代命令。可以呈现所述替代作为所述原始命令的可选方案,并且可以选择性地将其存储作为所述用户定义语音命令。

【技术实现步骤摘要】

本专利技术涉及语音处理的领域,并且更特别地,涉及自动向用户提供对可能有歧义的用户定义语音命令(user-defined speech command)的替代。
技术介绍
很多启用了语音的应用允许创建用户定义语音命令,而一旦定义了该语音命令,就可以将其用于触发关联的动作或动作集。例如,启用了语音的移动电话的用户可以建立用户定义语音命令来呼叫诸如配偶的常联络人(frequent contact)。在另一例子中,启用了语音的字处理器可以包括与宏关联的用户定义语音命令。例如,命令“send redline(发送红线)”可以导致字处理器生成红线版本(redline version)的有效文档并且将该文档发送至原始版本的有效文档的发送者的电子邮件地址。而在另一实施例中,启用了语音的门户的用户可以创建可以用于参考所定义的门户组件集合的定制语音命令。困扰用户定义语音命令的问题在于其有可能在听觉上类似于其它现有的语音命令,这可能导致语音识别歧义。例如,用户定义语音命令“mailcheck(邮件检查)”可能在听觉上类似于语音命令“spell check(拼写检查)”,这可能导致语音识别系统误解用户所发布的语音命令。一些启用了语音的系统包括用于向用户通知用户定义命令类似于现有命令(而这可能导致识别混淆)的机制。用户然后可以获准为动作集定义不同的语音命令,或者越权于启用了语音的系统以使系统接受可能混淆的命令,而不管可能的歧义。然而,对于用户普遍的是不能够容易地想到对原始命令的替代话音命令。甚至更让用户沮丧的是:想到一个或多个备选命令却仅仅发现该备选命令还是导致可能与现有语音命令含混不清。-->需要一种解决方案来减轻用户在可能有歧义的用户命令方面的挫折。理想地,该解决方案将为用户提供系统所允许的对可能有歧义的命令的替代术语。也就是说,已经知道所建议的术语与现有命令不具有任何听觉上的相似性。
技术实现思路
本专利技术为用户提供了对可能有歧义的用户定义语音命令的替代。更具体而言,当用户提供将要与用户定义语音命令相关联的新的言辞(utterance)时,可以对于可能混淆的、歧义的或在听觉上类似的术语搜索现有命令的储存库。换句话说,可以进行检查以确定是否有可能所述新的言辞会与一个或多个其它语音命令相混淆。当所述言辞不太可能混淆的时候,可以自动地将其存储作为新的用户定义语音命令。否则,语音处理系统可以为所述用户言辞确定不太可能与现有命令相混淆的至少一个同义词或替代。可以提示所述用户使用所述替代而非原始言辞以免混淆。当所述用户接受建议时,可以将所述替代存储作为新的话音命令。当所述用户拒绝所述建议并且选择保留所述原始言辞时,仍可以将所述替代随所述新的言辞一起存储用于所述用户定义语音命令。所述原始言辞可以是用于触发所述用户定义命令的第一机制,而所述替代可以是第二或备用机制。在用户发布的命令与所述原始言辞含混不清的情况下,可以提示用户明确所发布的命令,其中所述提示包括所述替代而非所述原始言辞。进一步地,当呈现可用命令的列表时,可以呈现不可能有歧义的所述替代来代替可能有歧义的所述原始言辞。可以依照与文中所给出的材料一致的多个方面来实现本专利技术。例如,本专利技术的一个方面可以包括一种用于减轻新的用户定义语音命令的歧义问题的方法。可以接收用于用户定义语音命令的原始命令。然后可以确定所述原始命令是否有可能与一组现有的语音命令相混淆。当不太可能混淆时,可以自动存储所述原始命令。当有可能混淆时,可以自动确定不太可能与现有命令相混淆的替代命令。可以呈现所述替代作为所述原始命令的可选-->方案,并且可以选择性地将其存储作为所述用户定义语音命令。本专利技术的另一方面可以包括一种用于解决用户定义语音命令的歧义的方法。可以确定与用户定义语音命令相关联的言辞在听觉上类似于现有命令。可以为所述言辞自动确定替代。可以呈现所述替代作为所述言辞的可选方案。本专利技术的又一方面可以包括一种语音处理系统。所述系统可以包括含有至少一个用户定义命令的至少一个语音识别语法(speech recognitiongrammar)、命令执行引擎、歧义检测引擎、同义词数据存储器,以及语音处理引擎。所述命令执行引擎可以被配置以在检测到所述用户定义命令的用户言辞时执行一组程序动作。所述歧义检测引擎可以被配置以检测在用户提供的命令与现有的一组语音命令之间可能的歧义。所述语音处理引擎可以被配置以在所述歧义检测引擎检测到所述言辞有歧义时自动向所述用户呈现至少一个同义词与所述新的用户定义命令相关联。应当注意,可以将本专利技术的各方面实现为用于控制计算设备以实现文中所描述的功能的程序,或者用于使得计算设备能够进行对应于文中所公开的步骤的过程的程序。可以通过将程序存储在磁盘、光盘、半导体存储器或任何其它的记录介质来提供该程序。还可以将程序提供为通过载波传送的数字编码信号。所描述的程序可以是单个程序或者可以被实现为多个子程序,其每一个在单个计算设备内交互或者跨网络空间以分布式方式交互。还应当注意,文中详述的方法还可以是至少部分地通过服务代理和/或服务代理所操纵的机器响应于服务请求而实现的方法。附图说明附图中示出了当前优选的实施例,然而,要理解到,本专利技术并不限于所示出的准确布置和手段。图1是依照文中所公开的本专利技术的安排的实施例的系统的示意图,其中该系统自动向用户提供对可能有歧义的用户定义语音命令的替代;-->图2是依照文中所公开的本专利技术的安排的实施例的方法的流程图,其中该方法用于自动向用户提供对可能有歧义的用户定义语音命令的替代;图3是依照文中所公开的本专利技术的安排的方面的方法的流程图,其中该方法说明了对替代的使用作为用于启动用户定义语音命令的第二机制;以及图4是依照文中所公开的本专利技术的安排的实施例的方法的流程图,在该方法中服务代理可以配置启用了话音的系统来自动向用户提供对可能有歧义的用户定义命令的替代。具体实施方式图1是依照文中所公开的本专利技术的安排的实施例的系统100的示意图,其中系统100自动向用户提供对可能有歧义的用户定义语音命令的替代。在系统100中,讲话人105可以向启用了话音的计算环境110提供打算关联作为用户定义命令的口头言辞(spoken utterance)107。启用了话音的计算环境110可以包括一个或多个语音识别语法120、语音处理引擎112、歧义检测引擎113、命令执行引擎114、命令数据存储器115,以及同义词数据存储器116。语音识别语法120可以包括用户定义语法121、系统定义语法122、全局语法(global grammar)123,以及上下文敏感的语法124。计算环境110可以使用诸如扩音器的转换器(transducer)111接受言辞107。在接受了言辞107时,歧义检测引擎113可以确定言辞107是否可能有歧义和/或在听觉上类似于命令存储器115内所含有的任何现有命令(其可以包括用户定义121命令和/或系统定义122命令)。存储器115中的命令可以各自与将要在用户发布对应命令的任何时候进行的一组程序动作相关联。歧义检测引擎113可以确定言辞107是否可能有歧义或在听觉上类似于命令数据存储器115中的条目。应当理解在一个实施例中,新的用户命令和/或可能有歧义的术语可以是含于上下文敏感1本文档来自技高网
...

【技术保护点】
一种用于减轻新的用户定义语音命令的歧义问题的方法,其包括:    接收用于用户定义语音命令的原始命令;    确定所述原始命令是否有可能与一组现有的语音命令相混淆;    当不太可能混淆时,自动存储所述原始命令作为所述用户定义语音命令;以及    当有可能混淆时,自动确定不太可能与所述组相混淆的至少一个替代命令,呈现所述替代命令作为所述原始命令的可选方案,并且选择性地存储所述替代命令作为所述用户定义语音命令。

【技术特征摘要】
US 2006-12-5 11/567,0841.一种用于减轻新的用户定义语音命令的歧义问题的方法,其包括:接收用于用户定义语音命令的原始命令;确定所述原始命令是否有可能与一组现有的语音命令相混淆;当不太可能混淆时,自动存储所述原始命令作为所述用户定义语音命令;以及当有可能混淆时,自动确定不太可能与所述组相混淆的至少一个替代命令,呈现所述替代命令作为所述原始命令的可选方案,并且选择性地存储所述替代命令作为所述用户定义语音命令。2.根据权利要求1的方法,其中所述替代命令是为所述原始命令自动确定的同义词。3.根据权利要求1的方法,其中所述选择性地存储步骤是基于对呈现所述替代命令的用户响应,其中当所述用户响应指示优选使用所述原始命令时,将所述原始命令存储作为所述用户定义语音命令。4.根据权利要求3的方法,其中当所述用户响应指示优选使用所述原始命令时,将所述替代命令存储作为用于所述用户定义语音命令的第二命令,其中所述原始命令和所述替代命令均能够用于启动与所述用户定义语音命令相关联的一组动作。5.根据权利要求4的方法,其进一步包括:当呈现与所述用户定义语音命令相关的提示时,呈现所述替代而不是呈现所述原始命令作为对所述用户定义语音命令的触发。6.根据权利要求1的方法,其进一步包括:建立可配置混淆门限,其中所述原始命令是否与所述组中的至少一个命令相混淆的可能性是基于是否超过了所述混淆门限。7.根据权利要求1的方法,其中所述原始命令是否与所述组中的至少一个命令相混淆的可能性是基于在所述原始命令与所述至少一个命令之间所确定的听觉上的相似性。8.根据权利要求1的方法,其中权利要求1的所述步骤是通过依照至少一个计算机程序的至少一个机器来实现的,其中所述至少一个计算机程序具有可通过所述至少一个机器执行的多个代码部分。9.根据权利要求1的方法,其中权利要求1的所述步骤是通过服务代理和由所述服务代理操纵的计算设备这二者中的至少一个来实现的,所述步骤是响应于服务请求而实现的。10.一种用于解决用户定义语音命令的歧义的方法,其包括:查明与用户定义语音命令相关联的言辞在听觉上类似于现有语音命令;为所述言辞自动确定至少一个替代...

【专利技术属性】
技术研发人员:JR刘易斯LR威尔逊WK博丁
申请(专利权)人:国际商业机器公司
类型:发明
国别省市:US[美国]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利