采用多个语音识别器的方法技术

技术编号:3047232 阅读:259 留言:0更新日期:2012-04-11 18:40
本发明专利技术涉及一种方法,其中使语音输入成为可能的信息单元(3)被存储到一个服务器(1)中,并可以由客户(2)来获取,客户(2)可以通过通讯网络(6)连接到多个语音识别器(7-9)上,用户的语音输入被应用到至少一个语音识别器(7-9)中,来产生至少一个识别结果(11-13),在多个独立的处理中翻译识别结果(11-13),产生多个翻译结果(22-24)发送给用户。于是,用户在短时间内接收多个合格的信息条目,否则要获取这些信息,用户不得不多次通过语音输入在数据库中进行一个查询。(*该技术在2020年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及一种方法,其中一个使语音输入成为可能的信息单元被存储到一个服务器中,并可由用户获取。通过语音输入替代键盘或鼠标输入实现与计算机通讯的可能性可使用户减轻用户使用计算机工作的负担,通常可以增加输入的速度。语音识别可以被用于许多领域,目前在这些领域中,数据输入是通过键盘来实现的。EP 0 872 827描述了语音识别的一个系统和一种方法。一个运行语音识别压缩软件的客户通过网络连接到语音识别服务器上。该客户发送一个语音识别语法和语音输入数据到语音识别服务器。语音识别服务器进行语音识别并将识别结果返回给客户。当一个用户对信息感兴趣时,他在所熟悉的位置寻找这一信息。事实上,该用户通常并不知道某一区域有一个以上的服务提供者。不同的服务提供者对用户的相应需求的响应是不同的。但多数情况下,用户不知道哪里有更多的信息源。即使他知道,他也不得不进行一个新的查询。这是很耗时的。因此,本专利技术的一个目的是在一个短暂的时间里给用户提供尽可能多的信息。可以按下面的方法来实现这一目的,通过一个通讯网络将客户连接到多个语音识别器上,一个用户的语音输入被应用到至少一个语音识别器,产生识别结果,在多个独立的处理中翻译识别结果,产生提供给用户的多个翻译结果。一个服务器提供者在服务器中存储一个信息单元,它的信息使语音输入成为可能。客户从这个服务器上下载一个信息单元,使语音输入成为可能。服务器是一个通讯网络,例如因特网中的计算机,其中存储提供者的信息并可以被客户获取。一个客户是一台计算机,连接到服务器用来从因特网上获取信息并下载存储在服务器上的通过软件表示的信息单元。该信息单元由客户提供,以便用户可以接收到该信息单元的内容。要求用户通过信息单元来输入语音,或者,由于通常该信息单元已经被调用,通知用户可以输入语音。用户完成一个语音输入后,该语音输入被应用到一个或多个语音识别器中。每个单独的语音识别器执行语音识别,并各自产生一个语音识别结果。每个识别结果需经过一个翻译。利用识别结果在独立的处理中形成翻译的结果。为了翻译一个识别结果,要对识别的结果进行分析。所以,识别的结果被细分为一些组件部分,例如查找关键词。对于后期的查询,识别结果中那些不感兴趣的部分被忽略。然后,从语音识别器或从一个数据库中分析识别的结果。因此,为了分析识别结果,必须具备有关语音输入的内容的信息。通过信息单元的内容来确定可能的语音输入的内容。通过这一分析,为一个数据库进行查询。而后,该查询被送入到单独的数据库中,由此产生多个独立产生的翻译结果。对于用户的语音输入的响应质量起决定性影响的一个重要方面是用于查找一个查询响应的数据库。独立的数据库的数目是不断上升的。而且,有大量的商业数据库可以用来帮助查找响应。由于识别结果被分配到多个翻译的数据库中,当需要查找响应时,要把这些独立的数据库结合起来。可以在不同的费用等级上使用语音识别来产生识别结果。语音识别器不仅通过其规模和专用词汇,而且通过其执行语音识别的算法来区别。一个好的数据库查询要求一个由用户通过语音输入所进行的该查询的一个好的识别结果。语音识别器或数据库的翻译结果或者被自动送回给客户,或者由服务器令其有效,这样用户可以获取所需的单独的翻译结果。在任一种情况下,翻译结果通过客户以一种用户可以接收到的形式来提供。由于信息单元与一个或多个语音识别器的组合,提供给用户语音输入查询的多个相应。结果是,他接收到信息,如果不用该方法,他不得不通过相当长的时间延迟来启动一个以上的查询才能获取这些信息。除了在语音识别中不同的识别结果,基于不同的数据库,独立的识别结果的独立的翻译产生不同的翻译结果,每个翻译结果给出一个用户语音输入的响应。通过语音输入的一个单一翻译,或者是仅有限数目的最可能的响应被送回给用户,或者是用户将收到内容与查询相差很多的响应。一个或多个识别结果的多个翻译的结果是,在相同的时间里告知用户至少两倍的信息量。当语音输入被仅分配给一个语音识别器时,识别结果被送给多个翻译处理,全部产生一个翻译结果发还给客户或由用户获取,这样对用户的查询提供了多个相应。在本专利技术的进一步的实施方案中,证明在客户端处理语音识别是有优势的。为此,当加载了信息单元时,在客户机上启动附加的软件,附加的软件提取语音输入的特征。该附加软件将可用的语音输入当作电子信号数字化、量化并提交给相应的分析,产生组件,为其分配特征向量。然后这些特征向量被传送给连接的语音识别器。语音识别器进行透彻的计算识别。在客户端进行的特性提取的结果是,语音输入被压缩并编码,以便减少传送的数据数量。而且,减少了客户端的特征提取所需的时间,以便语音识别器仅进行所应用的特征向量的识别。采用频繁使用的语音识别器,这一缩减是很有优势的。当语音输入被分配到多个语音识别器中时,仅需执行一次处理是具有优势的。如果不在客户侧进行特征提取,每个所选的语音识别器都要执行这样的特征提取。如一个本专利技术的进一步的实施方案,建议客户以HTML页(超文本链接标示语言)的形式从服务器下载信息单元。这一HTML页在客户机中通过万维网浏览器来显示。客户通过链接到服务器建立一个连接,在该链接中,存储着用户关心的HTML页。除了描述的文字外,HTML页可能包含图形符号、音频和/或视频数据。HTML页要求用户通过一个指示进行语音输入。用户语音输入之后,将该语音输入从客户传送到一个或多个语音识别器。然后,在其中进行语音识别。而语音识别的结果的质量明显取决于指定的语音识别器的情况。语音识别器通过通常限定在特定领域的词汇来工作。因此,要得到一个可用的识别结果,指定语音输入所传送到的语音识别器是很重要的。看情况,识别结果或多个识别结果由翻译过程来决定。为此,例如分析所识别的语音输入来建立一个数据库,在该分析的基础上,对该数据库的数据文件进行一个查询。产生的翻译结果被自动送回到客户或由客户来获取,并在那里通过一个万维网浏览器来表示。现在用户可以从多个翻译结果中进行一个选择。这一操作与查阅多个词汇相比,具有节省时间的优势。在本专利技术的进一步的实施方案中,体现了多个对象,例如在一个HTML页上公司的广告,每一个产生一个可能的输入。为每个对象分配一个通过通讯网络连接的语音识别器,用户的语音输入被发送到语音识别器。语音识别器执行语音识别,并将单独的识别结果传动给独立的翻译处理。翻译结果以图形表示的形式或作为音频信号送还给客户或由用户获取。例如,如果象广告标题这样可实现的对象,由工作在同一商业线路上的公司提供,可以为用户介绍多个竞争公司所提供的对象,作为其语音输入和多个平行处理的结果。由于通过鼠标点击广告标题,或者遵循用户的设想,或者给出独立对象的多个语音输入选项的优先权,通过一个HTML页上显示的非竞争公司的广告标题,关于一个特定广告标题的用户语音输入被传送给为一个对象分配的语音识别器。因而,将语音输入或处理过的语音输入存储到一个客户存储器中,或者将识别结果发送回客户是具有优势的,这样为了另一个翻译处理,用户可以利用通过任意方法得到的这一媒体结果。然后,如果一个语音输入被存储起来,存储的语音输入或识别结果被传送到另一个语音识别器中,以便能够更多的翻译产生进一步的翻译结果。在一个进一步的实施方案中,从通过语音输入启动的万维网本文档来自技高网...

【技术保护点】
一种方法,其中使语音输入成为可能的信息单元(3)被存储到一个服务器(1)中,并可以由客户(2)来获取,客户(2)可以通过通讯网络(6)连接到多个语音识别器(7-9)上,用户的语音输入被应用到至少一个语音识别器(7-9)中以产生识别结果(11-13),在多个独立的处理中翻译识别结果(11-13),产生多个翻译结果(22-24)提供给用户。

【技术特征摘要】
DE 1999-3-9 19910234.11.一种方法,其中使语音输入成为可能的信息单元(3)被存储到一个服务器(1)中,并可以由客户(2)来获取,客户(2)可以通过通讯网络(6)连接到多个语音识别器(7-9)上,用户的语音输入被应用到至少一个语音识别器(7-9)中以产生识别结果(11-13),在多个独立的处理中翻译识别结果(11-13),产生多个翻译结果(22-24)提供给用户。2.如权利要求1的方法,其特征是翻译结果(22-24)被自动返回到客户(2)或由客户获取。3.如权利要求1和2的方法,其特征是语音输入被并行应用到多个语音识别器(7-9)中以产生识别结果(11-13)。4.如权利要求1-3之一的方法,其特征是在客户(2)上运行用于提取语音输入特征的软件,提取的特征被应用到指定的语音识别器(7-9)中。5.如权利要求1的方法,其特征是信息单元(3)按照HTML页(3)来实现的,在一个HTML页(3)上发现多个对...

【专利技术属性】
技术研发人员:M乌尔里希E特伦S贝斯林
申请(专利权)人:皇家菲利浦电子有限公司
类型:发明
国别省市:NL[荷兰]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1