用于分布式自动语音识别的方法以及分布式自动语音识别系统技术方案

技术编号：3046421 阅读：194 留言：0更新日期：2012-04-11 18:40

一种用于分布式自动语音识别的方法使得用户能够利用一个经由通信网络与语音服务器相连的语音客户端上的浏览器向语音服务器请求音频网页。接着判断该用户的持久用户参数是否被储存在语音客户端上的可由语音服务器直接访问的参数文件中。如果没有，就在语音客户端中生成用户参数并保存到参数文件中。如果有，则由语音服务器直接从参数文件读取用户参数。在两种情况下，所述的用户参数都会被设置在语音服务器的语音识别引擎中，以实现语音客户端与语音服务器之间的音频对话。（*该技术在2023年保护过期，可自由使用*）

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术主要涉及自动语音识别，并尤其涉及利用网络浏览器的分布式语音识别。
技术介绍
自动语音识别(ASR)从麦克风接收一个输入声音信号，并将该声音信号转换成一组输出文字。识别出来的文字就可以被使用在多种应用场合，如数据输入、订单输入，以及命令与控制。文字到语音(TTS)转换将输入的文本转换成一个输出声音信号，该声音信号应该是可识别的语音。互联网与万维网(web)以存储在网络或代理服务器上的网页的形式提供广泛的信息。通过运行在桌面计算机、便携计算机、手持个人数字助理(PDA)、移动电话或类似设备上的客户端浏览器就可以访问这些信息。通过输入设备如键盘、鼠标或触摸板可以请求获得信息，并通过输出设备如显示器或打印机来观看信息。音频网页为输入输出能力有限的客户端设备提供信息。音频网页可以从网络服务器上获得。已知有多种标准来描述音频网页。其中包括Sun的Java Speech，Microsoft的Speech Agent和Speech.NET，SALT Forum，VoiceXML Forum以及W3C VoiceXML。这些页面中包含语音对话，还包含了普通的HTML文...

【技术保护点】
一种用于分布式自动语音识别的方法，包括：由用户通过语音客户端经由一个通信网络向语音服务器请求一个音频网页；判断用户的用户参数是否存储在可被语音服务器直接访问的参数文件中；如果假，则在语音客户端中生成用户参数并将用户参数存储在所述参数文件中；　如果真，则由语音服务器直接从所述参数文件读取用户参数；在语音服务器的语音识别引擎中设置所述用户参数，以实现语音客户端与语音服务器之间的音频对话。

【技术特征摘要】
US 2002-4-10 10/119,8801.一种用于分布式自动语音识别的方法，包括由用户通过语音客户端经由一个通信网络向语音服务器请求一个音频网页；判断用户的用户参数是否存储在可被语音服务器直接访问的参数文件中；如果假，则在语音客户端中生成用户参数并将用户参数存储在所述参数文件中；如果真，则由语音服务器直接从所述参数文件读取用户参数；在语音服务器的语音识别引擎中设置所述用户参数，以实现语音客户端与语音服务器之间的音频对话。2.根据权利要求1所述的方法，还包括由语音服务器维护所述参数文件。3.根据权利要求1所述的方法，还包括由语音代理服务器维护所述参数文件。4.根据权利要求1所述的方法，其中所述的用户参数中包括表示用户语音特征的语音参数。5.根据权利要求1所述的方法，其中所述的用户参数中包括表示用来采集用户语音的硬件设备特征的采集参数，并且...

【专利技术属性】
技术研发人员：德里克L思奇文克，戴维WH王，
申请(专利权)人：三菱电机株式会社，
类型：发明
国别省市：JP[日本]

全部详细技术资料下载我是这个专利的主人