语音识别接口装置及其语音识别方法制造方法及图纸

技术编号:3778246 阅读:386 留言:0更新日期:2012-04-11 18:40
提供了一种语音识别接口装置及其语音识别方法。所述语音识别接口装 置包括模型参数估计器和语音识别器,模型参数估计器从外部语音数据库提 取目标语言和母语的声学信息,分别训练得到目标语言的声学模型和母语的 声学模型,再分别对所述两种声学模型应用模型自适应技术,然后应用高斯 成分归并技术得到背景模型;语音识别器分别接收从模型参数估计器输入的 背景模型及从外部输入的非母语语音,基于背景模型对输入的非母语语音进 行识别。根据本发明专利技术,可以提高非母语语音的识别正确率。

【技术实现步骤摘要】

本专利技术涉及一种,尤其涉及一种适 用于非母语说话人语音;^索任务的语音识别接口装置及其识别方法,通过所述装置和方法,可以提高语音识别引擎对于源自非母语说话人的声音数据的 正确率。
技术介绍
语音识别作为一种人机交互的接口 ,它可以将人的语音通过模式识别的 方法翻译成对应的文字。语音识别技术发展到了今天,已经具有实时的输入 速度和准确的识别精度等等优点。目前基于语音识别的成熟产品已经广泛地 应用于PDA,手机,MP3播放器和GPS导航设备中,解决了传统键盘在小型 嵌入式设备上操作不便的问题。此外,语音识别技术可以与文本搜索技术巧 妙的结合,首先将语音识别模块视作人机交互的前端接口,随后将识别出的 命令、文字、关键词等信息作为输入传递到文本检索模块中。具体地,例如 姓名拨号,语言翻译,文档检索等等多种文本检索任务都可以应用到语音识 别技术。然而,语音识别技术还有一些问题亟待解决。首要问题就是非母语语音 的识别问题。相比于母语语音数据,非母语语音数据存在更多的多样性和不 确定性,举个例子,例如当中国人说汉语的时候,大家的发音方式可能趋同, 而当说外语的时候,很有可能因为人们对于该语言的本文档来自技高网...

【技术保护点】
一种语音识别接口装置,包括模型参数估计器和语音识别器,其特征在于, 所述模型参数估计器从外部语音数据库提取目标语言和母语的声学信息,分别训练得到目标语言的声学模型和母语的声学模型,再分别对所述两种声学模型应用模型自适应技术,然后应用高 斯成分归并技术得到背景模型。 所述语音识别器分别接收从模型参数估计器输出的背景模型及从外部输入的非母语语音,基于背景模型对输入的非母语语音进行识别。

【技术特征摘要】

【专利技术属性】
技术研发人员:黄盈椿金南勋
申请(专利权)人:三星电子株式会社北京三星通信技术研究有限公司
类型:发明
国别省市:KR

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1