语音识别装置及语音识别方法制造方法及图纸

技术编号：3046818 阅读：177 留言：0更新日期：2012-04-11 18:40

一种能够改善语音识别准确度的语音识别装置和语音识别方法。距离计算器（４７）计算发声用户和麦克风（２１）之间的距离并将该距离提供给语音识别单元（４１Ｂ）。语音识别单元（４１Ｂ）包含多组从通过记录在多个不同距离所发出的语音形成的语音数据中产生的声学模式。语音识别单元（４１Ｂ）选择一组离由距离计算器（４７）所提供的距离最近的距离处的声学模式，并且通过利用该声学模式组进行语音识别。（*该技术在2022年保护过期，可自由使用*）

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及一种语音识别装置和一种语音识别方法，尤其涉及一种用他于借助利用一组与从语音识别装置至声源的距离对应的声学模式以改善的准确度识别语音的语音识别装置和语音识别方法。
技术介绍
近年来，已经实现了CPU(中央处理单元)的操作速度和存储器存储容量的增加。这使得通过利用大量的语音数据或者文本数据的统计模型实现能够识别好几十万字的大词汇量的语音识别系统成为可能。在包括这样一种大词汇量语音识别系统的语音识别系统中，对将要识别的语音输入其中的麦克风的附近位置所发出的语音能够获得高的语音识别准确度。不过，如果在远处发出语音，由于噪声等的影响，则语音识别准确度会随着麦克风和发出语音处的位置之间的距离而降低。例如，在题为“在有噪声/回响的环境中借助利用麦克风阵列的HHM分解/组合的语音识别(Speech Recognition in Noisy/Reverberant Environmentby means of HHM Decomposition/Composition Using a Microphone Array)”的论文中披露了为避免上述问题的第一个已知技术(Miki，Nishiura，和Shikano，电子、信息和通信工程师协会学报D-II，第J83-DII卷，第11期，2206-2214页，2000年11月)(此后，称作为对比文件1)。在此技术中，用麦克风阵列来改善在远离麦克风的位置所发出的语音的信噪比(SN)，并且以改善的信噪比对语音进行语音识别。例如，在题为“考虑空间声学特征的空间分集健壮性的语音识别(SpaceDiversity Robus...

【技术保护点】
一种用于识别输入语音的语音识别装置，包括：距离计算装置，用于确定到所述语音的声源的距离；采集装置，用于采集与由距离计算装置所确定的距离对应的一组声学模式；以及语音识别装置，用于根据由采集装置所采集的一组声学模式识别所述语音。

【技术特征摘要】
JP 2001-10-22 323012/011.一种用于识别输入语音的语音识别装置，包括距离计算装置，用于确定到所述语音的声源的距离；采集装置，用于采集与由距离计算装置所确定的距离对应的一组声学模式；以及语音识别装置，用于根据由采集装置所采集的一组声学模式识别所述语音。2.如权利要求1所述的语音识别装置，还包括存储装置，用于存储由位于不同位置的声源所发出的语音产生的多组声学模式；其中，所述采集装置从在存储介质中所存储的用于各个距离的多组声学模式中，选择与由所述距离计算装置所确定的距离相对应的一组声学模式。3.如权利要求1所述的语音识别装置，其中，所述距离计算装置通过对由用于摄取图像的多个图象传感器装置所输出的图像进行立体效果处理，来确定到所述声源的距离。4.如权利要求1所述的语音识别装置，其中，所述距离计算装置根据超声波传感器的输出确定到所述声源的距离。5.一种用于识别输入语音的语音识别方法，包括步骤确定到所述语音的声源的距离；采集与由距离计算步骤所确定的距离对应的一组声学模式；以及根据由采集步骤所采集的一组声学模式识别所述语音。6.一种用于使计算机识别输入语音的程序，所述程序包括步骤确定到所述语音的声源的距离；采集与由距离计算步骤所确定的距离对应的一组声学模式；以及根据由采集步骤所采集的一组声学模式识别所述语音。7.一种将使计算机识别输入语音的程序存储于其上的存储介质，所述程序包括步骤确定到...

【专利技术属性】
技术研发人员：浅野康治，
申请(专利权)人：索尼公司，
类型：发明
国别省市：JP[日本]

全部详细技术资料下载我是这个专利的主人