语音识别装置、语音识别方法以及电子设备制造方法及图纸

技术编号:4968418 阅读:159 留言:0更新日期:2012-04-11 18:40
通过语音特征量计算电路(31)计算所输入的语音的每个词组的语音特征量,通过推定处理似然计算电路(33)对计算出的每个词组的语音特征量和存储装置(34)中所存储的多个词组的语音模式系列信息进行比较,并计算多个按每个词组的似然值高的候补起似然值依次低的候补,识别过滤装置(4)基于第1候补的似然值与第2候补的似然值之差和第2候补的似然值与第3候补的似然值之差的似然差之比,判断是否舍弃所提取出的候补。

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及语音识别装置、语音识别方法以及电子设备,尤其是涉及以所登记的 词组(phrase)为单位对被输入的语音进行识别,并舍弃已识别的候补之中似然值较低的 候补的语音识别装置、语音识别方法以及具备这种语音识别装置的电子设备。
技术介绍
在语音识别装置中公知有按所登记的每个词组识别被输入的语音的语音识别装 置。作为其一例有在日本专利特开2003-50595号公报(专利文献1)中所公开的语音识别 装置。此语音识别装置按规定的时间间隔的每帧划分被输入的语音,求解各帧的功率分量 并根据功率分量的值来检测语音区间。基于各语音区间的语音特征量和预先准备的语音模 式系列信息即隐马尔可夫模型(Hidden Markov Model),提取词组辞典所含词组之中似然 值最高的第1候补词组。在此例中,求解出针对已提取出的第1候补词组的似然可靠率,如 果此似然可靠率在阈值以下就废弃第1候补词组。另外,以往在电子设备之中有的就具备能够识别被输入的语音的语音识别功能。 这种电子设备例如公开在W02006/093003号公报(专利文献2)中。根据专利文献2,电子设备就是硬盘/DVD刻录机,根据所输入的语音例如识别作 为录像对象的节目名。具体而言,就是通过预先登记与节目名的关键字相对应的语音特征 量模式例如由隐马尔可夫模型所示的特征量模式,在包含关键字的语音被输入之际,提取 所输入语音的特征量模式,计算所提取出的特征量模式和所登记的特征量模式的相似度, 并将相似度最高的节目名确定为录像对象。专利文献1 日本专利特开2003-50595号公报专利文献2 :W02006/093003号公报—般而言,在实际使用语音识别装置的情况下,除了所登记的词组(以下称之为 登记内词组)以外,还被输入未登记的词组(以下称之为登记外词组),或者使用环境下的 噪声也与语音一起被输入,所以就有易于发生误识别之类的问题。例如,若假定已登记词组 “ 7夕一卜”而未登记“ 7卜7 ,,,则在说话者说出“ 7夕一卜”时,如果将其识别为“、夕 一卜”则因为“ ^夕一卜”是登记内词组所以其识别正确。但是,尽管说话者说出“义卜” 7°”而被识别为“义夕一卜,,时,因为“义卜” 7°”是登记外词组所以就发生了误识别。为了避免这种误识别,在尽管说出登记外词组却列举登 记内词组作为识别候补时就需要舍弃该识别候补。在即便是登记外词组以外而SN比较差 的环境下,有时候会输入噪声而误识别为登记内词组,这样的候补也需要舍弃。专利文献1所公开的语音识别装置只不过是使用一个值作为似然值和预先设定 的用于舍弃判断的阈值。因此,在噪声级较高的使用环境下,有时候噪声会作为语音识别候 补被提取出来,就需要舍弃该候补,但是在阈值为一个的情况下却无法舍弃源于该噪声的 语音识别候补,有时候识别率低下。特别是,在所登记的词组较少的情况下,优选通过尽量早期的阶段处理舍弃登记外的词组。另外,在专利文献2所公开的电子设备中,仅仅是将相似度最高的节目名确定为 录像对象,所以例如若在噪声级较高的环境下进行使用,则尽管输入了噪声也有可能将与 噪声的特征量模式相似度最高的节目名确定为录像对象。
技术实现思路
因而,本专利技术的目的在于提供一种可以在考虑了实际使用环境的噪声条件下提高 识别率的语音识别装置。另外,本专利技术的其他目的在于提供一种可以在考虑了实际使用环境的噪声条件下 提高识别率的语音识别方法。另外,本专利技术的进一步其他目的在于提供一种能够提高识别率,并且能够基于语 音可靠地进行规定动作的电子设备。本专利技术提供一种语音识别装置,在噪声环境下按所登记的每个词组识别说话语 音,具备语音特征量计算单元,其计算说话语音的每个词组的语音特征量;词组存储单 元,其存储每个词组的语音模式系列信息;似然值计算单元,其对由语音特征量计算单元所 计算出的每个词组的语音特征量和词组存储单元中所存储的多个词组的语音模式系列信 息进行比较,计算出似然值;候补提取单元,其基于由似然值计算单元所计算出的似然值, 按似然值从高到低的顺序选出多个语音识别候补;识别过滤单元,其基于由候补提取单元 所选出的多个语音识别候补各自的似然值分布,判断是否舍弃所选出的语音识别候补。根据本专利技术,就能够基于所选出的多个语音识别候补的各自的似然值分布,决定 是否舍弃,能够提高舍弃率和识别率。本专利技术的其他方式的语音识别装置,在噪声环境下按所登记的每个词组识别说话 语音。语音识别装置具备语音特征量计算单元,其计算说话语音的每个词组的语音特征 量;词组存储单元,其存储每个词组的语音模式系列信息;似然值计算单元,其对由语音特 征量计算单元所计算出的每个词组的语音特征量和词组存储单元中所存储的多个词组的 语音模式系列信息进行比较并计算似然值;候补提取单元,其基于由似然值计算单元所计 算出的似然值,按似然值从高到低的顺序选出第1语音识别候补、较第1语音识别候次之的 第2语音识别候补、较第2语音识别候补次之的第3语音识别候补;识别过滤单元,其基于 由候补提取单元所提取出的第1语音识别候补与第2语音识别候补的似然值之差和第2语 音识别候补与第3语音识别候补的似然值之差的似然差之比,判断是否舍弃所提取出的语 音识别候补。根据本专利技术的其他方式,通过基于似然差之比判断是否从识别对象中舍弃语音识 别候补,由此能够提高尚未登记词组的语音识别候补及源于所输入噪声的候补等的舍弃 率,所以能够提高识别率。更优选的是,识别过滤单元,如果似然差之比小于规定值就舍弃第1语音识别候 补,如果大于规定值就设第1语音识别候补为语音识别对象。据此,就能够判断应当采用被选择的第1语音识别候补作为语音识别的对象还是应当舍弃。优选的是,词组存储单元存储按语音特征划分的组的语音模式系列信息,识别过滤单元包括第1判断单元,该第1判断单元基于按语音的特征划分的组的似然差之比,判断 是否舍弃所提取出的各语音识别候补。通过按男性、女性以及儿童等语音特征进行分组,并基于各自组内的似然差之比 判断是否舍弃所提取出的语音识别候补,由此进一步提高识别过滤单元的舍弃率。优选的是,识别过滤单元基于第1语音识别候补的似然值和第2语音识别候补的 似然值之差,判断是否舍弃所提取出的语音识别候补。似然值计算单元提取较第3语音识 别候补次之的第4语音识别候补,识别过滤单元基于第1语音识别候补的似然值与第4语 音识别候补的似然值之差,判断是否舍弃所提取出的语音识别候补,并基于第1语音识别 候补的似然值,判断是否舍弃所提取出的语音识别候补。通过这样判断是否舍弃所选择的语音识别候补,可以提高登记外词组及所输入噪 声的候补的舍弃率。优选的是,候补提取单元在较第1语音识别候补次之的语音识别候补存在与第1 语音识别候补的语音模式系列信息相近似的语音识别候补时,排除该语音识别候补,并提 取较该语音识别候补次之的语音识别候补。通过候补提取单元排除近似于第1语音识别候补的候补,能够更加提高识别率。本专利技术的进一步其他方式的语音识别方法,在噪声环境下按所登记的每个词组识 别说话语音。该方法包括如下步骤计算说话语音的每个词组的语音特征量的步骤;对所 计算出的每个词组的语音特征量和预先存储的多个词组的语音模式系列信息进行比较并 计算作为语音识别对象的多个语音识别候补本文档来自技高网
...

【技术保护点】
一种语音识别装置,用于在噪声环境下按所登记的每个词组来识别说话语音,具备:  语音特征量计算单元,其计算上述说话语音的每个词组的语音特征量;  词组存储单元,其存储上述每个词组的语音模式系列信息;  似然值计算单元,其对由上述语音特征量计算单元所计算出的每个词组的语音特征量和上述词组存储单元中所存储的多个词组的语音模式系列信息进行比较,计算出似然值;  候补提取单元,其基于由上述似然值计算单元所计算出的似然值,按似然值从高到低的顺序选出多个语音识别候补;及  识别过滤单元,其基于由上述候补提取单元所选出的上述多个语音识别候补的各自的似然值分布,判断是否舍弃上述所选出的语音识别候补。

【技术特征摘要】
【国外来华专利技术】JP 2008-6-6 2008-1497321.一种语音识别装置,用于在噪声环境下按所登记的每个词组来识别说话语音,具备语音特征量计算单元,其计算上述说话语音的每个词组的语音特征量; 词组存储单元,其存储上述每个词组的语音模式系列信息;似然值计算单元,其对由上述语音特征量计算单元所计算出的每个词组的语音特征量 和上述词组存储单元中所存储的多个词组的语音模式系列信息进行比较,计算出似然值;候补提取单元,其基于由上述似然值计算单元所计算出的似然值,按似然值从高到低 的顺序选出多个语音识别候补;及识别过滤单元,其基于由上述候补提取单元所选出的上述多个语音识别候补的各自的 似然值分布,判断是否舍弃上述所选出的语音识别候补。2.一种语音识别装置,用于在噪声环境下按所登记的每个词组来识别说话语音,具备语音特征量计算单元,其计算上述说话语音的每个词组的语音特征量; 词组存储单元,其存储上述每个词组的语音模式系列信息;似然值计算单元,其对由上述语音特征量计算单元所计算出的每个词组的语音特征量 和上述词组存储单元中所存储的多个词组的语音模式系列信息进行比较,计算出多个语音 识别候补的似然值;候补提取单元,其基于由上述似然值计算单元所计算出的似然值,按似然值从高到低 的顺序选出第1语音识别候补、较上述第1语音识别候补次之的第2语音识别候补、较上述 第2语音识别候补次之的第3语音识别候补;及识别过滤单元,其基于由上述候补提取单元所提取出的上述第1语音识别候补与上述 第2语音识别候补的似然值之差和上述第2语音识别候补与上述第3语音识别候补的似然 值之差的似然差之比,判断是否舍弃上述所提取出的语音识别候补。3.根据权利要求2所述的语音识别装置,其特征在于上述识别过滤单元,如果上述似然差之比小于规定值就舍弃上述第1语音识别候补, 如果大于上述规定值就将上述第1语音识别候补作为语音识别的对象。4.根据权利要求2所述的语音识别装置,其特征在于上述词组存储单元存储按语音的特征划分的组的语音模式系列信息, 上述识别过滤单元包括第1判断单元,该第1判断单元基于按语音的特征划分的组的 上述似然差之比,判断是否舍弃上述所提取出的第1语音识别候补。5.根据权利要求2所述的语音识别装置,其特征在于上述识别过滤单元包括第2判断单元,该第2判断单元基于上述第1语音识别候补的 似然值和上述第2语音识别候补的似然值,判断是否舍弃上述所提取出的第1语音识别候 补。6.根据权利要求2所述的语音识别装置,其特征在于上述似然值计算单元提取较上述第3语音识别候补次之的第4语音识别候补, 上述识别过滤单元包括第3判断单元,该第3判断单元基于上述第1语音识别候补的 似然值与上述第4语音识别候补的似然值之差判断是否舍弃上述所提取出的第1语音识别 候补。7.根据权利要求2所述的语音识别装置,其特征在于上述识别过滤单元包括第4判断单元,该第4判断单元基于上述第1语音识别候补的 似然值,判断是否舍弃上述所提取出的第1语音识...

【专利技术属性】
技术研发人员:吉田满次兵藤一峰
申请(专利权)人:株式会社雷特龙
类型:发明
国别省市:JP[日本]

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利