语音识别装置、语音识别方法以及电子设备制造方法及图纸

技术编号：4968418 阅读：159 留言：0更新日期：2012-04-11 18:40

通过语音特征量计算电路（３１）计算所输入的语音的每个词组的语音特征量，通过推定处理似然计算电路（３３）对计算出的每个词组的语音特征量和存储装置（３４）中所存储的多个词组的语音模式系列信息进行比较，并计算多个按每个词组的似然值高的候补起似然值依次低的候补，识别过滤装置（４）基于第１候补的似然值与第２候补的似然值之差和第２候补的似然值与第３候补的似然值之差的似然差之比，判断是否舍弃所提取出的候补。

全部详细技术资料下载

【技术实现步骤摘要】
【国外来华专利技术】
本专利技术涉及语音识别装置、语音识别方法以及电子设备，尤其是涉及以所登记的词组(phrase)为单位对被输入的语音进行识别，并舍弃已识别的候补之中似然值较低的候补的语音识别装置、语音识别方法以及具备这种语音识别装置的电子设备。
技术介绍
在语音识别装置中公知有按所登记的每个词组识别被输入的语音的语音识别装置。作为其一例有在日本专利特开2003-50595号公报(专利文献1)中所公开的语音识别装置。此语音识别装置按规定的时间间隔的每帧划分被输入的语音，求解各帧的功率分量并根据功率分量的值来检测语音区间。基于各语音区间的语音特征量和预先准备的语音模式系列信息即隐马尔可夫模型(Hidden Markov Model)，提取词组辞典所含词组之中似然值最高的第1候补词组。在此例中，求解出针对已提取出的第1候补词组的似然可靠率，如果此似然可靠率在阈值以下就废弃第1候补词组。另外，以往在电子设备之中有的就具备能够识别被输入的语音的语音识别功能。这种电子设备例如公开在W02006/093003号公报(专利文献2)中。根据专利文献2，电子设备就是硬盘/DVD刻录机，根据所输入的语音例如识别作为录像对象的节目名。具体而言，就是通过预先登记与节目名的关键字相对应的语音特征量模式例如由隐马尔可夫模型所示的特征量模式，在包含关键字的语音被输入之际，提取所输入语音的特征量模式，计算所提取出的特征量模式和所登记的特征量模式的相似度，并将相似度最高的节目名确定为录像对象。专利文献1 日本专利特开2003-50595号公报专利文献2 :W02006/093003...

【技术保护点】
一种语音识别装置，用于在噪声环境下按所登记的每个词组来识别说话语音，具备：　　语音特征量计算单元，其计算上述说话语音的每个词组的语音特征量；　　词组存储单元，其存储上述每个词组的语音模式系列信息；　　似然值计算单元，其对由上述语音特征量计算单元所计算出的每个词组的语音特征量和上述词组存储单元中所存储的多个词组的语音模式系列信息进行比较，计算出似然值；　　候补提取单元，其基于由上述似然值计算单元所计算出的似然值，按似然值从高到低的顺序选出多个语音识别候补；及　　识别过滤单元，其基于由上述候补提取单元所选出的上述多个语音识别候补的各自的似然值分布，判断是否舍弃上述所选出的语音识别候补。

【技术特征摘要】
【国外来华专利技术】JP 2008-6-6 2008-1497321.一种语音识别装置，用于在噪声环境下按所登记的每个词组来识别说话语音，具备语音特征量计算单元，其计算上述说话语音的每个词组的语音特征量；词组存储单元，其存储上述每个词组的语音模式系列信息；似然值计算单元，其对由上述语音特征量计算单元所计算出的每个词组的语音特征量和上述词组存储单元中所存储的多个词组的语音模式系列信息进行比较，计算出似然值；候补提取单元，其基于由上述似然值计算单元所计算出的似然值，按似然值从高到低的顺序选出多个语音识别候补；及识别过滤单元，其基于由上述候补提取单元所选出的上述多个语音识别候补的各自的似然值分布，判断是否舍弃上述所选出的语音识别候补。2.一种语音识别装置，用于在噪声环境下按所登记的每个词组来识别说话语音，具备语音特征量计算单元，其计算上述说话语音的每个词组的语音特征量；词组存储单元，其存储上述每个词组的语音模式系列信息；似然值计算单元，其对由上述语音特征量计算单元所计算出的每个词组的语音特征量和上述词组存储单元中所存储的多个词组的语音模式系列信息进行比较，计算出多个语音识别候补的似然值；候补提取单元，其基于由上述似然值计算单元所计算出的似然值，按似然值从高到低的顺序选出第1语音识别候补、较上述第1语音识别候补次之的第2语音识别候补、较上述第2语音识别候补次之的第3语音识别候补；及识别过滤单元，其基于由上述候补提取单元所提取出的上述第1语音识别候补与上述第2语音识别候补的似然值之差和上述第2语音识别候补与上述第3语音识别候补的似然值之差的似然差之比，判断是否舍弃上述所提取出的语音识别候补。3.根据权利要求2所述的语音识别装置，其特征在于上述识别过滤单元，如果上述似然差之比小于规定值就舍弃上述第1语音识别候补，如果大于上述规定值就将上述第1语音识别候补作为语音识别的对象。4.根据权利要求2所述的语音识别装置，其特征在于上述词组存储单元存储按语音的特征划分的组的语音模式系列信息，上述识别过滤单元包括第1判断单元，该第1判断单元基于按语音的特征划分的组的上述似然差之比，判断是否舍弃上述所提取出的第1语音识别候补。5.根据权利要求2所述的语音识别装置，其特征在于上述识别过滤单元包括第2判断单元，该第2判断单元基于上述第1语音识别候补的似然值和上述第2语音识别候补的似然值，判断是否舍弃上述所提取出的第1语音识别候补。6.根据权利要求2所述的语音识别装置，其特征在于上述似然值计算单元提取较上述第3语音识别候补次之的第4语音识别候补，上述识别过滤单元包括第3判断单元，该第3判断单元基于上述第1语音识别候补的似然值与上述第4语音识别候补的似然值之差判断是否舍弃上述所提取出的第1语音识别候补。7.根据权利要求2所述的语音识别装置，其特征在于上述识别过滤单元包括第4判断单元，该第4判断单元基于上述第1语音识别候补的似然值，判断是否舍弃上述所提取出的第1语音识...

【专利技术属性】
技术研发人员：吉田满次，兵藤一峰，
申请(专利权)人：株式会社雷特龙，
类型：发明
国别省市：JP[日本]

全部详细技术资料下载我是这个专利的主人