【技术实现步骤摘要】
本专利技术涉及基于用于与说话者无关的语音识别的语音模型来识别语音的系统,以及具体地说,涉及能优选地用于减少与说话者无关的语音识别所需的存储器容量的语音识别设备。
技术介绍
通常,用于识别非特定人的语音的技术称为与说话者无关的语音识别,以及用于识别特定人的语音的技术称为与说话者相关的语音识别。作为用于识别语音的一种方法,例如,使用通过用于每个音素的语音参数模型化的语音模型来识别语音,组成一个词的音素定义为语音单元。用词“Hokkaido”举例,用具有串联连接的九个音素“h”、“o”、“ts”、“k”、“a”、“i”、“d”、“o”和“u”的网络产生语音模型“Hokkaido”。另外,为识别另一词,诸如“Aomori”或“Akita”,应当准备匹配该词的语音模型。在与说话者无关的语音识别的情况下,用对许多人公用的语音参数来模型化这一语音模型。作为用于使用音素的语音模型的用于与说话者无关的语音识别的技术,通常已知Hidden Markov Model(在下文中简称为HMM),并在例如“Digital signal Processing of Speech/Sound ...
【技术保护点】
一种语音识别设备,包括被这样模型化的语音模型,以使得基于给定语音参数,将特定语音包括在输入语音中的概率输出作为出现概率,以及当给定特定语音参数时所述出现概率增加,该设备从输入语音抽取所述语音参数,以及基于所抽取的语音参数和所述语音模型来识别语音,其特征在于,所述设备包括用于展开所述语音模型的语音模型展开存储装置,构成多个语音模型组,每个组组合了所述特定语音参数不同的多个语音模型,以及构成指定用于语音模型组的预定链接关系的语音模型网络,以及与所述语音模型 网络中的多个语音模型组具有链接关系的语音模型组被定义为主要语音模型组,以及与 ...
【技术特征摘要】
JP 2002-5-10 135770/20021.一种语音识别设备,包括被这样模型化的语音模型,以使得基于给定语音参数,将特定语音包括在输入语音中的概率输出作为出现概率,以及当给定特定语音参数时所述出现概率增加,该设备从输入语音抽取所述语音参数,以及基于所抽取的语音参数和所述语音模型来识别语音,其特征在于,所述设备包括用于展开所述语音模型的语音模型展开存储装置,构成多个语音模型组,每个组组合了所述特定语音参数不同的多个语音模型,以及构成指定用于语音模型组的预定链接关系的语音模型网络,以及与所述语音模型网络中的多个语音模型组具有链接关系的语音模型组被定义为主要语音模型组,以及与所述语音模型网络中的所述主要语音模型组具有链接关系的语音模型组被定义为辅助语音模型组;以及当识别语音时,这样模型化非特定语音识别语音模型,以使得当给定表示不同于能由属于所述主要语音模型组的语音模型识别的特定语音的语音的语音参数时,所述出现概率增加,以及属于所述主要语音模型组的语音模型被展开在所述语音模型展开存储装置中;以及将从输入语音抽取的语音参数提供给所述语音模型展开存储装置中的语音模型,以及基于从属于所述主要语音模型组的语音模型输出的出现概率和从所述非特定语音识别语音模型输出的出现概率,使属于所述辅助语音模型组的任何一个的语音模型展开在所述语音模型展开存储装置中。2.一种语音识别设备,包括这样模型化的语音模型,以使得基于给定语音参数,将特定语音包括在输入语音中的概率输出作为出现概率,以及当给定特定语音参数时所述出现概率增加,所述设备从输入语音抽取所述语音参数,以及基于所抽取的语音参数和所述语音模型来识别语音,其特征在于,所述设备包括第一语音模型组,其组合了所述特定语音参数不同的多个语音模型;第二语音模型组,其组合了所述特定语音参数不同的多个语音模型且与属于所述第一语音模型组的任何语音模型具有链接关系;第三语音模型组,其组合了所述特定语音参数不同的多个语音模型且与属于所述第一语音模型组的任何其他语音模型具有链接关系;这样模型化的非特定语音识别语音模型,以使得当给定表示不同于能由属于所述第一语音模型组的语音模型识别的特定语音的语音的语音参数时,所述出现概率增加;用于展开所述语音模型的语音模型展开存储装置;用于从输入语音抽取所述语音参数的语音参数抽取装置;以及语音识别装置,用于基于属于所述第一语音模型组、所述第二语音模型组和所述第三语音模型组的语音模型以及由所述语音参数抽取装置抽取的语音参数来识别语音;以及所述语音识别装置将属于所述第一语音模型组的语音模型和所述非特定语音识别语音模型展开在所述语音模型展开存储装置中,将由所述语音参数抽取装置抽取的语音参数提供给所述语音模型展开存储装置中的语音模型,以及基于从属于所述第一语音模型组的语音模型输出的出现概率和从所述非特定语音识别语音模型输出的出现概率,将属于所述第二语音模型组和所述第三语音模型组中任何一个的语音模型展开在所述语音模型展开存储装置中。3.如权利要求2所述的语音识别设备,其特征在于,所述语音识别装置将由所述语音参数抽取装置抽取的语音参数提供给所述语音模型展开存储装置中的语音模型,以及当从所述非特定语音识别语音模型输出的出现概率等于或大于预定值时,基于从属于所述第一语音模型组的语音模型输出的出现概率,将属于所述第二语音模型组和所述第三语音模型组中任何一个的语音模型展开在所述语音模型展开存储装置中。4.如权利要求2和3的任何一个所述的语音识别设备,其特征在于,所述语音识别装置将由所述语音参数抽取装置抽取的语音参数提供给所述语音模型展开存储装置中的语音模型,以及当从所述非特定语音识别语音模型输出的出现概率等于或大于所述预定值时,从所述语音模型展开存储装置移出属于所述第一语音模型组的语音模型和所述非特定语音识别语音模型,以及基于从属于所述第一语音模型组的语音模型输出的出现概率,将属于所述第二语音模型组和所述第三语音模型组中任何一个的语音模型展开在所述语音模型展开存储装置中。5.如权利要求3和4的任何一个所述的语音识别设备,其特征在于,所述非特定语音识别语音模型链接到属于所述第一语音模型组的语音模型;以及当给定所述语音参数时,按所述第一语音模型组的语音模型和所述非特定语音识别语音模型的顺序,传播所述出现概率的变化。6.如权利要求5所述的语音识别设备,其特征在于,其特征在于,所述设备进一步包括用于存储所述语音参数的语音参数存储装置,所述语音参数抽取装置从输入语音抽取所述语音参数,以及按预定顺序将所抽取的语音参数存储在所述语音参数存储装置中;以及所述语音识别装置按所述预定顺序从所述语音参数存储装置读取所述语音参数,以及将所读取的语音参数提供给所述语音模型展开存储装置的语音模型,以及当从所述非特定语音识别语音模型输出的出现概率等于或大于所述预定值时,基于从属于所述第一语音模型组的语音模型输出的出现概率,将属于所述第二语音模型组和所述第三语音模型组中任何一个的语音模型展开在所述语音模型展开存储装置中,按与所述预定顺序相反的顺序,使所述语音参数存储装置中所述语音参数的读位置移回预定数,按所述预定顺序从读位置读取所述语音参数,以及将所读取的语音参数提供给所述语音模型展开存储装置中的语音模型。7.如权利要求6所述的语音识别设备,其特征在于,所述语音识别装置将来自所述第一语音模型组、所述出现概率最高的语音模型指定为识别语音模型,使属于与所述识别语音模型具有链接关系的所述第二语音模型组和所述第三语音模型组中之一的语音模型展开在所述语音模型展开存储装置中,计算所述出现概率的变化从所述识别语音模型传播到所述非特定语音识别语音模型为止所需的时间,以及按相应于所述的所需时间的数,返回所述语音参数存储装置中所述语音参数的读位置。8.如权利要求7所述的语音识别设备,其特征在于,所述语音识别装置按相应于所述的所需时间的数,从指定所述识别语音模型时的所述读位置返回所述语音参数存储装置中所述语音参数的读位置。9.如权利要求2-8的任何一个所述的语音识别设备,其特征在于,代替属于所述第二语音模型组和所述第三语音模型组的语音模型,将表示能由语音模型识别的特定语音的发音的发音表示字符串存储在所述语音模型展开存储装置中,以及按等于属于所述第二语音模型组的语音模型的数量和属于所述第三语音模型组的语音模型的数量中较大的一个的数,将能基于所述发音表示字符串构成所述语音模型的语音模型模板存储在所述语音模型展开存储装置中,如果属于所述第二语音模型组和第三语音模型组中任何一个的语音模型展开在所述语音模型展开存储装置中,则所述语音识别装...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。