【技术实现步骤摘要】
本专利技术涉及一种声音识别方法、一种信息形成方法、一种声音识别装置,和一种记录介质,尤其涉及一种从有关一种输入声音信号的给定字典选择一个字或许多字的声音识别方法和装置,并涉及一种用于形成一个字典的信息形成方法和一种在其上记录有声音识别字典的记录介质。在从一种输入声音信号中抽取语言信息的声音识别领域,肯定会从一个给定字典中频繁地选择和输入相对应的字。例如,在关于地名的声音识别中,标准图形(pattem)是对用作目标候选字的地名形成的,并在由对一种输入声音信号进行分析所获得的特征量图形(pattem)和全部标准图形之间进行匹配,即进行距离计算,以选择出一个与地名最相似的图形。当概率模型用作一种隐性(hidden)马尔克夫模型(HMM)的时候,以与上述相同的方式完成这种操作。对于每一个地名都形成一个HMM而且一定会选择出对于输入声音信号产生概率最高的一种模型。在一般的声音识别中,进行距离计算以设定目标字和输入声音信号之间的匹配,或采用每个字的概率模型计算出产生的概率,由此向所有的字分别加分(score)。根据分数来选择得分最高的字。例如,在HMM(隐性马尔可夫模型)中,事先对于识别目标字形成概率模型,然后再通过由分析一个未知的输入声音信号获得的特征量来计算发生概率。根据发生的概率,向所有的字加分。选择出一个得分最高的字作为识别结果。在这种情况下,当把距离用作参数时,高分对应的是短距离,而当把发生概率作为参数时,高分对应的是高概率。在这种方式中,分数被用作相应于估计值的表示。在词汇量小的识别系统中,当如上所述计算出所有目标选择物(candidates)的分数 ...
【技术保护点】
一种声音识别方法,其中给出多个声音识别目标字,并通过使用事先对于一个未知的输入声音信号计算的参数向声音识别目标字加分,由此提取和识别一个相应的声音识别目标字,其特征在于,通过使用声音识别目标字之间的相关值将声音识别目标字构成分层结构,并 通过使用分层结构构造声音识别目标字的字典,对于未知的输入声音信号进行分数计算。
【技术特征摘要】
JP 1995-7-19 182851/951.一种声音识别方法,其中给出多个声音识别目标字,并通过使用事先对于一个未知的输入声音信号计算的参数向声音识别目标字加分,由此提取和识别一个相应的声音识别目标字,其特征在于,通过使用声音识别目标字之间的相关值将声音识别目标字构成分层结构,并通过使用分层结构构造声音识别目标字的字典,对于未知的输入声音信号进行分数计算。2.按照权利要求1的一种声音识别方法,其特征在于,采用这样得到的位置作为声音识别目标字之间的相关值,即所有识别目标字依据通过与识别目标字相对应的声音数据计算的分数预计值为基础的数据值按照分数增加的顺序被排列。3.按照权利要求1的一种声音识别方法,其特征在于,当通过使用构造成分层结构的声音识别目标字的字典,对于一个未知声音信号进行识别处理时,对于在分层结构中的合适分层的声音识别目标字的分数计算,对于紧接在根据前面计算了分数确定的具有高分数的字所属的层下面的一个分层上的字的分数计算,对于紧接在根据前面计算了分数确定的字的分层下面的一个分层上的字的分数计算,以及字的提取和分数计算,相似地进行上述计算直到最低分层,最后从计算了其分数的字中选择至少一个具有最高分数的字。4.按照权利要求3的一种声音识别方法,其特征在于,存贮暂时计算分数的字的分数,而且当必须计算分数时,用存贮的分数来避免重复进行分数计算。5.按照权利要求3的一种声音识别方法,其特征在于,准备对于多个声音识别目标字的概率模型,对于未知的输入声音信号计算概率模型的产生概率,按照产生概率提取和识别一个相应的声音识别目标字,还有,根据与声音识别目标字相对应的概率模型的状态转变概率确定一个状态转变序列,根据与状态转变相对应的输出符号概率确定一个符号序列,对于与计算声音识别目标字相对应的模型计算获得的符号序列的产生概率,根据产生概率,通过使用声音识别目标字之间的相关值,将声音识别字构成一个分层结构。6.按照权利要求5的一种声音识别方法,其特征在于,根据与识别目标字相对应的概率模型的概率确定多个状态转变序列,根据与状态转变相对应的输出符号概率,从每一个状态转变序列中确定一个符号序列,对于与字相对应的模型计算多个获得的符号序列的产生概率,对于与字相对应的模型计算这些产生概率,按照产生概率预计值增加的顺序排列所有声音识别目标字,并把声音识别目标字的位置用作字之间的相关值。7.一种形成用于图形识别方法的图形识别目标信息的信息形成方法,其中给出多个图形识别目标,通过使用事先对于一个未知输入信号计算的参数向图形识别目标加分,由此提取和识别一个相应的图形识别目标字,其特征在于,包括分组步骤,根据在图形识别目标之间的相关值,对相关值减少的图形识别目标进行分组,选择作为组的典型目标的图形识别目标,进行分组,以形成一些每一个都具有一个典型图形识别目标和从属于该典型图形识别的一个图形识别目标集合之间关系的组;对于具有小的相关值并起任何组的典型目标作用的图形识别目标,使图形识别目标从属于典型图形识别目标组的步骤,其中,这些图形识别目标没有被选作组的典型目标;和再进行分组并向组添加由分组得到的典型图形识别目标,以及增加上述组的步骤,其中,这些步骤重复预定次数以将字构成分层结构。8.按照权利要求7的一种信息形成方法,其特征在于,当对相关值减小的图形识别目标分组时,从相关值最小的图形识别目标进行分组。9.按照权利要求7的一种信息形成方法,其特征在于,放松确定相关值是否小的条件,或者对于每一个图形识别目标,按照分组的情况使这个条件严格。10.按照权利要求7的一种信息形成方法,其特征在于,图形识别...
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。