语音识别方法和装置制造方法及图纸

技术编号：3047699 阅读：173 留言：0更新日期：2012-04-11 18:40

一种语音识别方法，它包括以下步骤：将一个未知发音的一部分与基准模型比较以产生一个相似性测量值；将未知发音的其它部分与基准模型反复比较，以相对于由存储数据限定的基准发音的一组许可序列中的每一个产生累计相似性测量值，其中包括先前通过将所说发音的一个或多个前部与对应于各个许可序列中的一个或多个先前发音的一个基准模型或多个模型比较得到的测量值的贡献；按照每个许可序列的加权因子将所说累计测量值进行加权处理，其中所说加权处理是利用对于每个许可序列的加权因子的组合值对一个部分序列的一次或累计测量值的计算值进行的，所说的许可序列从该部分序列开始，这些加权因子很少应用于相对于该部分序列从其开始的一个发音或较短序列产生的测量值。（*该技术在2016年保护过期，可自由使用*）

全部详细技术资料下载

【技术实现步骤摘要】
本申请所说的语音识别应用于下述场合，为了确定输入语音信号中哪一个词汇(或者，更一般地说，就是发音)最明显地相似，并按照与该词汇相关的一个先验概率获得有关信息而进行语音识别处理。这种场合的一个实例是在我们申请的国际专利申请No.95/02524中所述的自动电话簿查询系统。在该系统中，(i)使用者说出一个城镇的名称；(ii)一个语音识别装置按照存储的城镇数据确定与所说的城镇名称最符合的几个城镇，并产生表示符合接近程度的“评分”或概率；(iii)对于所确定的城镇列出所有街道名称；(iv)使用者说出街道的名称；(v)语音识别装置从街道列表中识别几个与所说的街道名称最符合的街道名称，并且也给出评分；(vi)对每个街道评分根据该街道所在城镇得到的评分进行加权处理，最相近的“街道”被认为是具有最佳加权评分的街道。先验概率并不必须从先前的语音识别过程中产生；例如在上述专利申请中所述的另一种电话簿查询系统利用识别调取统计信息地点的信号，按照该地区的一个查询者所查询的最符合的城镇对城镇名称识别的结果进行加权处理。这种方法具有可靠的优点，例如除非在街道名称识别步骤中次选城镇中的街道名称评分明显高于首选城镇，一般保持对次选城镇不进行街道选择的状态。但是这种方法的缺点是由于在进行街道名称识别步骤时识别装置仅仅产生有限数目的候选街道名称，很可能这个短的街道名称列表只包含位于具有较低评分的城镇中的街道名称，即，位于具有较高评分的城镇中的具有较低评分的街道名称在能够进行加权处理之前已经被识别装置“删除”。美国专利US-4783803中介绍了一种语音识别装置，在该装置中，先验概率与先前已经识...

【技术保护点】

【技术特征摘要】
1.一种语音识别方法，它包括以下步骤将一个未知发音的一部分与基准模型比较以产生一个相似性测量值；将未知发音的其它部分与基准模型反复比较，以相对于由存储数据限定的基准发音的一组许可序列中的每一个产生累计相似性测量值，其中包括先前通过将所说发音的一个或多个前部与对应于各个许可序列中的一个或多个先前发音的一个基准模型或多个模型比较得到的测量值的贡献；按照每个许可序列的加权因子将所说累计测量值进行加权处理，其中所说加权处理是利用对于每个许可序列的加权因子的组合值对一个部分序列的一次或累计测量值的计算值进行的，所说的许可序列从该部分序列开始，这些加权因子很少应用于相对于该部分序列从其开始的一个发音或较短序列产生的测量值。2.如权利要求1所述的一种方法，还包括以下步骤对于任何其加权累计测量值所指出的相似性在由删除准则所限定的程度上小于其它此类序列的测量值的序列不再进行反复比较。3.如权利要求2所述的一种方法，其特征在于所说删除准则根据所产生的、仍需反复比较的测量值的数目反复调整，以便保持这个数目恒定。4.语音识别装置，它包括存储装置，用于存储与表示发音的基准模型有关的数据和构成基准发音的许可序列的数据；比较装置，用于将一个未知发音的各部分与基准模型反复比较，以相对于由存储数据构成的若干许可的基准发音序列中的每一个，产生关于相似性的累计测量值，其中包含先前通过将该发音的一个或多个前部与对应于在各个许可序列中的一个或多个先前发音的一个或多个基准模型比较得到的测量值的贡献；和可用于按照加权因子对每个许可序列的累计测量值进行加权处理的装置，其中加权处理装置可以利用对于每个许可序列的加权因子的组合值对一个部分序列的一次或累计测量值的计算值进行加权处理，所说的许可序列从该部分序列开始，这些加权因子很少应用于相对于该部分序列从其开始的一个发音或较短序列产生的测量值。5.如权利要求4所述的装置，它还包括对于任何其加权累计测量值所指出的相似性在由删除准则所限定的程度上小于其它此类序列的测量值的序列不再进行反复比较的装置。6.如权利要求5所述的装置，其特征在于所说删除准则根据所产生的、仍需反复...

【专利技术属性】
技术研发人员：F·J·斯卡希尔，A·D·西蒙，S·J·怀塔克尔，
申请(专利权)人：英国电讯公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人