用于执行观察概率计算的装置和方法制造方法及图纸

技术编号:3046817 阅读:146 留言:0更新日期:2012-04-11 18:40
一种观察概率计算装置,包括:    第一操作单元,从输入语音信号中抽取的参数中减去从代表性的音素中抽取的参数的平均值,并用平均值的分布度(方差)乘以该相减的结果以得到第一输出,其中,分布度(方差)称作Precision;    第二操作单元,平方第一操作单元的第一输出并将平方的结果累加N次以得到第二输出;    第三操作单元,从第二操作单元的第二输出中减去预定的加权值以得到第三输出;和    比较器,存储第三操作单元的第三输出,从第三操作单元的输出中抽取L输出,并以大小顺序存储该抽取的L输出。(*该技术在2023年保护过期,可自由使用*)

【技术实现步骤摘要】

本专利技术涉及一种用于语音识别的观察概率计算。
技术介绍
预计使用语音识别应用的领域扩展到我们日常生活中通常使用的大多数电子产品。IBM是首先提出利用语音识别的技术的一个,它通过对语音识别应用隐藏马尔可夫模型算法证明隐藏马尔可夫模型的有效性,如美国专利号5,636,291所描述的那样。‘291专利公开一种应用隐藏马尔可夫模型算法的字符识别系统。‘291专利把隐藏马尔可夫模型算法组织成通用处理器执行的程序。‘291专利公开的语音识别系统粗略包括三个部分预处理器,前端部分,和建模部分。在预处理器中识别关心的所有字符的语义。在前端部分,从识别的语义中抽取相互比较的特征值或参数。在建模部分执行培训阶段一个修整相位以产生一个模型。这个模型被作为一个标准,根据抽取的特征值或参数来精确的判断识别的字符。另外,根据识别的语义,建模部分决定在预先分配的字符中选择哪一个作为识别的字符。IBM也已经公布了一种使用广泛应用的隐藏马尔可夫模型算法的语音识别系统和方法。美国专利号5,799,278公开了一种语音识别系统和方法,其中使用一种隐藏马尔可夫模型算法识别单独的发声的字。这种语音识别系统和方法被培训来识别发音上不同的字,并适合于识别大批量的字。如上所述的语音识别系统需要大量的处理时间以执行语音识别所必需的计算。一种用于这种系统的观察概率计算大约占用使用一种隐藏马尔可夫模型算法的语音识别装置所需的计算总量的62%。
技术实现思路
本专利技术的一个优选的实施例直接针对于为了执行口语字的语音识别而计算观察概率的一种装置。该装置包括一个第一操作单元,从一个输入语音信号的第二参数中减去输入语音信号的第一多个参数的平均值,并乘以相减的结果以得到一个第一输出。第一输出结果在在第二操作单元中被平方并累加N次以得到一个第二输出。第三操作单元从第二输出中减去一个给定的加权值以得到一个第三输出,为了抽取这里的L输出,一个比较器存储第三输出,并根据抽取的L输出的大小顺序存储L抽取的输出。本专利技术的另一个优选的实施例直接针对于计算观察概率的一种方法,其中从输入的语音信号中抽取的第二参数中减去输入语音信号的第一多个参数的平均值以得到一个结果。相乘这一结果以得到第一输出。第一输出被平方和累加以得到一个观察概率值。本专利技术的另一个优选的实施例直接针对于一种识别语音信号的方法,其中从输入语音信号中抽取的第二参数中减去输入语音信号的第一多个参数的平均值以得到一个结果。相乘这一结果以得到第一输出。第一输出被平方和累加以得到一个第二输出。从第二输出中减去一个给定的加权值得到一个第三输出。从第三输出,抽取L输出,和一个或多个具有最高大小顺序的L输出,被选择作为对应于识别的语音信号。附图说明通过优选实施例的详细描述,其中参考附图,本专利技术的优选的实施例的如上所述的和其他的特征和优点将变的更加明显,其中图1是一个普通的语音识别系统的结构图;图2说明得到一个音素的状态顺序的方法;图3说明一个字识别处理;图4说明依据本专利技术的优选实施例的执行语音识别所需的计算的数量;图5依据本专利技术的优选实施例的观察概率计算装置的结构图;图6说明位分辨率的选择;图7依据本专利技术的优选实施例的语音识别装置的结构图;图8是说明在图7的语音识别装置中接收控制命令和数据的过程的结构图;图9是是说明在图7的语音识别装置中接收控制命令和数据过程的时序图;图10是显示对于隐藏马尔可夫模型算法所必需的每个功能的计算数量的表格;图11显示了包括在方程8中的第一表达式的算法;和图12是依据本专利技术的优选实施例的观察概率计算装置的结构图。具体实施例方式本专利技术的优选的实施例直接针对于一种观察概率计算装置和计算用于语音识别的观察概率的方法。这种方法和装置使用隐藏马尔可夫模型算法有效的执行一个观察概率计算。观察概率计算装置可以提高语音识别执行的速度。与在先技术相比,观察概率计算装置可以减少指令数量大约50%或更多。因此,操作可以在潜在地比现有技术更低的时钟速率下处理,并能量消耗可以减少到在先技术的一半。进一步,观察概率计算装置可以包括专用的硬件来执行观察概率计算。观察概率计算代表性的占用隐藏马尔可夫模型算法的最大数量。因此,包括观察概率计算装置的语音识别装置的处理速度将增加,以求减少功率消耗。图1是一个普通的语音识别系统的结构图。在图1的普通语音识别系统100中,模拟到数字转换器(ADC)101可以把连续的(模拟)语音信号转换成数字语音信号。为了加重清楚的区别的发音,预加重单元可以加重数字语音信号的高频分量。在采样的给定数量的单元中,数字语音信号可以被分离和采样。数字语音信号可以在例如240采样(30ms)单元被分离。由于倒频谱(它是应用于隐藏马尔可夫模型算法的参数)和从频谱产生的能量通常用作隐藏马尔可夫模型中的特征向量能量计算器103计算倒频谱和能量。为了得到能量,能量计算器103在时域中使用能量计算公式持续计算瞬时的能量30ms。能量计算公式,其中“Y(i)”表示能量,在方程1中示出Y(i)=Σj=0239(X(W_RATE·i+j))2W_SIZE,0≤i≤29--(1)]]>其中W_SIZE=240W_RATE=80 在方程1中,“i”是帧的数量(方程1计算30帧),“X”表示数字化的语音数据,“j”是一帧的数据的指标,W_SIZE意味着每一帧由240数据组成,和W_RATE是重叠数据的数量。方程1计算的能量值可以确定当前输入的信号是语音信号或噪音。为了计算频域中的频谱,可以使用快速傅里叶变换(FFT)。例如,可以使用256点复数FFT操作计算频域中的频谱。256点复数FFT操作可以用方程2表示如下X(k)=Σn=0255[x(n)cos(2πkn256)+y(n)sin(2πkn256)]+]]>j·Σn=0255[y(n)cos(2πkn256)-x(n)sin(2πkn256)]--(2)]]>在方程2中,X(k)是在k进行快速傅里叶变换(FFT)的结果,“k”是0到255之间的值。项x(n)和y(n)是在FFT中使用的实数。如果能量计算结果根据能量计算结果指示当前输入的信号是语音信号,在寻端点单元(FindEndPoint)单元104中确定输入的语音信号的起始端和末端。用这种方法,如果输入语音信号的起始端和末端定义的有效的字被确定,只有对应被确定的有效的字的频谱数据被存储在缓冲器105中。换句话说,缓冲器105中仅存储通过从说话人所说的字中去除噪音后得到的有效的语音信号。mel滤波器106执行mel滤波,它是用于从通过从32频带的带宽单元中滤波的频谱中得到倒频谱的预处理步骤。因此,可以使用mel滤波计算32频带的频谱。通过把在频域中的计算的频谱变换成时域,可以得到倒频谱,它是应用于隐藏马尔可夫模型算法中使用的参数。频域转换成时域可以在IDCT单元107中使用反离散余弦变换(IDCT)来实现。由于得到的频谱和能量值(即,在应用隐藏马尔可夫模型的搜索中使用的值)之间可能存在实际的差值(即,大约1本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种观察概率计算装置,包括第一操作单元,从输入语音信号中抽取的参数中减去从代表性的音素中抽取的参数的平均值,并用平均值的分布度(方差)乘以该相减的结果以得到第一输出,其中,分布度(方差)称作Precision;第二操作单元,平方第一操作单元的第一输出并将平方的结果累加N次以得到第二输出;第三操作单元,从第二操作单元的第二输出中减去预定的加权值以得到第三输出;和比较器,存储第三操作单元的第三输出,从第三操作单元的输出中抽取L输出,并以大小顺序存储该抽取的L输出。2.如权利要求1所述的装置,其中,比较器包括第一到第L寄存器,按照大小顺序存储该抽取的L输出;和第一到第L变址寄存器,存储在第一到第L寄存器中的抽取的L输出产生的顺序。3.如权利要求2所述的装置,其中,L为3。4.如权利要求1所述的装置,进一步包括第一操作寄存器,存储第一输出并输出存储的第一输出到第二操作单元;第二操作寄存器,存储第二输出并输出存储的第二输出到第三操作单元;和第三操作寄存器,存储第三输出并输出存储的第三输出到比较器。5.如权利要求1所述的装置,进一步包括多个寄存器,存储参数、平均值、分布度和加权值。6.如权利要求1所述的装置,其中第一和第二操作单元在隐藏马尔可夫模型算法中执行观察概率计算(y)依据y=Σi=01Σj=012var[i][j](Feature[i][j]-Mean[i][j])2]]>其中,i是表示音素的类型的系数,j表示参数的数量,var表示平均值的分布度。7.如权利要求6所述的装置,其中分布度是8.如权利要求1所述的装置,其中第三输出是从输入语音信号中抽取的平均值和参数之间的概率距离。9.如权利要求1所述的装置,其中从输入语音信号中抽取的参...

【专利技术属性】
技术研发人员:闵丙昊金泰洙朴贤宇张虎郎洪根哲金性在
申请(专利权)人:三星电子株式会社
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1
相关领域技术
  • 暂无相关专利