【技术实现步骤摘要】
【国外来华专利技术】背景1、领域本专利技术涉及通信领域,尤其涉及噪声环境和频率失谐条件下改善语音识别性能的系统和方法。2、背景语音识别(VR)是一种非常重要的技术,它通过赋予机器具有模拟智能来识别使用者或者使用者的语音命令,而且促进了人和机器的交流。语音识别也是一种理解人类语言的非常重要的技术。采用某些技术将声学语音信号恢复成语言信息的系统称为话音识别器。这里使用的术语“话音识别器”通常是指任意的使用者语音接口使能装置。由于安全的原因,话音识别的使用(通常也叫语言识别)变得越来越重要。例如,可以使用语音识别来代替无线电话键盘上手动操作按键。当使用者在驾驶车辆的同时使用电话时,这一点变得尤为重要。当使用没有语音识别的电话机时,驾驶员必须把一只手从方向盘上拿开打电话,而且要在按键拨打电话的时候看着电话键盘。这些动作增加了发生车祸的可能性。语音使能电话(即,为语音识别而设计的电话)使得驾驶员能够在持续看着路面的情况下拨打电话。另外,手持车载系统使得驾驶员能够在电话呼叫的时候将双手保持在方向盘上。语音识别装置可以分为依赖于说话者的设备(SD)和不依赖于的说话者的设备(SI)。依赖于说话者的设备(SD)较为常用,其设计用于识别来自特定使用者的命令。相反,不依赖于说话者的设备(SI)能够接受来自任何使用值的话音命令。为了提高给定语音识别系统(无论是依赖于说话者的设备(SD)还是不依赖于说话者的设备(SI))的性能,都要进行训练,使系统具有有效的参数。换句话讲,在系统能够很好的工作之前,需要进行学习。典型的手持车载系统可以包括键盘上的数字键;关键词“呼叫”、“发送”、“拨号”、“取消”、“清 ...
【技术保护点】
一种分布式语音识别系统的语音识别器,其特征在于,它包括:配置用于将数字化语音信号转变为吠声(bark)振幅的吠声振幅生成模块;与吠声振幅生成模块相连接的μ-log压缩模块,所述μ-log压缩模块用以对吠声振幅执行μ-log压缩; 与所述μ-log压缩模块相连的RASTA滤波模块,所述RASTA滤波模块用以对μ-log吠声振幅进行RASTA滤波;以及与所述RASTA滤波模块相连的对数倒频谱转换模块,所述对数倒频谱转换模块用于生成J静态对数倒频谱系数以及J动态对数倒 频谱系数。
【技术特征摘要】
【国外来华专利技术】US 2000-10-31 09/703,1911.一种分布式语音识别系统的语音识别器,其特征在于,它包括配置用于将数字化语音信号转变为吠声(bark)振幅的吠声振幅生成模块;与吠声振幅生成模块相连接的μ-log压缩模块,所述μ-log压缩模块用以对吠声振幅执行μ-log压缩;与所述μ-log压缩模块相连的RASTA滤波模块,所述RASTA滤波模块用以对μ-log吠声振幅进行RASTA滤波;以及与所述RASTA滤波模块相连的对数倒频谱转换模块,所述对数倒频谱转换模块用于生成J静态对数倒频谱系数以及J动态对数倒频谱系数。2.如权利要求书1所述的语音识别器,其特征在于,它还包含处理J静态对数倒频谱系数以及J动态对数倒频谱系数以及产生识别假说的末端。3.如权利要求书1所述的语音识别器,其特征在于,所述μ-log压缩是G.711μ-log压缩。4.如权利要求书1所述的语音识别器,其特征在于,所述吠声振幅生成模块每隔T毫秒的时间,将数字语音信号转换成K吠声振幅。5.如权利要求书4所述的语音识别器,其特征在于,所述对数倒频谱转换模块用来每隔T毫秒的时间,生成J静态对数倒频谱系数以及J动态对数倒频谱系数。6.如权利要求书4所述的语音识别器,其特征在于,K等于16。7.如权利要求书4所述的语音识别器,其特征在于,T等于10。8.一种分布式语音识别系统的语音识别器,其特征在于,它包括配置用于将数字化语音信号转变为吠声振幅的吠声振幅生成模块;与吠声振幅生成模块相连接的A-log压缩模块,所述A-log压缩模块用以对吠声振幅执行A-log压缩;与所述A-log压缩模块相连的RASTA滤波模块,所述RASTA滤波模块用以对A-log吠声振幅进行RASTA滤波;以及与所述RASTA滤波模块相连的对数倒频谱转换模块,所述对数倒频谱转换模块用于生成J静态对数倒频谱系数以及J动态对数倒频谱系数。9.如权利要求书8所述的语音识别器,其特征在于,它还包含处理J静态对数倒频谱系数以及J动态对数倒频谱系数以及产生识别假说的末端。10.如权利要求书8所述的语音识别器,其特征在于,所述μ-log压缩是G.711μ-log压缩。11.如权利要求书8所述的语音识别器,其特征在于,所述吠声振幅生成模块每隔T毫秒的时间,将数字语音信号转换成K吠声振幅。12.如权利要求书11所述的语音识别器,其特征在于,所述对数倒频谱转换模块用来每隔T毫秒的时间,生成J静态对数倒频谱系数以及J动态对数倒频谱系数。13.如权利要求书11所述的语音识别器,其特征在于,K等于16。14.如权利要求书12所述的语音识别器,其特征在于,T等于10。15.一种分布式语音识别系统的语音识别器,其特征在于,它包括配置用于将数字化语音信号转变为吠声振幅的吠声振幅生成模块;与所述吠声振幅生成模块相连接的μ-log压缩模块,所述μ-log压缩模块用以对所述吠声振幅执行μ-log压缩;与所述μ-log压缩模块相连的RASTA滤波模块,所述RASTA滤波模块用以对μ-log吠声振幅进行RASTA滤波;以及与所述RASTA滤波模块相连的μ-log扩展模块,所述μ-log扩展模块用于对经滤波的μ-log吠声振幅进行μ-log扩展。16.如权利要求书15所述的语音识别器,其特征在于,它还包括用于处理经扩展的吠声振幅和产生识别假设的末端。17.如权利要求书15所述的语音识别器,其特征在于,所述μ-log压缩和扩展是G.711μ-log压缩和扩展。18.如权利要求书15所述的语音识别器,其特征在于,所述吠声振幅生成模块每隔T毫秒的时间,将数字语音信号转变为K吠声振幅。19.如权利要求书18所述的语音识别器,其特征在于,所述μ-log扩展模块用来将经滤波的μ-log吠声振幅扩展成K扩展的吠声振幅。20.如权利要求书18所述的语音识别器,其特征在于,K等于16。21.如权利要求书19所述的语音识别器,其特征在于,所述T等于10。22.一种分布式语音识别系统的语音识别器,其特征在于,它包括配置用于将数字化语音信号转变为吠声振幅的吠声振幅生成模块;与所述吠声振幅生成模块相连接的A-log压缩模块,所述A-log压缩模块用以对所述吠声振幅执行A-log压缩;与所述A-log压缩模块相连的RASTA滤波模块,所述RASTA滤波模块用以对A-log吠声振幅进行RASTA滤波;以及与所述RASTA滤波模块相连的A-log扩展模块,所述μ-log扩展模块用于对经滤波的μ-log吠声振幅进行A-log扩展。23.如权利要求书22所述的语音识别器,其特征在于,它还包括处理经扩展的吠声振幅和产生识别假设的末端。24.如权利要求书22所述的...
【专利技术属性】
技术研发人员:H加鲁达德里,
申请(专利权)人:高通股份有限公司,
类型:发明
国别省市:US[美国]
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。