一种应用于语音识别的信号增益方法和装置制造方法及图纸

技术编号：13601583 阅读：51 留言：0更新日期：2016-08-27 17:18

本发明专利技术提供一种应用于语音识别的信号增益方法和装置，以在对语音信号放大时防止过载失真，提高语音识别的准确率。所述方法包括：删除经过预处理后的语音信号中的无话段，得到第一语音信号；求取第一语音信号中每帧信号存在语音的概率PRatio；修正第一语音信号的增益，使概率PRatio小于第一判决门限的信号的增益减小并且概率PRatio大于第一判决门限的信号的增益增大，得到增益修正后的第二语音信号；限制第二语音信号的增益，使其小于系统设定的增益极值。本发明专利技术提供的技术方案可防止后期语音识别时语音识别引擎工作的中止，提高语音识别的有效性，有效提高后期语音识别的准确率，并防止语音识别过程中过载失真情况的发生。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术属于语音识别领域，尤其涉及一种应用于语音识别的信号增益方法和装置。
技术介绍
自动增益控制是数字接收端重要的组成部分，其功能是针对输入信号的强弱自动调整增益，得到符合期望的信号强度输出结果，使得对不同强度的信号，输出信号的差距缩小。在语音识别前处理阶段，远程拾音的过程中，自动增益控制的目标是从接收到的语音中提取出感兴趣的信号，尽可能地对语音信号进行增强，同时削弱噪声对识别结果的影响。与一般的对话系统不同，针对语音识别的自动增益控制系统，其输出结果并不以获得满意的听觉效果为目标，而是要针对语音识别的特性，尽可能地保证目标语音无失真地放大。然而，在语音识别领域，现有的增益控制方法无法达到上述效果，主要原因在于没有对语音信号进行差别化处理。
技术实现思路
本专利技术的目的在于提供一种应用于语音识别的信号增益方法和装置，以在对语音信号放大时防止过载失真，提高语音识别的准确率。本专利技术第一方面提供一种应用于语音识别的信号增益方法，所述方法包括：删除经过预处理后的语音信号中的无话段，得到第一语音信号；求取所述第一语音信号中每帧信号存在语音的概率PRatio；修正所述第一语音信号的增益，使所述概率PRatio小于第一判决门限的信号的增益减小并且所述概率PRatio大于所述第一判决门限的信号的增益增大，得到增益修正后的第二语音信号；限制所述第二语音信号的增益，使其小于系统设定的增益极值。本专利技术第二方面提供一种应用于语音识别的信号增益装置，所述装置包括：话段处理模块，用于删除经过预处理后的语音信号中的无话段，得到第一语音信号；语音存在概率求取模块，用于求取所述...

【技术保护点】
一种应用于语音识别的信号增益方法，其特征在于，所述方法包括：删除经过预处理后的语音信号中的无话段，得到第一语音信号；求取所述第一语音信号中每帧信号存在语音的概率PRatio；修正所述第一语音信号的增益，使所述概率PRatio小于第一判决门限的信号的增益减小并且所述概率PRatio大于所述第一判决门限的信号的增益增大，得到增益修正后的第二语音信号；限制所述第二语音信号的增益，使其小于系统设定的增益极值。

【技术特征摘要】
1.一种应用于语音识别的信号增益方法，其特征在于，所述方法包括：删除经过预处理后的语音信号中的无话段，得到第一语音信号；求取所述第一语音信号中每帧信号存在语音的概率PRatio；修正所述第一语音信号的增益，使所述概率PRatio小于第一判决门限的信号的增益减小并且所述概率PRatio大于所述第一判决门限的信号的增益增大，得到增益修正后的第二语音信号；限制所述第二语音信号的增益，使其小于系统设定的增益极值。2.如权利要求1所述的方法，其特征在于，所述删除经过预处理后的语音信号中的无话段，得到第一语音信号，包括：采用倒谱双门限端点检测算法检测所述预处理后的语音信号中的无话段和有话段；对所述预处理后的语音信号中的无话段进行截除或置零。3.如权利要求2所述的方法，其特征在于，所述采用倒谱双门限端点检测算法检测所述预处理后的语音信号中的无话段和有话段，包括：计算所述预处理后的语音信号中每帧信号的倒谱系数与噪声倒谱系数估计值的倒谱距离所述mci(n)为第i帧信号的离散余弦变换DCT倒谱系数，所述mcns(n)为噪声的DCT倒谱系数初始估计值，所述p为Mel频率倒谱系数的阶；采用第二判决门限，将所述倒谱距离大于所述第二判决门限所对应的信号帧确定为基本语音段的粗略起始端点和结束端点；采用第三判决门限，将所述基本语音段中倒谱距离大于所述第三判决门限的信号帧确定为语音段的起始端点和结束端点，所述第三判决门限小于所述第
\t二判决门限。4.如权利要求1所述的方法，其特征在于，所述求取所述第一语音信号中每帧信号存在语音的概率PRatio，包括：通过对所述第一语音信号中每帧信号的均值进行标准化处理，计算得到每帧信号的均值mS、所述第一语音信号的总均值mL和每帧信号的标准差stL；按照公式PRatio＝(mS-mL)/stL计算得到所述第一语音信号中每帧信号存在语音的概率PRatio。5.如权利要求1至4任意一项所述的方法，其特征在于，所述限制所述第二语音信号的增益，包括：将所述第二语音信号的幅度标准值与所述修正后的增益相乘；若相乘后的语音信号发生过载失真，则微调所述相乘后的语音信号的增益直至小于系统设定的所述增益极值。6.一种应用于语音识别的信号增益装置，其特征...

【专利技术属性】
技术研发人员：李敬源，
申请(专利权)人：TCL集团股份有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人