一种中英文混合语音识别方法技术

技术编号：26602145 阅读：35 留言：0更新日期：2020-12-04 21:25

本发明专利技术的一种中英文混合语音识别方法，采集中英文混合语音后，将语音按照一定的帧长划分为若干段语音信号，且分段重叠率为40％，对分段后的语音信号进行高通滤波，滤波后进行加窗处理，得到每段语音信号的加窗函数，并计算判断是否为静音段，对非静音段的语音信号进行中文识别判断，当识别成功则输出该段中文且设定语种标识为1，当识别失败设定语种标识为0并进行英文识别，识别成功则输出该段英文且更新语种标识为0，识别失败则设定语种标识为1重新进行中文识别。通过将语音分成若干段语音信号并判断是否为静音段，可以有效提高识别效率，同时，分别对每段语音信号进行中文识别，识别失败则进行英文失败，可以有效保证中英文识别的准确度。

全部详细技术资料下载

【技术实现步骤摘要】
一种中英文混合语音识别方法
本专利技术属于语音识别
，具体来说是一种中英文混合语音识别方法。
技术介绍
随着信息全球化的发展，多语以及多语通信成为越来越普遍的现象。单语音识别系统不能够对多语通信进行有效的识别，建立能够识别多种语言、语音信号的语音识别系统是语音识别技术的一个新的任务。中文是目前使用者最多的语言，英语是使用者分布最广的语言，因此建立一个中英文双语识别系统具有很好的应用前景。现有技术中第一种中文和英文双语语音识别系统的实现方案为：把中文语音识别器和英文语音识别器集成在一起，先对输入的语音数据进行语种识别，然后根据语种识别的结果调用相应的语音识别器，从而实现中文和英文双语语音识别的任务。现有技术中第二种中文和英文双语语音识别系统的实现方案为：根据语言学知识或者数据驱动的办法实现中文和英文模型的参数共享，降低模型混淆度，在此基础上训练出中英文共享的声学模型和语言模型。这样只使用一个识别器就可以识别中文、英文和中英文混合的语音信号。但是上述第一种方案需要前期进行大量...

【技术保护点】
1.一种中英文混合语音识别方法，其特征在于：采集中英文混合语音后，将语音按照一定的帧长划分为若干段语音信号，且分段重叠率为40％，对分段后的语音信号进行高通滤波，滤波后进行加窗处理，得到每段语音信号的加窗函数，并计算判断是否为静音段，对非静音段的语音信号进行中文识别判断，当识别成功则输出该段中文且设定语种标识为1，当识别失败设定语种标识为0并进行英文识别，将识别成功则输出该段英文且更新语种标识为0，，识别失败则设定语种标识为1重新进行中文识别。/n

【技术特征摘要】
1.一种中英文混合语音识别方法，其特征在于：采集中英文混合语音后，将语音按照一定的帧长划分为若干段语音信号，且分段重叠率为40％，对分段后的语音信号进行高通滤波，滤波后进行加窗处理，得到每段语音信号的加窗函数，并计算判断是否为静音段，对非静音段的语音信号进行中文识别判断，当识别成功则输出该段中文且设定语种标识为1，当识别失败设定语种标识为0并进行英文识别，将识别成功则输出该段英文且更新语种标识为0，，识别失败则设定语种标识为1重新进行中文识别。

2.根据权利要求1所述的一种中英文混合语音识别方法，其特征在于：将语音按照一定的帧长划分为若干段语音信号具体为按一定的帧长L划分为N语音段，控制帧长，使每段语音尽量只包含一个字，分段重叠率为40％，每一段的语音信号记为xa(n)。

3.根据权利要求1所述的一种中英文混合语音识别方法，其特征在于：所述加窗处理具体为通过以下公式(1)和公式(2)进行计算

ya(n)＝xa(n)*w(n)(2)；
其中，w(n)为窗函数，n为语音帧数。
计算得到加窗函数ya(n)。

4.根据权利要求3所述的一种中英文混合语音识别方法，其特征在于：判断语音信号是否为静音段具体为通过公式(3)和公式(4)计算各语音段的短时能量E(a)与过零率Z(a)的值，并将短时能量E(a)与过零率Z(a)进行加权，权值分别为k1、k2，加权判断函数H(a)的计算公式(5)并设置阈值Hset，若H(a)≥Hse...

【专利技术属性】
技术研发人员：朱羿孜，许召辉，马翼平，陈年生，范光宇，饶蕾，周圣杰，
申请(专利权)人：中航华东光电上海有限公司，
类型：发明
国别省市：上海;31

全部详细技术资料下载我是这个专利的主人