一种抗噪声的低速率语音编码方法及解码方法技术

技术编号：10960547 阅读：145 留言：0更新日期：2015-01-28 12:48

本发明专利技术提供了一种语音数据的编码方法和解码方法。该编码方法包括：获取原始音频，通过端点检测剔除原始音频中的非语音数据，获得语音段数据；对每帧语音数据进行预增强，剔除部分噪声的干扰后计算语音能量；对每帧语音数据通过分析各子带的周期特性和清浊状态计算基音周期，采用多层神经网络模型对谱参数进行增强；通过谱参数、基音周期和能量进行语音帧聚类，将特征相似的相邻帧组成一个语音段；计算每段语音谱参数、基音周期和能量的均值特征以及每段语音的帧数后分别进行量化；对量化后的各种语音参数进行编码，生成语音数据包。本发明专利技术可以在极低编码速率的情况下，保持较高的语音音质。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及智能信息处理领域，尤其涉及一种语音数据的编码方法及解码方法。
技术介绍
语音作为人类交流信息的主要手段之一，语音编码一直在通信系统中占据重要的地位。语音的数据量非常庞大，不便于直接进行传输和存储处理，同时很多领域对语音的压缩传输率要求很高，因此必须对语音进行合理有效的处理，以减少语音信号的传输速率和存储量，即进行语音压缩编码，因此极低速率语音编码已经越来越受到关注，语音信号中有很大的信息冗余，压缩的每一个比特都意味着节省开支，低速率数字语音传输具有重大的实用价值，高质量的低速率语音编码技术在移动通信、卫星通信、多媒体技术以及I？电话通信中得到了普遍应用。目前已有的极低速率语音编码大部分采用参数语音编码的方法实现极低速率下的语音传输。将多帧联合编码和内插等技术引入到经典的参数编码方法后，可以使语音在600如8速率下传输，接收端生成的语音仍具有可懂性。如果进一步降低语音传输速率，语音的音质将明显降低，这种方法将难以适用。通过传统的语音识别系统识别出对应的文本信息后进行传输，可以将传输速率降至200如8以下，但是采用这种方法识别出的文本难以保证较高的准确率，同时说话人的特征难以保留。
技术实现思路
(一 )要解决的技术问题为解决上述的一个或多个问题，本专利技术提供了一种语音数据的编码方法及解码方法，在不同噪声环境下以极低编码速率进行传输时，保持较高的语音音质。 ( 二 )技术方案根据本专利技术的一个方面，提供了一种语音数据的编码方法。该编码方法包括:获取原始音频，通过端点检测剔除原始音频中的非语音数据...

【技术保护点】
一种语音数据的编码方法，其特征在于，包括：端点检测模块首先通过短时能量、短时过零率和各频带能量分布将原始音频分为非语音数据和待甄别数据，然后对待甄别数据通过子带谐波、子带谱包络和子带熵剔除部分非语音数据，对于保留下来的待甄别数据通过语音数据的高斯混合模型和非语音数据的高斯混合模型判断是否为语音数据。

【技术特征摘要】
1.一种语音数据的编码方法，其特征在于，包括:端点检测模块首先通过短时能量、短时过零率和各频带能量分布将原始音频分为非语音数据和待甄别数据，然后对待甄别数据通过子带谐波、子带谱包络和子带熵剔除部分非语音数据，对于保留下来的待甄别数据通过语音数据的高斯混合模型和非语音数据的高斯混合模型判断是否为语音数据。2.根据权利要求1所述的音数据的编码方法，其特征在于，包括: 基音周期计算模块首先将语音信号划分为多个子带，对子带的谱包络和残差信号进行多通道梳状滤波并进行通道选择，根据所选通道计算各子带清浊度，对浊音特性明显的子带进行加权计算基音周期。3.根据权利要求1所述的音数据的编码方法，其特征在于，包括: 通过多层神经网络模型确定噪声环境下线谱对参数和安静环境下线谱对参数之间...

【专利技术属性】
技术研发人员：陈世文，
申请(专利权)人：东莞市北斗时空通信科技有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人