用于语音识别的深度神经网络的构建方法及系统技术方案

技术编号：11663860 阅读：95 留言：0更新日期：2015-07-01 02:01

本发明专利技术公开了一种深度神经网络的构建方法及系统，该方法包括：确定深度神经网络输入层的节点个数和输出层的节点个数；获取训练数据；确定深度神经网络隐含层的层数和第一层隐含层的节点个数：根据所述训练数据的数据量、隐含层的层数和第一层隐含层的节点个数，确定后续隐含层的节点个数，并使不同隐含层的节点个数呈递减变化；利用所述训练数据确定所述深度神经网络的模型参数得到深度神经网络。与现有技术的深度神经网络相比，应用本发明专利技术构建的深度神经网络极大地减少了神经网络的参数个数，减小了所需的存储空间并且加快了模型的训练速度。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及信号处理领域，尤其涉及一种深度神经网络的构建方法及系统。
技术介绍
语音识别即让机器听懂人说的话，将语音信号转化为计算机可识别的输入。近20 年来语音识别技术取得了显著成效，开始从实验室走向市场。目前基于语音识别技术的语音输入，语音检索，语音翻译等得到了广泛的运用。随着科技的进步，信息的爆炸性增长，可以获得的语音数据也越来越多，如何利用海量的数据训练一个语音识别系统，使语音识别率达到更高是实际应用中的一项难题。传统自动连续语音识别系统主要采用基于隐马尔科夫模型（Hidden Markov Model, HMM)和高斯混合模型（Gaussian Mixture Model, GMM)的 GMM-HMM 语音识别系统。 GMM-HMM语音识别系统使用HMM对语音信号的时序结构进行建模，每个HMM状态的输出概率采用混合高斯模型模拟。近年来基于深度神经网络（Deep Neural Networks, DNN)和隐马尔科夫模型的DNN-HMM语音识别系统受到研究人员越来越多的关注，DNN-HMM系统采用DNN 替代GMM模拟每个HMM状态的输出概率。相比于GMM模型，DNN模型的描述能力更强，能够更好地模拟非常复杂的数据分布，并且能够很好地学习到数据上下文的信息，因此相对于 GMM-HMM系统，DNN-HMM系统能够取得显著的性能提升。然而尽管DNN-HMM系统在性能上具有明显优势，但在实际应用中依然较难推广，主要原因在于DNN-HMM的模型复杂度较高，模型训练和解码时所需时间均远远超出了 GMM-HMM系统。比如通常情...
<a href="http://www.xjishu.com/zhuanli/55/CN104751227.html" title="用于语音识别的深度神经网络的构建方法及系统原文来自X技术">用于语音识别的深度神经网络的构建方法及系统</a>

【技术保护点】
一种深度神经网络的构建方法，其特征在于，包括：确定深度神经网络输入层的节点个数和输出层的节点个数；获取训练数据；确定深度神经网络隐含层的层数和第一层隐含层的节点个数：根据所述训练数据的数据量、隐含层的层数和第一层隐含层的节点个数，确定后续隐含层的节点个数，并使不同隐含层的节点个数呈递减变化；利用所述训练数据确定所述深度神经网络的模型参数得到深度神经网络。

【技术特征摘要】

【专利技术属性】
技术研发人员：潘嘉，何婷婷，刘聪，王智国，胡国平，张仕良，胡郁，
申请(专利权)人：安徽科大讯飞信息科技股份有限公司，
类型：发明
国别省市：安徽;34

全部详细技术资料下载我是这个专利的主人