数据驱动的基于奇异值分解的神经网络声学模型裁剪方法技术

技术编号：14361122 阅读：62 留言：0更新日期：2017-01-09 04:20

本发明专利技术涉及一种数据驱动的基于奇异值分解的神经网络声学模型裁剪方法，包括：根据神经网络各层权值矩阵的奇异值分布选用不同的裁剪力度，根据对应层的裁剪力度实现对各层神经网络的裁剪。本发明专利技术的裁剪方法会根据DNN各层权值矩阵奇异值分布不同，裁减不同数量的奇异值，保证了所有层都能够得到充分裁剪的同时，避免了某些层会被过度裁剪。

全部详细技术资料下载

【技术实现步骤摘要】

本专利技术涉及语音识别领域，特别涉及一种数据驱动的基于奇异值分解的神经网络声学模型裁剪方法。
技术介绍
近年来，深层神经网络(DeepNeuralNetwork，DNN)由于其良好的建模能力，被广泛地应用于语音识别领域的声学模型当中。DNN良好的建模能力主要得益于其相对于普通神经网络具有更深的模型层次，但是与此同时，DNN的参数量巨大，同时计算复杂度高，在语音识别的解码过程当中，利用DNN进行声学状态的估计需要消耗大量的计算和储存资源。这一问题在一些资源受限的场景中尤为突出，比如新兴的智能家电领域，智能家电的芯片上预留给智能交互系统的储存和计算资源是十分有限的，同时对于系统反馈的实时性有很高的要求，此时应用高参数量、高计算复杂度的DNN十分困难。为了解决DNN参数量大以及计算复杂度高的问题，利用奇异值分解(SingularValueDecomposition，SVD)对DNN进行重构的方法被广泛用来降低DNN的参数量。在此简要说明一下该方法的原理。DNN的前向运算当中，最重要的部分为：yi=Σj=1nωi,jαj(i=1,2,...,m)]]>或者将上式改写成矩阵乘法的形式：y＝Wα,其中其中W为DNN的权值矩阵，也是DNN模型当中居于主导地位的参数，利用SVD对DNN权值矩阵进行重构，即将W通过SVD分解为两个低秩矩阵的乘积：W≈WU·WV,其中上式中使用“约等于”是因为在这个分解的过程中已经根据奇异值大小进行了裁剪，即只保留最大的k个奇异值，通过这种方式，参数量和计算量都从m*n变成了(m+n)*k，由于k<...
数据驱动的基于奇异值分解的神经网络声学模型裁剪方法

【技术保护点】
一种数据驱动的基于奇异值分解的神经网络声学模型裁剪方法，包括：根据神经网络各层权值矩阵的奇异值分布选用不同的裁剪力度，根据对应层的裁剪力度实现对各层神经网络的裁剪。

【技术特征摘要】
1.一种数据驱动的基于奇异值分解的神经网络声学模型裁剪方法，包括：根据神经网络各层权值矩阵的奇异值分布选用不同的裁剪力度，根据对应层的裁剪力度实现对各层神经网络的裁剪。2.根据权利要求1所述的数据驱动的基于奇异值分解的神经网络声学模型裁剪方法，其特征在于，该方法对待裁剪的神经网络中的各层依次做如下操作：步骤1)、利用奇异值分解对神经网络第i层的权值矩阵W进行分解：W＝U·Σ·V,其中假设m>n；其中，其中σ1≥σ2≥…≥σm，为W...

【专利技术属性】
技术研发人员：张鹏远，邢安昊，潘接林，颜永红，
申请(专利权)人：中国科学院声学研究所，北京中科信利技术有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人