建立语音声学模型的方法和装置制造方法及图纸

技术编号：16459175 阅读：33 留言：0更新日期：2017-10-25 23:44

本发明专利技术公开了一种建立语音声学模型的方法和装置。所述方法包括：获取语音数据的音频信号；对音频信号进行特征提取，得到音频信号的频谱图；对所述频谱图进行图像识别，得到识别结果；根据识别结果与该语音数据的实际声音数据，建立语音声学模型。

Method and device for establishing speech acoustic model

The invention discloses a method and a device for establishing a speech acoustic model. The method comprises: acquiring the audio signal of the voice data; the audio signal feature extraction, get the spectrum of an audio signal; image recognition of the spectrum, the recognition result is obtained; the actual voice data according to the identification results and the voice data, establish voice acoustic model.

全部详细技术资料下载

【技术实现步骤摘要】
建立语音声学模型的方法和装置
本专利技术涉及信息处理领域，尤指一种建立语音声学模型的方法和装置。
技术介绍
机器学习目前已经成为信息行业内最热门的数据分析方法之一，它可以使分析模型的建立自动化，通过算法迭代从已有数据中不断优化算法并形成最优化模型，机器学习使得计算机有了“大脑”，让它们可以不通过显式编程而洞察那些隐藏在深处的数据。尽管各式各样的机器学习算法已存在已久，但是从过去的信息闭塞发展到现在的数据爆炸时代，各领域的数据量和数据规模都呈指数上涨模式，这种数据规模的爆炸式增长带来了巨大的机遇和变革潜力，可以利用这些数据的完整性等优势在各行各业帮助我们更好的作出决策，在为科学研究中转变为数据驱动的研究提供了很好的范例，所以对于机器学习与大数据的结合就变得尤为重要，我们追求计算越来越快，越来越准，模型越来越精确。在大数据下的机器学习大大提升了样本数量，这就使得很多问题的分类都有了丰富的样本量作为支撑，这是大数据的优势所在。然而庞大的数据量也会对机器学习带来一定的困扰，数据之间的关系，有效数据的筛选等问题会大大影响机器学习模型训练的准确度和训练时间。所以从体量巨大、结构繁多的数据中挖掘出潜藏在数据中的规律和我们所需要信息，从而使数据发挥最大化的价值，是大数据技术的一个核心目标。预测称，未来的几年内，在互联网上搜索信息将越来越依靠语音输入，而不是键盘输入，这代表着建立语音声学模型的这一传统机器学习的崛起，正是因为深度学习的引入和大数据的帮助使得建立语音声学模型的准确度和智能型不断提高，如何提高建立一个准确度高的语音声学模型是亟待解决的问题。
技术实现思路
为了解决上...
建立语音声学模型的方法和装置

【技术保护点】
一种建立语音声学模型的方法，其特征在于，包括：获取语音数据的音频信号；对音频信号进行特征提取，得到音频信号的频谱图；对所述频谱图进行图像识别，得到识别结果；根据识别结果与该语音数据的实际声音数据，建立语音声学模型。

【技术特征摘要】
1.一种建立语音声学模型的方法，其特征在于，包括：获取语音数据的音频信号；对音频信号进行特征提取，得到音频信号的频谱图；对所述频谱图进行图像识别，得到识别结果；根据识别结果与该语音数据的实际声音数据，建立语音声学模型。2.根据权利要求1所述的方法，其特征在于，所述对所述频谱图进行图像识别，得到识别结果，包括：利用深层卷积网络中的多个卷积层依次对频谱图进行处理，得到识别结果。3.根据权利要求2所述的方法，其特征在于，所述对所述频谱图进行图像识别，得到识别结果，还包括：在卷积层处理后，利用深层卷积网络中的池化层对卷积层处理后的结果进行处理，得到识别结果。4.根据权利要求2或3所述的方法，其特征在于，对所述频谱图进行图像识别，得到识别结果之前，所述方法还包括：获取所述音频信号的权重矩阵，其中所述权重矩阵是根据所述音频信号的音频数据在语音中的出现时间和语音中的重要性来确定的；利用所述权重矩阵对频谱的数据进行处理。5.根据权利要求4所述的方法，其特征在于，所述方法还包括：对声学模型中的声音数据进行有效数据的标记。6.一种建立语...

【专利技术属性】
技术研发人员：吕广杰，刘芮，
申请(专利权)人：郑州云海信息技术有限公司，
类型：发明
国别省市：河南,41

全部详细技术资料下载我是这个专利的主人