一种基于神经网络的声音识别方法技术

技术编号：20244441 阅读：38 留言：0更新日期：2019-01-29 23:54

本发明专利技术公开了一种基于神经网络的声音识别方法，该方法包括以下步骤：首先使用通常声音采样方式对声音进行功率谱变换，插入、采样等滤波算法后得到标准格式的声音样本；根据声音识别指令，确定待识别的目标声音特征；针对预先获得的查找表集合中每个查找表，将目标声音采样的每个采样点与该查找表的每个表项进行匹配，查找表集合包含多个具有不同内容的参考声音对应的查找表，每个查找表基于神经网络结构建立，每个查找表中的表项为神经网络结构的神经元；根据匹配结果，确定目标声音。应用本发明专利技术实施例所提供的技术方案，基于神经网络结构进行声音识别，模拟了人脑的学习能力，使得声音识别更加准确。

全部详细技术资料下载

【技术实现步骤摘要】
一种基于神经网络的声音识别方法
本专利技术涉及声音识别技术，特别是涉及一种基于神经网络的声音识别方法。
技术介绍
随着计算机应用技术的快速发展，语音或者其他类型声音识别技术的应用越来越广泛，对声音识别的需求也越来越多。比如在语音控中，或者在特定场景声音事件触发中，都需要进行声音识别。随着对人脑结构和神经网络的研究，现已经了解并逐渐探索出人脑对信息的处理及工作方式。但基于神经网络结构如何进行声音的准确识别，是目前本领域技术人员亟需解决的技术问题。
技术实现思路
本专利技术的目的是提供一种基于神经网络的声音识别方法，以基于神经网络结构对声音进行准确识别。为解决上述技术问题，本专利技术提供如下技术方案：一种基于神经网络的声音识别方法，包括：对样本声音、待识别声音进行预处理，得到样本声音频率谱、待识别声音频谱；若声音指令为学习指令，则将样本声音频率谱的数据加权写入逐层深度的声音神经网络节点的表项中，构建声音神经网络查找表；若声音指令为识别指令，则将待识别声音频谱与声音神经网络查找表中节点的表项进行比对，确定声音识别结果并输出声音。所述预处理包括：对样本声音、待识别声音进行插值...

【技术保护点】
1.一种基于神经网络的声音识别方法，其特征在于，包括：对样本声音、待识别声音进行预处理，得到样本声音频率谱、待识别声音频谱；若声音指令为学习指令，则将样本声音频率谱的数据加权写入逐层深度的声音神经网络节点的表项中，构建声音神经网络查找表；若声音指令为识别指令，则将待识别声音频谱与声音神经网络查找表中节点的表项进行比对，确定声音识别结果并输出声音。

【技术特征摘要】
1.一种基于神经网络的声音识别方法，其特征在于，包括：对样本声音、待识别声音进行预处理，得到样本声音频率谱、待识别声音频谱；若声音指令为学习指令，则将样本声音频率谱的数据加权写入逐层深度的声音神经网络节点的表项中，构建声音神经网络查找表；若声音指令为识别指令，则将待识别声音频谱与声音神经网络查找表中节点的表项进行比对，确定声音识别结果并输出声音。2.根据权利要求1所述的一种基于神经网络的声音识别方法，其特征在于所述预处理包括：对样本声音、待识别声音进行插值、抽取采样得到定长的声音片段；再经过短时傅里叶变换，得到样本声音频率谱、待识别声音频谱。3.根据权利要求2所述的一种基于神经网络的声音识别方法，其特征在于所述短时傅里叶变换为：其中，短时傅里叶变换是窗口选语音信号的标准傅里叶变换，n是窗口长度，ω是角频率，x(m)是时间点为m的声音信号序列，ω(n-m)表示窗函数，当n取值不同时，窗口w(n-m)沿着x(m)序列滑动，对声音信号进行截取，经过傅里叶变换将声音信号从时域变成频域，得到声音信号频率谱；经过变换后得到的声音频率谱的每个采样点与神经网络节点一一对应。4.按照权利要求1所述一种基于神经网络的声音识别方法，其特征在于所述将样本声音频率谱的数据加权写入逐层深度的声音神经网络节点的表项中，构建声音神经网络查找表，包括：如果该样本声音频率谱为首次学习，则将其数据在L0层对应的神经网络节点的表项中创建表项记录；如果该样本声音频率谱为非首次学习，则对当前Li层的神经网络节点的表项进行迭代，并在Li+1层对应的神经网络节点的表项中创建表项记录。5.按照权利要求4所述一种基于神经网络的声音识别方法，其特征在于所述表项记录包括：索引值index、指令opcode、频率谱数据值pvalue、学习次数study_num、时间...

【专利技术属性】
技术研发人员：丁岩，牛英山，王爽，费顺超，
申请(专利权)人：中国电子科技集团公司第四十七研究所，
类型：发明
国别省市：辽宁,21

全部详细技术资料下载我是这个专利的主人