基于实时场景下语音信噪比预分级的卷积神经网络计算电路制造技术

技术编号：22886082 阅读：54 留言：0更新日期：2019-12-21 08:03

本发明专利技术公开了基于实时场景下语音信噪比预分级的卷积神经网络计算电路，属于计算、推算、计数的技术领域。在传统的“语音特征提取+卷积计算识别输出”的语音识别网络电路工作模式基础上，增设动态实时语音信噪比检测模块。动态实时语音信噪比检测模块通过智能感知计算实时输出当前语音场景下的电路工作模式控制信号，并动态调节后续位宽可控的卷积网络计算模块的数据运算位宽大小以及自适应语音特征提取计算模块的快速傅里叶变换的蝶形运算级数，从根本上解决了传统卷积网络计算电路结构存在的场景适应力差、冗余计算多、资源占用过多的问题。

Convolutional neural network computing circuit based on speech SNR pre classification in real-time scene

全部详细技术资料下载

【技术实现步骤摘要】
基于实时场景下语音信噪比预分级的卷积神经网络计算电路
本专利技术公开了基于实时场景下语音信噪比预分级的卷积神经网络计算电路，涉及人工智能神经网络电路结构的设计，属于计算、推算、计数的

技术介绍
不同语音词包含的信息量存在差异且其噪声背景不同，对计算精度的要求也不同。以英文单词为例，其发音音节有长有短，音节的复杂性对于网络的容错率会有一定的影响，在语音识别中，不同噪声环境对网络的精度要求也会有差异。语音信息的丰富度决定了适用网络模型的复杂度，针对特定任务选择合适的识别模型至关重要。对于比较简单、信息量少、噪声干扰不强的语音信息使用较低精度就可以完成识别任务，对于复杂、信息量多、噪声背景复杂的语音信息使用较高精度才会取得较好的识别效果。实际应用中，输入的语音信息是多种多样的，既包含简单的语音信号又包含复杂的语音信号，如果根据语音复杂度频繁地更换识别模型会花费大量的计算调度时间。实际任务中有时仅仅需要粗粒度的分类，有时又需要细粒度的分类。粗粒度的分类只需要使用较低精度，细粒度分类需要使用较高精度。实际应用中，对于低噪声简单背景下的孤立词识别或者当前任务识别精度要求较低时，运行高精度网络会造成冗余计算，浪费计算资源；固定使用较低精度计算难以实现要求较高的复杂语音的处理。因此，根据输入语音数据的噪声背景复杂度和识别任务的精度要求动态选择卷积神经网络计算电路的工作状态是解决复杂环境下语音识别问题的一种可行方案。
技术实现思路
本专利技术的专利技术目的是针对上述
技术介绍
的不足，实现了基于实时场...

【技术保护点】
1.基于实时场景下语音信噪比预分级的卷积神经网络计算电路，其特征在于，包括：/n实时语音信噪比检测模块，根据输入语音数据计算的环境复杂度预分类，根据预分类结果输出位宽控制信号及FFT控制信号，/n语音特征提取计算模块，在实时语音信噪比检测模块输出的FFT控制信号的作用下开启对应FFT操作点数的蝶形运算单元，输出从语音数据中提取的语音特征，及，/nPE阵列，在实时语音信噪比检测模块输出的位宽控制信号的作用下选择对应位宽的阵列对从语音数据中提取的语音特征进行卷积运算。/n

【技术特征摘要】
1.基于实时场景下语音信噪比预分级的卷积神经网络计算电路，其特征在于，包括：
实时语音信噪比检测模块，根据输入语音数据计算的环境复杂度预分类，根据预分类结果输出位宽控制信号及FFT控制信号，
语音特征提取计算模块，在实时语音信噪比检测模块输出的FFT控制信号的作用下开启对应FFT操作点数的蝶形运算单元，输出从语音数据中提取的语音特征，及，
PE阵列，在实时语音信噪比检测模块输出的位宽控制信号的作用下选择对应位宽的阵列对从语音数据中提取的语音特征进行卷积运算。

2.根据权利要求1所述基于实时场景下语音信噪比预分级的卷积神经网络计算电路，其特征在于，实时语音信噪比检测模块根据预分类结果依据先增大PE阵列计算位宽后增加FFT操作点数的原则输出位宽控制信号及FFT控制信号。

3.根据权利要求2所述基于实时场景下语音信噪比预分级的卷积神经网络计算电路，其特征在于，实时语音信噪比检测模块根据预分类结果依据先增大PE阵列计算位宽后增加FFT操作点数的原则输出位宽控制信号及FFT控制信号，具体为：在语音数据输入环境的复杂度小于最小阈值时输出低位宽的控制信号及少FFT操作点数的FFT控制信号，在语音数据输入环境的复杂度介于最小阈值和中间阈值之间时输出低位宽的控制信号及多FFT操作点数的FFT控制信号，在语音数据输入环境的复杂度介于中间阈值和最大阈值之间时输出高位宽的控制信号及少FFT操作点数的FFT控制信号，在语音数据输入环境的复杂度超过最大阈值时输出高位宽的控制信号及多FFT操作点数的FFT控制信号。

4.根据权利要求1所述基于实时场景下语音信噪比预分级的卷积神经网络计算电路，其特征在于，实时语音信噪比检测模块，包括：
短时能量计算单元，其输入端接每一帧采集的语音数据，计算每一帧语音数据的短时平均能量后输出，
过零率检测单元，其输入端接每一帧采集的语音数据，计算每一帧超过能量阈值的语音数据数量后输出，
加权求和单元，其输入端接短时能量计算单元的输出端和过零率检测单元的输出端，对每一帧语音数据的短时平均能量及超过能量阈值的语音数据数量加权求和，输出环境复杂度典型值，及，
比较译码器，其输入...

【专利技术属性】
技术研发人员：刘波，朱文涛，孙煜昊，黄乐朋，李焱，沈泽昱，范虎，杨军，
申请(专利权)人：东南大学，
类型：发明
国别省市：江苏;32

全部详细技术资料下载我是这个专利的主人