当前位置: 首页 > 专利查询>燕山大学专利>正文

一种语义识别型语音识别系统技术方案

技术编号:13216705 阅读:84 留言:0更新日期:2016-05-12 22:49
本实用新型专利技术涉及一种语音系统,更具体地说涉及一种语义识别型语音识别系统,基于语义识别语音,具备高速的数据处理能力和语音分辨能力,具备通信能力且系统的扩展性强。麦克风模块用于采集声音信号并输出声音信号的电压波形,预处理模块用于提取语音特征参数。音频编解码器对语音信号进行数字化处理后输出数字信号。现场可编程门阵列将语音信号和按键状态透传至处理器,处理器控制现场可编程门阵列的复位和工作频率,处理器用于数据的运算处理。处理器控制音频编解码器的工作频率和工作状态。音频编解码器将现场可编程门阵列输出的数字信号转化为模拟信号并将信号传输至功放模块。标准接口模块用作处理器与PC端的数据传输接口。

【技术实现步骤摘要】

本技术涉及一种语音系统,更具体地说涉及一种语义识别型语音识别系统
技术介绍
语音识别技术就是让计算机通过相应的处理方法将语音变成文本信息或者文本命令,而这些文本信息和文本命令能够被机器识别。实质上,语音识别包含两方面的含义:一方面为声纹识别,即让机器通过输入的语音信息判断出说话人到底是谁,即判断说话人信息而并不关心所讲的具体内容,这种方式可以用于安防中。另一方面为语义识别,即计算机通过输入的语音信息判断出说话的内容,而不关心说话人信息,这种方式可以用于智能家庭,智能城市等领域中。语音识别的初衷就是希望计算机能够“听懂”人类语言,从而使计算机设备根据不同的语音完成相应的工作。当语音通过某种声音处理方式将其特征存储后,声音识别程序将未知样本与训练样本进行匹配。声音匹配工作完成后,找出一个最接近的语音样本,由此来判断待测声音的内容,进而执行此内容对应的相关指令。基于语义识别的语音系统在控制等领域的应用越来越广泛,但是很多语音系统有着处理速度慢,语义提取不精确或系统通信能力弱等各式缺点。
技术实现思路
本技术主要解决的技术问题是:提供一种语义识别型语音识别系统,基于语义识别语音,具备高速的数据处理能力和语音分辨能力,具备通信能力且系统的扩展性强。为解决上述技术问题,本技术涉及一种语音系统,更具体地说涉及一种语义识别型语音识别系统,包括麦克风模块、预处理模块、音频编解码器、按键、现场可编程门阵列、处理器、功放模块、双倍率同步动态随机存取存储器、闪存、液晶显示屏、标准接口模块和PC端,体积小,基于语义识别语音,具备高速的数据处理能力和语音分辨能力,具备通信能力且系统的扩展性强。麦克风模块与预处理模块相连,麦克风模块用于采集声音信号并输出声音信号的电压波形,预处理模块用于提取语音特征参数。预处理模块的输出端连接在音频编解码器的音频输入端上,音频编解码器对语音信号进行数字化处理后输出数字信号。音频编解码器的输出端与现场可编程门阵列相连,按键与现场可编程门阵列相连,现场可编程门阵列与处理器相连,现场可编程门阵列将语音信号和按键状态透传至处理器,处理器控制现场可编程门阵列的复位和工作频率,处理器用于数据的运算处理。处理器输出端连接音频编解码器的输入端,处理器控制音频编解码器的工作频率和工作状态。音频编解码器的输出端与功放模块相连,音频编解码器将现场可编程门阵列输出的数字信号转化为模拟信号并将信号传输至功放模块,功放模块将模拟信号进行放大以提高信号的驱动能力。双倍率同步动态随机存取存储器与处理器相连,双倍率同步动态随机存取存储器用于数据缓存。闪存与处理器相连,闪存用于程序的存储。液晶显示屏与处理器相连,液晶显示屏显示语音内容。标准接口模块一端与处理器相连,另一端与PC端相连,标准接口模块用作处理器与PC端的数据传输接口。作为本方案的进一步优化,本技术一种语义识别型语音识别系统所述的音频编解码器选用德州仪器有限公司生产的音频编解码器,其型号为TLV320AIC23。作为本方案的进一步优化,本技术一种语义识别型语音识别系统所述的现场可编程门阵列与处理器通过I2C总线相通信,处理器与现场可编程门阵列的多通道缓冲串行接口直接相连,处理器与现场可编程门阵列之间通过外部存储器接口进行数据互传。作为本方案的进一步优化,本技术一种语义识别型语音识别系统所述的标准接口模块包括以太网接口、USB接口和仿真调试接口。处理器通过以太网接口获取远程网络通信能力,处理器通过USB接口与PC端进行数据交互,PC端利用仿真调试接口对处理器进行测试及更新。作为本方案的进一步优化,本技术一种语义识别型语音识别系统所述的双倍率同步动态随机存取存储器内存储有语音模型。本技术一种语义识别型语音识别系统的有益效果为:a.数据处理速度快;b.语音识别清晰;c.通信能力强,可扩展性强。【附图说明】图1为本技术一种语义识别型语音识别系统的系统框图。【具体实施方式】在图1中,本技术涉及一种语音系统,更具体地说涉及一种语义识别型语音识别系统,包括麦克风模块、预处理模块、音频编解码器、按键、现场可编程门阵列、处理器、功放模块、双倍率同步动态随机存取存储器、闪存、液晶显示屏、标准接口模块和PC端,体积小,基于语义识别语音,具备高速的数据处理能力和语音分辨能力,具备通信能力且系统的扩展性强。麦克风模块与预处理模块相连,麦克风模块用于采集声音信号并输出声音信号的电压波形,预处理模块用于提取语音特征参数。麦克风模块将声音信号转化为电压信号后进行放大后输出。声音信号在预处理模块经过滤波加重后输出加重后的语音信号,以降低口唇对语音信号的影响。语音信号经过预处理模块分帧处理后转变为矩形波,矩形波经过傅里叶变换而提取出功率波谱,经傅里叶变换后的声音信号经过预处理模块里的三角滤波器组进行滤波处理后输出类似于人耳所能识别的频率信号,信号再经过反离散余弦变换后提高信号集中度,进而输出稳定的高质量语音信号。音频编解码器选用德州仪器有限公司生产的音频编解码器,其型号为TLV320AIC23。预处理模块的输出端连接在音频编解当前第1页1 2 本文档来自技高网...

【技术保护点】
一种语义识别型语音识别系统,包括麦克风模块、预处理模块、音频编解码器、按键、现场可编程门阵列、处理器、功放模块、双倍率同步动态随机存取存储器、闪存、液晶显示屏、标准接口模块和PC端,其特征在于:麦克风模块与预处理模块相连,麦克风模块用于采集声音信号并输出声音信号的电压波形,预处理模块用于提取语音特征参数;预处理模块的输出端连接在音频编解码器的音频输入端上,音频编解码器对语音信号进行数字化处理后输出数字信号;音频编解码器的输出端与现场可编程门阵列相连,按键与现场可编程门阵列相连,现场可编程门阵列与处理器相连,现场可编程门阵列将语音信号和按键状态透传至处理器,处理器控制现场可编程门阵列的复位和工作频率,处理器用于数据的运算处理;处理器输出端连接音频编解码器的输入端,处理器控制音频编解码器的工作频率和工作状态;音频编解码器的输出端与功放模块相连,音频编解码器将现场可编程门阵列输出的数字信号转化为模拟信号并将信号传输至功放模块,功放模块将模拟信号进行放大以提高信号的驱动能力;双倍率同步动态随机存取存储器与处理器相连,双倍率同步动态随机存取存储器用于数据缓存;闪存与处理器相连,闪存用于程序的存储;液晶显示屏与处理器相连,液晶显示屏显示语音内容;标准接口模块一端与处理器相连,另一端与PC端相连,标准接口模块用作处理器与PC端的数据传输接口。...

【技术特征摘要】

【专利技术属性】
技术研发人员:刘宝华赵渊么跃轩武海强冯文斌
申请(专利权)人:燕山大学
类型:新型
国别省市:河北;13

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1