The utility model discloses an audio interactive system. The system includes the audio acquisition module, the analog digital conversion module, the WiFi module and the audio output module. It also includes the information storage module and the FPGA main board, which is used for storing the file information required for the work of the FPGA motherboard. The FPGA main board is connected with the module and the WiFi module respectively. The original audio data transmitted by the analog to digital conversion module forms the target audio data, and is also used to identify the target audio data off-line when the network condition of the WiFi module is determined, and to form an audio recognition text, and to obtain the audio response of the audio recognition text based on the acquired related file information. An answer text; the audio output module is connected to the FPGA main board for playing the response speech signal that the FPGA main board is synthesized based on the audio response text. The scheme of the utility model can effectively carry out human-machine audio interaction when the network condition is abnormal, thereby improving user experience.
【技术实现步骤摘要】
音频交互系统
本技术实施例涉及语音识别领域,尤其涉及音频交互系统。
技术介绍
音频交互系统中的一个重要部分是进行语音识别,语音识别的硬件处理电路从早期的多带通滤波器及线性匹配电路,到由微控制器组成的语音识别专用芯片,再到由数字信号处理器组成的语音识别系统,发展到了目前的由前端声学处理电路+运行神经网络的云端服务器方案架构。目前主流的语音识别方案通过麦克风阵列和回声消除参考信号作为输入,进行降噪等处理后,通过WiFi连接到云端进行语音和语义识别。上述主流的语音识别方案在网络状况异常时无法正常工作,从而影响音频交互系统的正常工作,进而降低用户体验。
技术实现思路
本技术提供音频交互系统,解决了网络状况异常时不能有效进行人机音频交互的问题。第一方面,本技术实施例提供了音频交互系统,包括:音频采集模块、模数转换模块、WiFi模块和音频输出模块,还包括:现场可编程门阵列(FieldProgrammableGateArray,FPGA)主板、信息存储模块;所述信息存储模块,与所述FPGA主板相连,用于存储所述FPGA主板工作所需的文件信息;所述FPGA主板,分别与所述模数转换模块及所 ...
【技术保护点】
一种音频交互系统,包括:音频采集模块、模数转换模块、WiFi模块和音频输出模块,其特征在于,还包括:现场可编程门阵列FPGA主板、信息存储模块;所述信息存储模块,与所述FPGA主板相连,用于存储所述FPGA主板工作所需的文件信息;所述FPGA主板包括:与所述模数转换模块相连的可编程音频处理电路、分别与所述信息存储模块和所述WiFi模块相连的第一处理器、与所述第一处理器相连的第二处理器;所述FPGA主板,分别与所述模数转换模块及所述WiFi模块相连,用于对所述模数转换模块传输的原始音频数据进行音频处理形成目标音频数据;还用于基于获得的相关文件信息在确定所述WiFi模块的网络状 ...
【技术特征摘要】
1.一种音频交互系统,包括:音频采集模块、模数转换模块、WiFi模块和音频输出模块,其特征在于,还包括:现场可编程门阵列FPGA主板、信息存储模块;所述信息存储模块,与所述FPGA主板相连,用于存储所述FPGA主板工作所需的文件信息;所述FPGA主板包括:与所述模数转换模块相连的可编程音频处理电路、分别与所述信息存储模块和所述WiFi模块相连的第一处理器、与所述第一处理器相连的第二处理器;所述FPGA主板,分别与所述模数转换模块及所述WiFi模块相连,用于对所述模数转换模块传输的原始音频数据进行音频处理形成目标音频数据;还用于基于获得的相关文件信息在确定所述WiFi模块的网络状况异常时离线识别所述目标音频数据,形成音频识别文本,并获得所述音频识别文本的音频应答文本;所述音频输出模块,与所述FPGA主板相连,用于播放所述FPGA主板基于所述音频应答文本合成的应答语音信号。2.根据权利要求1所述的系统,其特征在于,还包括:上位机;所述上位机,与所述FPGA主板相连,用于接收所述FPGA主板在网络状况异常时形成的音频识别文本,生成音频应答文本和语音合成命令,并发送至所述FPGA主板,以使所述FPGA主板合成应答语音信号。3.根据权利要求2所述的系统,其特征在于,所述FPGA主板,包括:单刀双掷开关;所述可编程音频处理电路,用于接收所述模数转换模块的原始音频数据,并进行降噪、滤波和回声消除处理形成目标音频数据;所述单刀双掷开关包括:输入端、带控制端口的开关片、第一输出端和第二输出端;所述输入端与所述可编程音频处理电路的输出端相连,所述控制端口及所述第一输出端均与所述第一处理器相连,所述第二输出端与所述第二处理器相连,用于通过所述第一处理器对所述开关片的控制,控制所述目标音频数据的输出流向;所述第一处理器,用于根据获取的相关文件信息判断所述WiFi模块的网络状况异常时,生成离线识别命令,并控制所述开关片与所述第二输出端连通;所述第二处理器,用于在接收到所述离线识别命令后对所述目标音频数据进行离线识别,生成音频识别文本,并发送至所述第一处理器;所述第一处理器...
【专利技术属性】
技术研发人员:吴祖忠,方小伟,章学红,蔡雪阳,章鹏,
申请(专利权)人:科大讯飞股份有限公司,
类型:新型
国别省市:安徽,34
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。