基于语音自动识别的对讲机实现系统及方法技术方案

技术编号：21303885 阅读：52 留言：0更新日期：2019-06-12 09:07

本发明专利技术提供一种基于语音自动识别的对讲机实现系统，包括语音采集模块，用于采集声音信号，将声音信号转换成模拟电信号；音频编解码模块，用于将模拟电信号转换成数字音频信号；语音识别模块，用于通过基于语音深度学习的神经网络模型，对数字音频信号进行识别，并获得识别结果；主控制模块，用于控制将识别结果上传给远程服务器，由远程服务器根据识别结果执行对应的操作。本发明专利技术还提供一种系统所对应的方法。本发明专利技术优点在于：实现对讲机的智能化控制，而不需要通过人工手动去控制或者操控对讲机，可为对讲机的实际使用带来极大的方便。

Interphone Implementation System and Method Based on Automatic Speech Recognition

The invention provides a walkie-talkie implementation system based on automatic voice recognition, which includes voice acquisition module for acquiring voice signal and converting voice signal into analog electric signal; audio coding and decoding module for converting analog electric signal into digital audio signal; and speech recognition module for converting digital audio signal through neural network model based on deep learning of voice. The main control module is used to control the identification results to be uploaded to the remote server, and the remote server executes corresponding operations according to the recognition results. The invention also provides a method corresponding to the system. The invention has the advantages that the intelligent control of the walkie-talkie can be realized without manual control or manipulation of the walkie-talkie, which can bring great convenience to the practical use of the walkie-talkie.

全部详细技术资料下载

【技术实现步骤摘要】
基于语音自动识别的对讲机实现系统及方法
本专利技术涉及对讲机领域，特别涉及基于语音自动识别的对讲机实现系统及方法。
技术介绍
对讲机的英文名称是twowayradio，它是一种双向移动通信工具，在不需要任何网络支持的情况下，就可以通话，没有话费产生，适用于相对固定且频繁通话的场合。对讲机目前有三大类:模拟对讲机、数字对讲机、IP对讲机。传统的对讲机都是通过广播的方式，来将一定范围内的处于同一频段的对讲机建立分组，或者通过加密码的方式建立分组。对于公网对讲机，是通过对讲服务器来将指定的对讲设备分组，分组内的对讲设备可以进行对讲，所有的控制都是由对讲服务器来完成。但是，现有技术在实现对对讲机的管理时，存在有如下缺陷：只能人工手动控制对讲机、人工手动进行分组管理等，而无法实现对讲机的智能控制；而通过远程平台来创建或者调整分组，则无法实现开机即用；同时，在操作对讲机(如调节音量等)时，需要人工手动进行调节，而此时如果操作人正在执行其它操作(例如在开车)，将会带来不便。
技术实现思路
本专利技术要解决的技术问题之一，在于提供一种基于语音自动识别的对讲机实现系统，通过该系统可实现...

【技术保护点】
1.一种基于语音自动识别的对讲机实现系统，其特征在于：所述系统包括语音采集模块、音频编解码模块、语音识别模块以及主控制模块：所述语音采集模块，用于采集声音信号，将声音信号转换成模拟电信号；所述音频编解码模块，用于将模拟电信号转换成数字音频信号；所述语音识别模块，用于通过基于语音深度学习的神经网络模型，对数字音频信号进行识别，并获得识别结果；所述主控制模块，用于控制将识别结果上传给远程服务器，由远程服务器根据识别结果执行对应的操作。

【技术特征摘要】
1.一种基于语音自动识别的对讲机实现系统，其特征在于：所述系统包括语音采集模块、音频编解码模块、语音识别模块以及主控制模块：所述语音采集模块，用于采集声音信号，将声音信号转换成模拟电信号；所述音频编解码模块，用于将模拟电信号转换成数字音频信号；所述语音识别模块，用于通过基于语音深度学习的神经网络模型，对数字音频信号进行识别，并获得识别结果；所述主控制模块，用于控制将识别结果上传给远程服务器，由远程服务器根据识别结果执行对应的操作。2.根据权利要求1所述的基于语音自动识别的对讲机实现系统，其特征在于：还包括语音播放模块；所述主控制模块，还用于接收远程服务器下发的语音消息或者反馈的语音指令；所述语音识别模块，还用于将远程服务器下发的语音消息或者反馈的语音指令转换成数字语音；所述音频编解码模块，还用于将数字语音转换成模拟语音；所述语音播放模块，用于播放模拟语音。3.根据权利要求1或2所述的基于语音自动识别的对讲机实现系统，其特征在于：所述语音识别模块具体包括模型学习单元以及语音识别单元：所述模型学习单元，用于预先录制并保存各个语音命令的语音片段，采用神经网络识别所述语音片段，进行深度学习训练所述神经网络，从而获得基于语音深度学习的神经网络模型；所述语音识别单元，用于使用基于语音深度学习的神经网络模型来对上传的数字音频信号进行语音比较，且如果该数字音频信号与神经网络模型中学习过的某一语音命令的相似度超过设定的相似阈值，则将该数字音频信号识别成对应的语音命令；否则就将该数字音频信号识别为语音消息；所述语音识别单元，还用于将远程服务器下发的语音消息转换成数字语音，或者将远程服务器反馈的语音命令与神经网络模型中学习过的对应语音命令进行匹配，并将该语音命令转换成数字语音。4.根据权利要求3所述的基于语音自动识别的对讲机实现系统，其特征在于：所述主控制模块具体包括主控制单元以及通讯单元；所述主控制单元，用于控制将神经网络模型识别出的语音命令或者语音消息上传；所述通讯单元，用于将神经网络模型识别出的语音命令或者语音消息传送给远程服务器，并由远程服务器执行对应的语音命令或者存储对应的语音消息；所述主控制单元，还用于控制将远程服...

【专利技术属性】
技术研发人员：陈杰，林兆剑，陈春强，詹丽华，林静，
申请(专利权)人：福建天眼视讯网络科技有限公司，
类型：发明
国别省市：福建,35

全部详细技术资料下载我是这个专利的主人