语音识别系统技术方案

技术编号：18765490 阅读：25 留言：0更新日期：2018-08-25 11:26

本发明专利技术涉及一种语音识别系统，包括服务云端、主控制器、模数转换器、麦克风阵列，其中，所述主控制器包括主控单元CPU、声源定位模块、声源增强模块、回声消除模块、噪音抑制模块、以及WIFI模块，所述麦克风阵列包括三个呈等边形布置的用于拾音的麦克风。本发明专利技术采用由三个麦克风组成的麦克风阵列及4个通道ADC MIC与语音识别电路，其中三个麦克风和对应的三个通道ADC MIC语音识别电路用于拾音及声源定位，一个通道ADC MIC语音识别电路用于监听扬声器PA播放的音频，可准确实现声源定位、声源增强、回声消除、噪音抑制，能提高辨别环境声音和本机声音的准确率，从而提高语音识别准确率。

全部详细技术资料下载

【技术实现步骤摘要】
语音识别系统
本专利技术涉及语音识别
，尤其涉及一种语音识别系统。
技术介绍
语音识别技术(AutoSpeechRecognize，简称ASR)所要解决的问题是让计算机能够“听懂”人类的语音，将语音中包含的文字信息“提取”出来。ASR技术在“能听会说”的智能计算机系统中扮演着重要角色，相当于给计算机系统安装上“耳朵”，使其具备“能听”的功能，进而实现信息时代利用“语音”这一最自然、最便捷的手段进行人机通信和交互。近二十年来，语音识别技术取得显著进步，开始从实验室走向市场，语音识别技术已在工业、家电、通信、汽车电子、医疗、家庭服务、消费类电子等各个领域上应用。曾经语音识别听写机在一些领域的应用，被美国新闻界评为计算机发展十件大事之一。随着语音识别产品逐渐增加，许多语音识别和人机交互产品进入人们的生活需求，对语音识别技术质量要求越来越高。现有多数方案采用双麦克风拾音或者6个麦克风阵列做语音识别。对于双麦克风，只能单纯软件上做算法降噪，同时并不能识别是本机中播放的音频，还是环境中噪音；对于语音识别误判或直接语意是不能识别的，或者译错语意，特别是当播放声音较大时，或说话者距离机器较远时特别明显。而采用6个麦克风阵列的产品，占比空间大，产品外观要做很大，软件算法需要处理6个麦克风的数据，耗CPU资源较大，对CPU性能要求很高，整体设计方案成本过高，普通消费类产品难以实现。
技术实现思路
本专利技术的主要目的在于提出一种语音识别系统，旨在降低成本，提高语音识别准确率。为实现上述目的，本专利技术提出一种语音识别系统，该系统包括服务云端、主控制器、模数转换器、麦克风阵列...

【技术保护点】
1.一种语音识别系统，其特征在于，包括服务云端、主控制器、模数转换器、麦克风阵列，其中，所述主控制器包括主控单元CPU、声源定位模块、声源增强模块、回声消除模块、噪音抑制模块、以及WIFI模块，所述麦克风阵列包括三个呈等边形布置的用于拾音的麦克风；所述三个麦克风中的第一麦克风U1、第二麦克风U2、第三麦克风U3分别通过第一通道ADC MIC语音识别电路、第二通道ADC MIC语音识别电路、第三通道ADC MIC语音识别电路与所述模数转换器连接，所述模数转换器还通过第四通道ADC MIC语音识别电路与扬声器PA连接，所述模数转换器用于接收所述第一麦克风U1、第二麦克风U2、第三麦克风U3传输的信号、以及所述PA传输过来的模拟音频信号，并将所述第一麦克风U1、第二麦克风U2、第三麦克风U3传输的信号、以及所述扬声器PA传输过来的模拟音频信号转换成数字信号；所述主控单元CPU分别与所述模数转换器、扬声器PA、声源定位模块、声源增强模块、回声消除模块、噪音抑制模块、以及WIFI模块连接，所述主控单元CPU通过所述WIFI模块与所述服务云端连接。

【技术特征摘要】
1.一种语音识别系统，其特征在于，包括服务云端、主控制器、模数转换器、麦克风阵列，其中，所述主控制器包括主控单元CPU、声源定位模块、声源增强模块、回声消除模块、噪音抑制模块、以及WIFI模块，所述麦克风阵列包括三个呈等边形布置的用于拾音的麦克风；所述三个麦克风中的第一麦克风U1、第二麦克风U2、第三麦克风U3分别通过第一通道ADCMIC语音识别电路、第二通道ADCMIC语音识别电路、第三通道ADCMIC语音识别电路与所述模数转换器连接，所述模数转换器还通过第四通道ADCMIC语音识别电路与扬声器PA连接，所述模数转换器用于接收所述第一麦克风U1、第二麦克风U2、第三麦克风U3传输的信号、以及所述PA传输过来的模拟音频信号，并将所述第一麦克风U1、第二麦克风U2、第三麦克风U3传输的信号、以及所述扬声器PA传输过来的模拟音频信号转换成数字信号；所述主控单元CPU分别与所述模数转换器、扬声器PA、声源定位模块、声源增强模块、回声消除模块、噪音抑制模块、以及WIFI模块连接，所述主控单元CPU通过所述WIFI模块与所述服务云端连接。2.根据权利要求1所述的语音识别系统，其特征在于，还包括为所述模数转换器内部数字模块供电的第一供电电源、为所述模数转换器内部模拟内核供电的第二供电电源，所述第一供电电源包括第一供电电源滤波电路，所述第二供电电源包括第二供电电源滤波电路；所述第一供电电源滤波电路包括VIO18_PMU电源模块、电容C3、电容C4，其中，所述VIO18_PMU电源模块分别与所述电容C3的一端、电容C4的一端、所述模数转换器的引脚5、引脚7、引脚18、所述电阻R1的一端连接，所述电阻R1的另外一端与所述模数转换器的引脚17连接，所述电容C3的另一端、所述电容C4的另一端接地；所述第二供电电源滤波电路包括VCC_AF电源模块、电容C9、电容C10、其中，所述VCC_AF电源模块分别与所述电容C9的一端、电容C10的一端、所述模数转换器的引脚25连接，所述电容C9的另一端、所述电容C10的另一端接地。3.根据权利要求2所述的语音识别系统，其特征在于，所述第一麦克风U1与所述模数转换器通过BIAS1供电电路连接，所述BIAS1供电电路包括电容C14、电容C17，其中，所述电容C14的一端分别与所述模数转换器的引脚24、所述第一麦克风U1的引脚4、所述电容C17的一端连接，所述电容C14、电容C17的另一端接地；所述第一通道ADCMIC语音识别电路包括电容C15、电容C16、电容C18、以及电阻R10，所述第一麦克风U1的引脚1分别和所述电容C15的一端、电容C18的一端连接，所述电容C15的另一端与所述模数转换器的引脚21连接，所述电容C16的一端与所述模数转换器的引脚20连接，所述电容C16的另一端与所述电阻R10的一端连接，所述电阻R10的另一端、所述电容C18的另一端接地。4.根据权利要求2所述的语音识别系统，其特征在于，所述第二麦克风U2与所述模数转换器通过BIAS1供电电路连...

【专利技术属性】
技术研发人员：张治宇，钟景维，石庆，马保军，郑科，张龙，程文辉，韦振剑，
申请(专利权)人：深圳市亿道数码技术有限公司，
类型：发明
国别省市：广东,44

全部详细技术资料下载我是这个专利的主人