语音识别系统技术方案

技术编号:18765490 阅读:25 留言:0更新日期:2018-08-25 11:26
本发明专利技术涉及一种语音识别系统,包括服务云端、主控制器、模数转换器、麦克风阵列,其中,所述主控制器包括主控单元CPU、声源定位模块、声源增强模块、回声消除模块、噪音抑制模块、以及WIFI模块,所述麦克风阵列包括三个呈等边形布置的用于拾音的麦克风。本发明专利技术采用由三个麦克风组成的麦克风阵列及4个通道ADC MIC与语音识别电路,其中三个麦克风和对应的三个通道ADC MIC语音识别电路用于拾音及声源定位,一个通道ADC MIC语音识别电路用于监听扬声器PA播放的音频,可准确实现声源定位、声源增强、回声消除、噪音抑制,能提高辨别环境声音和本机声音的准确率,从而提高语音识别准确率。

【技术实现步骤摘要】
语音识别系统
本专利技术涉及语音识别
,尤其涉及一种语音识别系统。
技术介绍
语音识别技术(AutoSpeechRecognize,简称ASR)所要解决的问题是让计算机能够“听懂”人类的语音,将语音中包含的文字信息“提取”出来。ASR技术在“能听会说”的智能计算机系统中扮演着重要角色,相当于给计算机系统安装上“耳朵”,使其具备“能听”的功能,进而实现信息时代利用“语音”这一最自然、最便捷的手段进行人机通信和交互。近二十年来,语音识别技术取得显著进步,开始从实验室走向市场,语音识别技术已在工业、家电、通信、汽车电子、医疗、家庭服务、消费类电子等各个领域上应用。曾经语音识别听写机在一些领域的应用,被美国新闻界评为计算机发展十件大事之一。随着语音识别产品逐渐增加,许多语音识别和人机交互产品进入人们的生活需求,对语音识别技术质量要求越来越高。现有多数方案采用双麦克风拾音或者6个麦克风阵列做语音识别。对于双麦克风,只能单纯软件上做算法降噪,同时并不能识别是本机中播放的音频,还是环境中噪音;对于语音识别误判或直接语意是不能识别的,或者译错语意,特别是当播放声音较大时,或说话者距离机器较远时特别明显。而采用6个麦克风阵列的产品,占比空间大,产品外观要做很大,软件算法需要处理6个麦克风的数据,耗CPU资源较大,对CPU性能要求很高,整体设计方案成本过高,普通消费类产品难以实现。
技术实现思路
本专利技术的主要目的在于提出一种语音识别系统,旨在降低成本,提高语音识别准确率。为实现上述目的,本专利技术提出一种语音识别系统,该系统包括服务云端、主控制器、模数转换器、麦克风阵列,其中,所述主控制器包括主控单元CPU、声源定位模块、声源增强模块、回声消除模块、噪音抑制模块、以及WIFI模块,所述麦克风阵列包括三个呈等边形布置的用于拾音的麦克风;所述三个麦克风中的第一麦克风U1、第二麦克风U2、第三麦克风U3分别通过第一通道ADCMIC语音识别电路、第二通道ADCMIC语音识别电路、第三通道ADCMIC语音识别电路与所述模数转换器连接,所述模数转换器还通过第四通道ADCMIC语音识别电路与扬声器PA连接,所述模数转换器用于接收所述第一麦克风U1、第二麦克风U2、第三麦克风U3传输的信号、以及所述PA传输过来的模拟音频信号,并将所述第一麦克风U1、第二麦克风U2、第三麦克风U3传输的信号、以及所述扬声器PA传输过来的模拟音频信号转换成数字信号;所述主控单元CPU分别与所述模数转换器、扬声器PA、声源定位模块、声源增强模块、回声消除模块、噪音抑制模块、以及WIFI模块连接,所述主控单元CPU通过所述WIFI模块与所述服务云端连接。本专利技术的进一步的技术方案是,还包括为所述模数转换器内部数字模块供电的第一供电电源、为所述模数转换器内部模拟内核供电的第二供电电源,所述第一供电电源包括第一供电电源滤波电路,所述第二供电电源包括第二供电电源滤波电路;所述第一供电电源滤波电路包括VIO18_PMU电源模块、电容C3、电容C4,其中,所述VIO18_PMU电源模块分别与所述电容C3的一端、电容C4的一端、所述模数转换器的引脚5、引脚7、引脚18、所述电阻R1的一端连接,所述电阻R1的另外一端与所述模数转换器的引脚17连接,所述电容C3的另一端、所述电容C4的另一端接地;所述第二供电电源滤波电路包括VCC_AF电源模块、电容C9、电容C10、其中,所述VCC_AF电源模块分别与所述电容C9的一端、电容C10的一端、所述模数转换器的引脚25连接,所述电容C9的另一端、所述电容C10的另一端接地。本专利技术的进一步的技术方案是,所述第一麦克风U1与所述模数转换器通过BIAS1供电电路连接,所述BIAS1供电电路包括电容C14、电容C17,其中,所述电容C14的一端分别与所述模数转换器的引脚24、所述第一麦克风U1的引脚4、所述电容C17的一端连接,所述电容C14、电容C17的另一端接地;所述第一通道ADCMIC语音识别电路包括电容C15、电容C16、电容C18、以及电阻R10,所述第一麦克风U1的引脚1分别和所述电容C15的一端、电容C18的一端连接,所述电容C15的另一端与所述模数转换器的引脚21连接,所述电容C16的一端与所述模数转换器的引脚20连接,所述电容C16的另一端与所述电阻R10的一端连接,所述电阻R10的另一端、所述电容C18的另一端接地。本专利技术的进一步的技术方案是,所述第二麦克风U2与所述模数转换器通过BIAS1供电电路连接,所述BIAS1供电电路包括电容C14、电容C32,其中,所述电容C14的一端分别与所述模数转换器的引脚24、所述第二麦克风U2的引脚4、所述电容C32的一端连接,所述电容C14、电容C32的另一端接地;所述第二通道ADCMIC语音识别电路包括电容C19、电容C20、电容C22、以及电阻R11,所述第二麦克风U2的引脚1分别与所述电容C19、电容C22的一端连接,所述电容C19的另一端与所述模数转换器的引脚23连接,所述电容C20的一端与所述模数转换器的引脚22连接,所述电容C20的另一端与所述电阻R11的一端连接,所述电阻R11的另一端、所述电容C22的另一端接地。本专利技术的进一步的技术方案是,所述第三麦克风U3与所述模数转换器通过BIAS2供电电路连接,所述BIAS2供电电路包括电容C13、电容C33,所述模数转换器的引脚26分别与所述电容C13的一端、电容C33的一端、所述第三麦克风U3的引脚4连接;所述第三通道ADCMIC语音识别电路包括电容C23、电容C24、电容C26、以及电阻R12,所述第三麦克风U3的引脚1分别与所述电容C23的一端、电容C26的一端连接,所述电容C23的另一端与所述模数转换器的27脚连接,所述电容C24的一端与所述模数转换器的28脚连接,所述C24的另一端与所述电阻R12的一端连接,所述电阻R12的另一端、所述电容C13的另一端、所述电容C26的另一端、所述电容C33的另一端接地。本专利技术的进一步的技术方案是,所述第四通道ADCMIC语音识别电路包括电阻R13、电阻R14、电阻R16、电容28、电容29、以及电容30,所述电阻R14的一端与所述扬声器PA连接,所述电阻R14的另一端分别与所述电阻R13的一端、所述电容C28的一端、以及所述电容C29的一端连接,所述电容C29的另一端与所述模数转换器的引脚1连接,所述电容C30的一端与所述模数转换器的引脚2连接,所述电容C30的另一端与所述电阻R18的一端连接,所述电阻R16的另一端、所述电阻R13的另一端、所述电容C28的另一端接地。本专利技术的进一步的技术方案是,还包括基准电压滤波电路,所述基准电压滤波电路包括电容C7、电容C8,所述模数转换器的引脚3和所述电容C7的一端连接,所述模数转换器的引脚4和所述电容C8的一端连接,所述电容C7的另一端、电容C8的另一端接地。本专利技术的进一步的技术方案是,所述模数转换器的引脚6和引脚14接地,所述模数转换器的引脚15与电容C2的一端连接,所模数转换器的引脚16与电容C1的一端连接,所述电容C1、电容C2的另一端接地,所述模数转换器的引脚11为BCK,所述模数转换器的引脚12为LRCK,所述模数转换器本文档来自技高网...

【技术保护点】
1.一种语音识别系统,其特征在于,包括服务云端、主控制器、模数转换器、麦克风阵列,其中,所述主控制器包括主控单元CPU、声源定位模块、声源增强模块、回声消除模块、噪音抑制模块、以及WIFI模块,所述麦克风阵列包括三个呈等边形布置的用于拾音的麦克风;所述三个麦克风中的第一麦克风U1、第二麦克风U2、第三麦克风U3分别通过第一通道ADC MIC语音识别电路、第二通道ADC MIC语音识别电路、第三通道ADC MIC语音识别电路与所述模数转换器连接,所述模数转换器还通过第四通道ADC MIC语音识别电路与扬声器PA连接,所述模数转换器用于接收所述第一麦克风U1、第二麦克风U2、第三麦克风U3传输的信号、以及所述PA传输过来的模拟音频信号,并将所述第一麦克风U1、第二麦克风U2、第三麦克风U3传输的信号、以及所述扬声器PA传输过来的模拟音频信号转换成数字信号;所述主控单元CPU分别与所述模数转换器、扬声器PA、声源定位模块、声源增强模块、回声消除模块、噪音抑制模块、以及WIFI模块连接,所述主控单元CPU通过所述WIFI模块与所述服务云端连接。

【技术特征摘要】
1.一种语音识别系统,其特征在于,包括服务云端、主控制器、模数转换器、麦克风阵列,其中,所述主控制器包括主控单元CPU、声源定位模块、声源增强模块、回声消除模块、噪音抑制模块、以及WIFI模块,所述麦克风阵列包括三个呈等边形布置的用于拾音的麦克风;所述三个麦克风中的第一麦克风U1、第二麦克风U2、第三麦克风U3分别通过第一通道ADCMIC语音识别电路、第二通道ADCMIC语音识别电路、第三通道ADCMIC语音识别电路与所述模数转换器连接,所述模数转换器还通过第四通道ADCMIC语音识别电路与扬声器PA连接,所述模数转换器用于接收所述第一麦克风U1、第二麦克风U2、第三麦克风U3传输的信号、以及所述PA传输过来的模拟音频信号,并将所述第一麦克风U1、第二麦克风U2、第三麦克风U3传输的信号、以及所述扬声器PA传输过来的模拟音频信号转换成数字信号;所述主控单元CPU分别与所述模数转换器、扬声器PA、声源定位模块、声源增强模块、回声消除模块、噪音抑制模块、以及WIFI模块连接,所述主控单元CPU通过所述WIFI模块与所述服务云端连接。2.根据权利要求1所述的语音识别系统,其特征在于,还包括为所述模数转换器内部数字模块供电的第一供电电源、为所述模数转换器内部模拟内核供电的第二供电电源,所述第一供电电源包括第一供电电源滤波电路,所述第二供电电源包括第二供电电源滤波电路;所述第一供电电源滤波电路包括VIO18_PMU电源模块、电容C3、电容C4,其中,所述VIO18_PMU电源模块分别与所述电容C3的一端、电容C4的一端、所述模数转换器的引脚5、引脚7、引脚18、所述电阻R1的一端连接,所述电阻R1的另外一端与所述模数转换器的引脚17连接,所述电容C3的另一端、所述电容C4的另一端接地;所述第二供电电源滤波电路包括VCC_AF电源模块、电容C9、电容C10、其中,所述VCC_AF电源模块分别与所述电容C9的一端、电容C10的一端、所述模数转换器的引脚25连接,所述电容C9的另一端、所述电容C10的另一端接地。3.根据权利要求2所述的语音识别系统,其特征在于,所述第一麦克风U1与所述模数转换器通过BIAS1供电电路连接,所述BIAS1供电电路包括电容C14、电容C17,其中,所述电容C14的一端分别与所述模数转换器的引脚24、所述第一麦克风U1的引脚4、所述电容C17的一端连接,所述电容C14、电容C17的另一端接地;所述第一通道ADCMIC语音识别电路包括电容C15、电容C16、电容C18、以及电阻R10,所述第一麦克风U1的引脚1分别和所述电容C15的一端、电容C18的一端连接,所述电容C15的另一端与所述模数转换器的引脚21连接,所述电容C16的一端与所述模数转换器的引脚20连接,所述电容C16的另一端与所述电阻R10的一端连接,所述电阻R10的另一端、所述电容C18的另一端接地。4.根据权利要求2所述的语音识别系统,其特征在于,所述第二麦克风U2与所述模数转换器通过BIAS1供电电路连...

【专利技术属性】
技术研发人员:张治宇钟景维石庆马保军郑科张龙程文辉韦振剑
申请(专利权)人:深圳市亿道数码技术有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1