兼容普通话和方言的语音识别家电控制系统和方法技术方案

技术编号:21481324 阅读:21 留言:0更新日期:2019-06-29 05:41
本发明专利技术提供了一种兼容普通话和方言的语音识别家电控制系统和方法,其中家电控制系统包括:语音接受模块,利用本地的音频输入设备,接收设定的音频作为第一信号;语音识别模块,将第一信号进行识别处理,并将识别处理结果作为第二信号;家电控制模块,将第二信号按照设定的逻辑进行计算并判断计算结果是否属于设定结果集合,若计算结果属于设定结果集合,则根据设定结果集合映射的设定操作集合发出控制指令作为第三信号,若计算结果不属于设定结果集合,则发出失败指令作为第四信号;家电操作模块,接收第三信号并根据第三信号做出指定操作;本发明专利技术具有可靠性高、维护成本低的优点,能够极大地提高特定使用者的指令识别率。

【技术实现步骤摘要】
兼容普通话和方言的语音识别家电控制系统和方法
本专利技术涉及语音识别
,具体地,涉及一种兼容普通话和方言的语音识别家电控制系统和方法。
技术介绍
我国是家电、家居设备制造大国,每年大小家电、家居设备产能多达20亿台。据了解,国内很多家电厂商已经把语音交互语音控制作为最重要战略。语音识别作为目前人工智能落地最成功的领域,现有的中文普通话语音识别,已经可以带来了很好的用户体验,如专利文献CN108932947A公开的一种语音控制方法及家电设备,其中,该方法包括:接收多个语音信息,将多个语音信息进行分类,并在每类语音信息中选择一个语音信息执行对应的控制操作,采用上述技术方案,即全面执行了多类语音信息的控制操作,又精确的在每类语音信息中选择一个语音信息去执行,在当前环境嘈杂的情况下,仅依据少量语音信息对家电设备进行控制操作,解决了相关技术中环境中语音嘈杂的情况下,语音控制设备准确度低的问题,避免了多人同时控制家电设备导致家电设备无法识别控制操作从而易出错的情况,保证了语音控制家电设备的准确性。但除了大城市之外,二线、三线到乡镇,很多用户家里依然说着方言,需要一种方法能够解决实际使用者,比如老人、女人,二三线城市城镇等这些说着方言的用户,也可以语音控制家电,原有的普通话识别也可以兼容,这样让人与家电设备的语音交互更加自然、和人性化。
技术实现思路
针对现有技术中的缺陷,本专利技术的目的是提供一种兼容普通话和方言的语音识别家电控制系统和方法。根据本专利技术提供的一种兼容普通话和方言的语音识别家电控制系统,包括语音接受模块、语音识别模块、家电控制模块以及家电操作模块;语音接受模块:利用本地的音频输入设备,接收设定的音频作为原始信号;前端处理模块:接收原始信号,并将原始信号进行前端处理得到第一信号;语音识别模块:将第一信号进行模式识别,并将模式识别结果作为第二信号;家电控制模块:将第二信号按照设定的逻辑进行计算并判断计算结果是否属于设定结果集合,若计算结果属于设定结果集合,则根据设定结果集合映射的设定操作集合发出控制指令作为第三信号,若计算结果不属于设定结果集合,则发出失败指令作为第四信号;家电操作模块:接收第三信号并根据第三信号做出指定操作;所述前端处理包括语音特征值提取。优选地,所述兼容普通话和方言的语音识别家电控制系统还包括:语音播放模块:接收第三信号和第四信号并语音播报设定的识别结果信息。优选地,家电控制模块中的计算包括方言声学模型计算和普通话声学模型计算,即将第二信号分别按照设定的逻辑进行方言声学模型计算和普通话声学模型计算得到方言计算结果和普通话计算结果,若方言计算结果属于设定结果集合,则采用方言计算结果,否则,则采用普通话计算结果。优选地,所述家电控制模块包括方言训练子模块;方言训练子模块:使用者选定待训练指令后,多次训练学习使用者指定的语音唤醒词,从而建立语音唤醒词与待训练指令间的映射,并更新方言声学模型。优选地,所述音频输入设备包括麦克风或者麦克风阵列;所述语音特征值提取包括通过梅尔频率倒谱提取语音特征值,所述语音特征值包括语音特征矢量编码;所述前端处理还包括降噪、语音端点检测以及语音分帧这三者中的任一种或任多种组合;所述语音分帧是指将原始信号以设定的时间长度分割为多个语音帧;所述端点检测是指根据原始信号的时域参量进行语音端点的检测,从而将原始信号区分为语音信号时段和非语音信号时段;所述降噪包括稳态噪音的过滤和/或动态噪音的抑制;其中,时域参量包括短时幅度和/或短时过零率;稳态噪音的过滤包括通过webrtc算法过滤;动态噪音的抑制包括通过麦克风阵列的波束成型来抑制。根据本专利技术提供的一种兼容普通话和方言的语音识别家电控制方法,包括语音接受步骤、语音识别步骤、家电控制步骤以及家电操作步骤;语音接受步骤:利用本地的音频输入设备,接收设定的音频作为第一信号;语音识别步骤:将第一信号进行识别处理,并将识别处理结果作为第二信号;家电控制步骤:将第二信号按照设定的逻辑进行计算并判断计算结果是否属于设定结果集合,若计算结果属于设定结果集合,则根据设定结果集合映射的设定操作集合发出控制指令作为第三信号,若计算结果不属于设定结果集合,则发出失败指令作为第四信号;家电操作步骤:接收第三信号并根据第三信号做出指定操作;所述识别处理包括语音特征值提取。优选地,所述兼容普通话和方言的语音识别家电控制方法还包括:语音播放步骤:接收第三信号和第四信号并语音播报设定的识别结果信息。优选地,家电控制步骤中的计算包括方言声学模型计算和普通话声学模型计算,即将第二信号分别按照设定的逻辑进行方言声学模型计算和普通话声学模型计算得到方言计算结果和普通话计算结果,若方言计算结果属于设定结果集合,则采用方言计算结果,否则,则采用普通话计算结果。优选地,所述家电控制步骤包括方言训练子步骤;方言训练子步骤:使用者选定待训练指令后,多次训练指定的语音唤醒词,从而建立语音唤醒词与待训练指令间的映射。优选地,所述音频输入设备包括麦克风或者麦克风阵列;所述语音特征值提取包括通过梅尔频率倒谱提取语音特征值,所述语音特征值包括语音特征矢量编码;所述识别处理还包括降噪、语音端点检测以及语音分帧这三者中的任一种或任多种组合;所述语音分帧是指将原始信号以设定的时间长度分割为多个语音帧;所述端点检测是指根据原始信号的时域参量进行语音端点的检测,从而将原始信号区分为语音信号时段和非语音信号时段;所述降噪包括稳态噪音的过滤和/或动态噪音的抑制;其中,时域参量包括短时幅度和/或短时过零率;稳态噪音的过滤包括通过webrtc算法过滤;动态噪音的抑制包括通过麦克风阵列的波束成型来抑制。与现有技术相比,本专利技术具有如下的有益效果:1、本专利技术提供的兼容普通话和方言的语音识别家电控制系统,具有结构简单、可靠性高、维护成本低的优点;2、本专利技术提供的兼容普通话和方言的语音识别家电控制系统和方法,能够在识别方言的基础上,进一步的主动训练,从而极大地提高特定使用者的指令识别率,甚至能够实现各语种间的无差别识别;3、本专利技术提供的兼容普通话和方言的语音识别家电控制系统和方法,通过降噪、语音端点检测以及语音分帧有效地对输入语音进行了有效性筛选,从而降低了语音特征值提取所需的计算量,进而提升了语音识别的效率。附图说明通过阅读参照以下附图对非限制性实施例所作的详细描述,本专利技术的其它特征、目的和优点将会变得更明显:图1为方言学习训练流程图图2为语音识别流程图图3为语音识别家电控制系统的示意图。具体实施方式下面结合具体实施例对本专利技术进行详细说明。以下实施例将有助于本领域的技术人员进一步理解本专利技术,但不以任何形式限制本专利技术。应当指出的是,对本领域的普通技术人员来说,在不脱离本专利技术构思的前提下,还可以做出若干变化和改进。这些都属于本专利技术的保护范围。根据本专利技术提供的一种兼容普通话和方言的语音识别家电控制系统,包括语音接受模块、语音识别模块、家电控制模块以及家电操作模块;语音接受模块:利用本地的音频输入设备,接收设定的音频作为原始信号;前端处理模块:接收原始信号,并将原始信号进行前端处理得到第一信号;语音识别模块:将第一信号进行模式识别,并将模式识别结果作为第二信号;家电控制模块:将第二信号按照设定的逻辑进行计算本文档来自技高网...

【技术保护点】
1.一种兼容普通话和方言的语音识别家电控制系统,其特征在于,包括语音接受模块、语音识别模块、家电控制模块以及家电操作模块;语音接受模块:利用本地的音频输入设备,接收设定的音频作为原始信号;前端处理模块:接收原始信号,并将原始信号进行前端处理得到第一信号;语音识别模块:将第一信号进行模式识别,并将模式识别结果作为第二信号;家电控制模块:将第二信号按照设定的逻辑进行计算并判断计算结果是否属于设定结果集合,若计算结果属于设定结果集合,则根据设定结果集合映射的设定操作集合发出控制指令作为第三信号,若计算结果不属于设定结果集合,则发出失败指令作为第四信号;家电操作模块:接收第三信号并根据第三信号做出指定操作;所述前端处理包括语音特征值提取。

【技术特征摘要】
1.一种兼容普通话和方言的语音识别家电控制系统,其特征在于,包括语音接受模块、语音识别模块、家电控制模块以及家电操作模块;语音接受模块:利用本地的音频输入设备,接收设定的音频作为原始信号;前端处理模块:接收原始信号,并将原始信号进行前端处理得到第一信号;语音识别模块:将第一信号进行模式识别,并将模式识别结果作为第二信号;家电控制模块:将第二信号按照设定的逻辑进行计算并判断计算结果是否属于设定结果集合,若计算结果属于设定结果集合,则根据设定结果集合映射的设定操作集合发出控制指令作为第三信号,若计算结果不属于设定结果集合,则发出失败指令作为第四信号;家电操作模块:接收第三信号并根据第三信号做出指定操作;所述前端处理包括语音特征值提取。2.根据权利要求1所述的兼容普通话和方言的语音识别家电控制系统,其特征在于,所述兼容普通话和方言的语音识别家电控制系统还包括:语音播放模块:接收第三信号和第四信号并语音播报设定的识别结果信息。3.根据权利要求1所述的兼容普通话和方言的语音识别家电控制系统,其特征在于,家电控制模块中的计算包括方言声学模型计算和普通话声学模型计算,即将第二信号分别按照设定的逻辑进行方言声学模型计算和普通话声学模型计算得到方言计算结果和普通话计算结果,若方言计算结果属于设定结果集合,则采用方言计算结果,否则,则采用普通话计算结果。4.根据权利要求3所述的兼容普通话和方言的语音识别家电控制系统,其特征在于,所述家电控制模块包括方言训练子模块;方言训练子模块:使用者选定待训练指令后,多次训练学习使用者指定的语音唤醒词,从而建立语音唤醒词与待训练指令间的映射,并更新方言声学模型。5.根据权利要求1至4中任一项所述的兼容普通话和方言的语音识别家电控制系统,其特征在于,所述音频输入设备包括麦克风或者麦克风阵列;所述语音特征值提取中的特征值包括语音编码;所述识别处理还包括降噪、语音端...

【专利技术属性】
技术研发人员:朱建强
申请(专利权)人:上海华镇电子科技有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1