一种语音识别的方法及装置制造方法及图纸

技术编号:13239050 阅读:44 留言:0更新日期:2016-05-15 01:07
本发明专利技术实施例公开了一种语音识别的方法及装置。一种语音识别的方法包括:获取电子设备的音响的状态;当音响处于播放状态时,利用所述电子设备的第一麦克风采集现场的声音,利用所述电子设备的第二麦克风获取音响播放的声音,其中所述现场的声音包括用户的语音指令和所述音响播放的声音;从所述现场的声音和所述音响播放的声音中识别出用户的语音指令;根据识别出的所述用户的语音指令对所述电子设备进行操作。本发明专利技术实施例提供的技术方案有效地解决了复杂场景下语音识别技术的障碍,使用户可以在音响处于播放状态时,可同时使用语音指令对电子设备进行有效操作,极大地提高了用户的体验。

【技术实现步骤摘要】

本专利技术涉及语音识别
,具体主要涉及了一种语音识别的方法及装置
技术介绍
目前,随着科学技术的发展,人们可以通过语音对电子设备进行控制。在安静的环境下,电子设备可以有效采集用户的语音,对于用户的语音进行分析处理,以便获取有效的指令,并根据该指令进行动作,从而对用户的语音进行有效响应。但是,当电子设备在播放音乐时,用户通过语音对电子设备进行指示,此时,电子设备会同时获取用户的语音和播放的音乐,用户的语音和播放的音乐混合后为正确识别用户的语音增加了很大的难度。
技术实现思路
本专利技术提供了一种语音识别的方法及装置,有效地解决复杂场景下语音识别技术的障碍,使用户可以在音响处于播放状态时,同时使用语音指令对电子设备进行有效操作,极大地提高了用户的体验。本专利技术实施例第一方面公开了一种语音识别的方法,包括:获取电子设备的音响的状态;当所述音响处于播放状态时,利用所述电子设备的第一麦克风采集现场的声音,利用所述电子设备的第二麦克风获取音响播放的声音,其中所述现场的声音包括用户的语音指令和所述音响播放的声音;从所述现场的声音和所述音响播放的声音中识别出用户的语音指令;根据识别出的所述用户的语音指令对所述电子设备进行操作。结合第一方面,在第一方面的第一种可能的实施方式中,所述从所述现场的声音和所述音响播放的声音中识别出用户的语音指令之前,所述方法还包括:所述电子设备将所述现场的声音填入第一声道得到第一音频数据;所述电子设备将所述音响播放的声音填入第二声道得到第二音频数据。结合第一方面第一种可能的实施方式,在第一方面第二种可能的实施方式中,所述电子设备根据预设方法从所述现场的声音和所述音响播放的声音中获取用户的语音指令,具体包括:所述电子设备获取所述第一声道的数据和所述第二声道的数据;所述电子设备利用频率转换方法从所述第一声道的数据和所述第二声道的数据中获取有效音频数据流;所述电子设备利用自动增益控制算法AGC对所述有效音频数据流进行噪声消除,以便获取用户的语音指令。结合第一方面的第一种可能的实施方式,在第一方面的第三种可能的实施方式中,所述方法还包括:所述电子设备通过协调所述第一麦克风和所述第二麦克风,控制所述第一声道与所述第二声道的之间数据的延时小于阈值。结合第一方面,在第一方面的第四种可能的实施方式中,所述方法还包括:当所述电子设备的音响处于非播放状态时,所述电子设备利用所述第一麦克风和所述第二麦克风获取用户语音;所述电子设备利用AGC算法对所述用户语音进行噪声消除以便获取所述用户的语音指令; 所述电子设备根据所述用户的语音指令进行操作。结合第一方面,在第一方面的第五种可能的实施方式中,所述第一麦克风为主麦克风;所述第二麦克风为副麦克风;所述第一声道为左声道;所述第二声道为右声道。本专利技术实施例第二方面公开了一种语音识别的装置,包括:第一获取单元,用于获取电子设备的音响的状态;采集单元,用于当所述音响处于播放状态时,利用所述电子设备的第一麦克风采集现场的声音;利用所述电子设备的第二麦克风获取音响播放的声音;其中所述现场的声音包括用户的语音指令和所述音响播放的声音;第二获取单元,用于从所述现场的声音和所述音响播放的声音中获取用户的语音指令;操作单元,用于根据识别出的所述用户的语音指令对所述电子设备进行操作。结合第二方面,在第二方面的第一种可能的实施方式中,所述装置还包括:处理单元,用于所述电子设备将所述现场的声音填入第一声道得到第一音频数据,将所述音响播放的声音填入第二声道得到第二音频数据。结合第二方面第一种可能的实施方式,在第二方面的第二种可能的实施方式中,所述第二获取单元具体用于:获取所述第一声道的数据和所述第二声道的数据;利用频率转换方法从所述第一声道的数据和所述第二声道的数据中获取有效音频数据流;利用自动增益控制算法AGC对所述有效音频数据流进行噪声消除,以便获取用户的语音指令。结合第二方面或第二方面的第一种可能的实施方式,在第二方面的第三种可能的实施方式中,所述装置还包括:控制单元,用于所述电子设备通过协调所述第一麦克风和所述第二麦克风,控制所述第一声道与所述第二声道的之间数据的延时小于阈值。结合第二方面,在第二方面的第四种可能的实施方式中,所述第一获取单元还用于当所述音响处于非播放状态时,所述电子设备利用所述第一麦克风和所述第二麦克风获取用户语音;利用AGC算法对所述语音进行噪声消除以便获取所述用户的语音指令。可以看出,在本专利技术实施例的方案中,当电子设备音响处于播放状态时,所述电子设备可以利用第一麦克风采集现场的声音,利用第二麦克风获取音响播放的声音,其中所述现场的声音包括用户的语音指令和所述音响播放的声音,根据本技术方案电子设备可以根据第二麦克风获取的音响播放的声音将第一麦克风获取到的现场声音中的音响播放声音去除掉,从而得到用户语音指令,使用户可以在音响处于播放状态时,可同时使用语音指令对电子设备进行有效操作,极大地提高了用户的体验。【附图说明】为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术实施例提供的一种语音识别的方法的流程示意图;图2为本专利技术的实施例提供的另一种语音识别的方法的流程示意图;图3为本专利技术的实施例提供的另一种语音识别的方法的流程示意图;图4为本专利技术实施例提供的一种语音识别装置的示意图;图5为本专利技术实施例供的另一种语音识别装置的示意图。【具体实施方式】本专利技术提供一种语音识别的方法及装置,有效地解决了复杂场景下语音识别技术障碍,使用户可以在音响处于播放状态时,可同时使用语音指令对电子设备进行有效操作,极大地提高了用户的体验。为了使本
的人员更好地理解本专利技术方案,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚地描述,显然,所描述的实施例仅仅是本专利技术一部分的实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没当前第1页1 2 3 4 本文档来自技高网
...

【技术保护点】
一种语音识别的方法,其特征在于,所述方法包括:获取电子设备的音响的状态;当所述音响处于播放状态时,利用所述电子设备的第一麦克风采集现场的声音,利用所述电子设备的第二麦克风获取音响播放的声音,其中所述现场的声音包括用户的语音指令和所述音响播放的声音;从所述现场的声音和所述音响播放的声音中识别出用户的语音指令;根据识别出的所述用户的语音指令对所述电子设备进行操作。

【技术特征摘要】

【专利技术属性】
技术研发人员:田孝辉
申请(专利权)人:东莞酷派软件技术有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1