一种语音控制方法及其控制模组技术

技术编号:16588571 阅读:34 留言:0更新日期:2017-11-18 16:28
本发明专利技术公开了一种语音控制方法及其控制模组。所述方法包括:通过麦克风采集来自环境的第一声音信息;接收来自其他声源设备的第二声音信息;根据所述第一声音信息和第二声音信息,切换为对应的语音分析状态;所述语音分析状态包括:采集频率为8KHz的通讯状态、采集频率为16KHz的声控状态以及采集频率为44KHz、8KHz或者16KHz的声音情景分析状态;在所述语音分析状态下,对所述第一声音信息和第二声音信息进行语音分析,输出相应的分析结果;根据所述语音分析状态的分析结果,以预定的编码方式编码为第三声音信息并输出至所述环境中;并且输出对应的控制指令。

Speech control method and control module thereof

The invention discloses a speech control method and a control module thereof. The method comprises the following steps: collecting first sound information from the environment through a microphone; receives from other sound source equipment second sound information; according to the first information and the second voice sound information, switch to the corresponding speech analysis; the speech analysis include acquisition frequency acquisition 8KHz communication state, the frequency of sound the state of 16KHz and the acquisition frequency is 44KHz, 8KHz or 16KHz sound scene analysis; in the analysis of the voice condition, the voice of the first sound information and second sound information, output the corresponding analysis results; according to the analysis results of the voice encoding in a predetermined encoding third sound information and output to the environment and output the corresponding control instructions.

【技术实现步骤摘要】
一种语音控制方法及其控制模组
本专利技术涉及声音控制
,尤其涉及一种语音控制方法及其控制模组。
技术介绍
语音控制技术的发展突飞猛进。尤其在手机的应用上,开始被多家大厂使用。人耳朵对声音的频率是20hz到在20khz以下,所以大部分的麦克风对于接收声音的范围都界定在20khz以下。在声音信号的采集频率上,可能在每秒8k或16kHz的频率下工作。另外,在语音控制中,除了人语音辨识以外,对于声音情景的分析,也是一个热门研究话题。声音情景分析,主要是对于周遭的声音内容,做一个内容情境分析。例如,人走路声,咳嗽,婴儿哭声,睡觉时的鼾声等。在市面上,有名的声控设备,例如,亚马逊的echo,京东的叮咚叮咚,都是桌上型的语音声控设备。其主要功能就是声控。其设备在有其他声源的环境下,就无法辨认,例如电视机的声音,音响的音乐等。这些主动设备都会造成辨识的问题。另外,这些市面上的产品除了声控之外,并未对于其他类声音,做任何分析。而对于声音情境的分析,目前有些是做在手机APP端,例如,对于婴儿哭声的分析,使用者需截取声音,送至云端。由云端做出分析后,再传回手机。另一种,譬如,婴儿哭声侦测警报器。这类产品,主要是针对分贝的大小,做了一些简单分析。在现有的语音控制中,全部使用的都是单一功能的技术及产品。例如,语音控制产品,声音触发器,声音侦测器去侦测玻璃破碎声,做为防盗之用。由于
的跨行或者集成技术的门槛的原因,其都是单一的方案。例如,不同的声音控制会要求不同的采集频率。另外,为了辨识准确,往往会消掉一些不同频段的讯号。因此,现有技术还有待发展。
技术实现思路
鉴于上述现有技术的不足之处,本专利技术的目的在于提供一种语音控制方法及其控制模组,旨在解决现有技术中无集成技术方案,产品设备功能单一,无法很好的提供全面智能控制作用的问题。为了达到上述目的,本专利技术采取了以下技术方案:一种语音控制方法,其中,包括:通过麦克风采集来自环境的第一声音信息;接收来自其他声源设备的第二声音信息;根据所述第一声音信息和第二声音信息,切换为对应的语音分析状态;所述语音分析状态包括:采集频率为8KHz的通讯状态、采集频率为16KHz的声控状态以及采集频率为44KHz、8KHz或者16KHz的声音情景分析状态;在所述语音分析状态下,对所述第一声音信息和第二声音信息进行语音分析,输出相应的分析结果;根据所述语音分析状态的分析结果,以预定的编码方式编码为第三声音信息并输出至所述环境中;并且输出对应的控制指令。所述的方法,其中,所述第三声音信息包含语音分析状态切换指令;所述第三声音信息与所述第一声音信息在环境中混合,并通过所述麦克风采集。所述的方法,其中,所述方法还包括:确定所述第一声音信号或第二声音信号的位置信息;结合所述位置信息以及所述分析结果,调整控制指令指向的设备。所述的方法,其中,所述方法还包括:使用AUX接口,连接所述麦克风;通过连接AUX的串口,形成所述第一声音信息的输入端口。所述的方法,其中,在所述语音分析状态为声音情景分析状态时,所述方法还包括:调整所述麦克风的响应范围,获取高于或等于20KHz的高频声音信号;输出第三声音信息,所述第三声音信息为高频声音信号;暂停所述麦克风的回声消除功能;通过麦克风获取所述第三声音信息。一种语音控制模组,其中,包括:麦克风、声音侦测模组、声音处理模组;所述麦克风用于采集来自环境的第一声音信息;所述声音侦测模组用于接收来自其他声源设备的第二声音信息;以及根据所述第一声音信息和第二声音信息,令所述声音处理模组切换为对应的语音分析状态;所述声音处理模组用于在所述语音分析状态下,对所述第一声音信息和第二声音信息进行语音分析,输出相应的分析结果,以及根据所述语音分析状态的分析结果,以预定的编码方式编码为第三声音信息并输出至所述环境中;并且输出对应的控制指令。所述的语音控制模组,其中,所述第三声音信息包含语音分析状态切换指令;所述第三声音信息与所述第一声音信息在环境中混合;所述麦克风用于采集所述第三声音信息和第一声音信息的混合信息。所述的语音控制模组,其中,所述声音侦测模组还用于,确定所述第一声音信号或第二声音信号的位置信息;所述声音处理模组还用于,结合所述位置信息以及所述分析结果,调整控制指令指向的设备。所述的语音控制模组,其中,所述麦克风使用AUX接口连接,所述声音侦测模组通过连接AUX的串口,形成所述第一声音信息的输入端口。所述的语音控制模组,其中,在所述语音分析状态为声音情景分析状态时,所述声音侦测模组还用于,调整所述麦克风的响应范围,获取高于或等于20KHz的高频声音信号,并且暂停所述麦克风的回声消除功能;通过麦克风获取所述第三声音信息;所述声音处理模组还用于,输出第三声音信息,所述第三声音信息为高频声音信号。有益效果:本专利技术提供的语音控制方法及其控制模组,使用了二级的控制法,能够根据不同的情况,适应性的切换到不同的语音分析状态,由此在一个设备中能够集成多个功能,工作在各种不同的环境中,适应于一些要求较高,较为复杂的应用场景中。附图说明图1为本专利技术具体实施例的语音控制方法的方法流程图;图2为本专利技术具体实施例的麦克风设置示意图;图3为本专利技术具体实施例的语音控制系统的功能框图。具体实施方式本专利技术提供一种语音控制方法及其控制模组。为使本专利技术的目的、技术方案及效果更加清楚、明确,以下参照附图并举实施例对本专利技术进一步详细说明。应当理解,此处所描述的具体实施例仅用以解释本专利技术,并不用于限定本专利技术。如图1所示,为本专利技术具体实施例的语音控制方法。所述方法包括:100、通过麦克风采集来自环境的第一声音信息。所述第一声音信息是环境中的声音,例如用户发出的声音等,由麦克风进行采集,作为语音控制的初始来源。具体的,在步骤100中,可以使用AUX接口,连接所述麦克风并且通过连接AUX的串口,形成所述第一声音信息的输入端口。现有常用的麦克风是个微弱电压的输入,其采集信号与其他主动设备是无法混合匹配。在本实施例中,通过配置一个功率放大器的方式,使用aux的大电压特殊接口进行声音采集,并完成声音混成。利用放大器之间的阻抗匹配,使得各个声音的混成最优的组合。对于主机设备而言可以在固件上连接aux的串口,成为强力的输入端口,用以输入第一声音信息。通过这样的设置,可以极大的增加收音及分析的距离。200、接收来自其他声源设备的第二声音信息。其他声源设备可以使电视机、音响或者其他可能的发声设备。通过这样的方式,可以作为参考,避免其他声源设备掩盖了例如用户的语音信息,造成语音控制的误判或者干扰。300、根据所述第一声音信息和第二声音信息,切换为对应的语音分析状态。所述语音分析状态包括:采集频率为8KHz的通讯状态、采集频率为16KHz的声控状态以及采集频率为44KHz、8KHz或者16KHz的声音情景分析状态。在本控制方法中,可以集成有多种不同的语音分析状态,对应于不同的功能。具体的,所述不同采集频率下对应的详细的设置及实现功能可以如下表所示:400、在所述语音分析状态下,对所述第一声音信息和第二声音信息进行语音分析,输出相应的分析结果。语音分析状态下,具体使用的识别或者判断模式或者模型可以采用现有常用的方式,根据实际应用需求,将现有的一个本文档来自技高网...
一种语音控制方法及其控制模组

【技术保护点】
一种语音控制方法,其特征在于,包括:通过麦克风采集来自环境的第一声音信息;接收来自其他声源设备的第二声音信息;根据所述第一声音信息和第二声音信息,切换为对应的语音分析状态;所述语音分析状态包括:采集频率为8KHz的通讯状态、采集频率为16KHz的声控状态以及采集频率为44KHz、8KHz或者16KHz的声音情景分析状态;在所述语音分析状态下,对所述第一声音信息和第二声音信息进行语音分析,输出相应的分析结果;根据所述语音分析状态的分析结果,以预定的编码方式编码为第三声音信息并输出至所述环境中;并且输出对应的控制指令。

【技术特征摘要】
1.一种语音控制方法,其特征在于,包括:通过麦克风采集来自环境的第一声音信息;接收来自其他声源设备的第二声音信息;根据所述第一声音信息和第二声音信息,切换为对应的语音分析状态;所述语音分析状态包括:采集频率为8KHz的通讯状态、采集频率为16KHz的声控状态以及采集频率为44KHz、8KHz或者16KHz的声音情景分析状态;在所述语音分析状态下,对所述第一声音信息和第二声音信息进行语音分析,输出相应的分析结果;根据所述语音分析状态的分析结果,以预定的编码方式编码为第三声音信息并输出至所述环境中;并且输出对应的控制指令。2.根据权利要求1所述的方法,其特征在于,所述第三声音信息包含语音分析状态切换指令;所述第三声音信息与所述第一声音信息在环境中混合,并通过所述麦克风采集。3.根据权利要求1所述的方法,其特征在于,所述方法还包括:确定所述第一声音信号或第二声音信号的位置信息;结合所述位置信息以及所述分析结果,调整控制指令指向的设备。4.根据权利要求1所述的方法,其特征在于,所述方法还包括:使用AUX接口,连接所述麦克风;通过连接AUX的串口,形成所述第一声音信息的输入端口。5.根据权利要求1所述的方法,其特征在于,在所述语音分析状态为声音情景分析状态时,所述方法还包括:调整所述麦克风的响应范围,获取高于或等于20KHz的高频声音信号;输出第三声音信息,所述第三声音信息为高频声音信号;暂停所述麦克风的回声消除功能;通过麦克风获取所述第三声音信息。6.一种语音控制模组,其特征在于,包括:麦克风...

【专利技术属性】
技术研发人员:章放军李国俊
申请(专利权)人:中科深波科技杭州有限公司
类型:发明
国别省市:浙江,33

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1