The invention discloses a speech control method and a control module thereof. The method comprises the following steps: collecting first sound information from the environment through a microphone; receives from other sound source equipment second sound information; according to the first information and the second voice sound information, switch to the corresponding speech analysis; the speech analysis include acquisition frequency acquisition 8KHz communication state, the frequency of sound the state of 16KHz and the acquisition frequency is 44KHz, 8KHz or 16KHz sound scene analysis; in the analysis of the voice condition, the voice of the first sound information and second sound information, output the corresponding analysis results; according to the analysis results of the voice encoding in a predetermined encoding third sound information and output to the environment and output the corresponding control instructions.
【技术实现步骤摘要】
一种语音控制方法及其控制模组
本专利技术涉及声音控制
,尤其涉及一种语音控制方法及其控制模组。
技术介绍
语音控制技术的发展突飞猛进。尤其在手机的应用上,开始被多家大厂使用。人耳朵对声音的频率是20hz到在20khz以下,所以大部分的麦克风对于接收声音的范围都界定在20khz以下。在声音信号的采集频率上,可能在每秒8k或16kHz的频率下工作。另外,在语音控制中,除了人语音辨识以外,对于声音情景的分析,也是一个热门研究话题。声音情景分析,主要是对于周遭的声音内容,做一个内容情境分析。例如,人走路声,咳嗽,婴儿哭声,睡觉时的鼾声等。在市面上,有名的声控设备,例如,亚马逊的echo,京东的叮咚叮咚,都是桌上型的语音声控设备。其主要功能就是声控。其设备在有其他声源的环境下,就无法辨认,例如电视机的声音,音响的音乐等。这些主动设备都会造成辨识的问题。另外,这些市面上的产品除了声控之外,并未对于其他类声音,做任何分析。而对于声音情境的分析,目前有些是做在手机APP端,例如,对于婴儿哭声的分析,使用者需截取声音,送至云端。由云端做出分析后,再传回手机。另一种,譬如,婴儿哭声侦测警报器。这类产品,主要是针对分贝的大小,做了一些简单分析。在现有的语音控制中,全部使用的都是单一功能的技术及产品。例如,语音控制产品,声音触发器,声音侦测器去侦测玻璃破碎声,做为防盗之用。由于
的跨行或者集成技术的门槛的原因,其都是单一的方案。例如,不同的声音控制会要求不同的采集频率。另外,为了辨识准确,往往会消掉一些不同频段的讯号。因此,现有技术还有待发展。
技术实现思路
鉴于上述现有 ...
【技术保护点】
一种语音控制方法,其特征在于,包括:通过麦克风采集来自环境的第一声音信息;接收来自其他声源设备的第二声音信息;根据所述第一声音信息和第二声音信息,切换为对应的语音分析状态;所述语音分析状态包括:采集频率为8KHz的通讯状态、采集频率为16KHz的声控状态以及采集频率为44KHz、8KHz或者16KHz的声音情景分析状态;在所述语音分析状态下,对所述第一声音信息和第二声音信息进行语音分析,输出相应的分析结果;根据所述语音分析状态的分析结果,以预定的编码方式编码为第三声音信息并输出至所述环境中;并且输出对应的控制指令。
【技术特征摘要】
1.一种语音控制方法,其特征在于,包括:通过麦克风采集来自环境的第一声音信息;接收来自其他声源设备的第二声音信息;根据所述第一声音信息和第二声音信息,切换为对应的语音分析状态;所述语音分析状态包括:采集频率为8KHz的通讯状态、采集频率为16KHz的声控状态以及采集频率为44KHz、8KHz或者16KHz的声音情景分析状态;在所述语音分析状态下,对所述第一声音信息和第二声音信息进行语音分析,输出相应的分析结果;根据所述语音分析状态的分析结果,以预定的编码方式编码为第三声音信息并输出至所述环境中;并且输出对应的控制指令。2.根据权利要求1所述的方法,其特征在于,所述第三声音信息包含语音分析状态切换指令;所述第三声音信息与所述第一声音信息在环境中混合,并通过所述麦克风采集。3.根据权利要求1所述的方法,其特征在于,所述方法还包括:确定所述第一声音信号或第二声音信号的位置信息;结合所述位置信息以及所述分析结果,调整控制指令指向的设备。4.根据权利要求1所述的方法,其特征在于,所述方法还包括:使用AUX接口,连接所述麦克风;通过连接AUX的串口,形成所述第一声音信息的输入端口。5.根据权利要求1所述的方法,其特征在于,在所述语音分析状态为声音情景分析状态时,所述方法还包括:调整所述麦克风的响应范围,获取高于或等于20KHz的高频声音信号;输出第三声音信息,所述第三声音信息为高频声音信号;暂停所述麦克风的回声消除功能;通过麦克风获取所述第三声音信息。6.一种语音控制模组,其特征在于,包括:麦克风...
【专利技术属性】
技术研发人员:章放军,李国俊,
申请(专利权)人:中科深波科技杭州有限公司,
类型:发明
国别省市:浙江,33
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。