一种语音控制方法及其控制模组技术

技术编号：16588571 阅读：34 留言：0更新日期：2017-11-18 16:28

本发明专利技术公开了一种语音控制方法及其控制模组。所述方法包括：通过麦克风采集来自环境的第一声音信息；接收来自其他声源设备的第二声音信息；根据所述第一声音信息和第二声音信息，切换为对应的语音分析状态；所述语音分析状态包括：采集频率为8KHz的通讯状态、采集频率为16KHz的声控状态以及采集频率为44KHz、8KHz或者16KHz的声音情景分析状态；在所述语音分析状态下，对所述第一声音信息和第二声音信息进行语音分析，输出相应的分析结果；根据所述语音分析状态的分析结果，以预定的编码方式编码为第三声音信息并输出至所述环境中；并且输出对应的控制指令。

Speech control method and control module thereof

The invention discloses a speech control method and a control module thereof. The method comprises the following steps: collecting first sound information from the environment through a microphone; receives from other sound source equipment second sound information; according to the first information and the second voice sound information, switch to the corresponding speech analysis; the speech analysis include acquisition frequency acquisition 8KHz communication state, the frequency of sound the state of 16KHz and the acquisition frequency is 44KHz, 8KHz or 16KHz sound scene analysis; in the analysis of the voice condition, the voice of the first sound information and second sound information, output the corresponding analysis results; according to the analysis results of the voice encoding in a predetermined encoding third sound information and output to the environment and output the corresponding control instructions.

全部详细技术资料下载

【技术实现步骤摘要】
一种语音控制方法及其控制模组
本专利技术涉及声音控制
，尤其涉及一种语音控制方法及其控制模组。
技术介绍
语音控制技术的发展突飞猛进。尤其在手机的应用上，开始被多家大厂使用。人耳朵对声音的频率是20hz到在20khz以下，所以大部分的麦克风对于接收声音的范围都界定在20khz以下。在声音信号的采集频率上，可能在每秒8k或16kHz的频率下工作。另外，在语音控制中，除了人语音辨识以外，对于声音情景的分析，也是一个热门研究话题。声音情景分析，主要是对于周遭的声音内容，做一个内容情境分析。例如，人走路声，咳嗽，婴儿哭声，睡觉时的鼾声等。在市面上，有名的声控设备，例如，亚马逊的echo，京东的叮咚叮咚，都是桌上型的语音声控设备。其主要功能就是声控。其设备在有其他声源的环境下，就无法辨认，例如电视机的声音，音响的音乐等。这些主动设备都会造成辨识的问题。另外，这些市面上的产品除了声控之外，并未对于其他类声音，做任何分析。而对于声音情境的分析，目前有些是做在手机APP端，例如，对于婴儿哭声的分析，使用者需截取声音，送至云端。由云端做出分析后，再传回手机。另一种，譬如，婴儿哭声侦测警报器。这类产品，主要是针对分贝的大小，做了一些简单分析。在现有的语音控制中，全部使用的都是单一功能的技术及产品。例如，语音控制产品，声音触发器，声音侦测器去侦测玻璃破碎声，做为防盗之用。由于
的跨行或者集成技术的门槛的原因，其都是单一的方案。例如，不同的声音控制会要求不同的采集频率。另外，为了辨识准确，往往会消掉一些不同频段的讯号。因此，现有技术还有待发展。
技术实现思路
鉴于上述现有...
一种语音控制方法及其控制模组

【技术保护点】
一种语音控制方法，其特征在于，包括：通过麦克风采集来自环境的第一声音信息；接收来自其他声源设备的第二声音信息；根据所述第一声音信息和第二声音信息，切换为对应的语音分析状态；所述语音分析状态包括：采集频率为8KHz的通讯状态、采集频率为16KHz的声控状态以及采集频率为44KHz、8KHz或者16KHz的声音情景分析状态；在所述语音分析状态下，对所述第一声音信息和第二声音信息进行语音分析，输出相应的分析结果；根据所述语音分析状态的分析结果，以预定的编码方式编码为第三声音信息并输出至所述环境中；并且输出对应的控制指令。

【技术特征摘要】
1.一种语音控制方法，其特征在于，包括：通过麦克风采集来自环境的第一声音信息；接收来自其他声源设备的第二声音信息；根据所述第一声音信息和第二声音信息，切换为对应的语音分析状态；所述语音分析状态包括：采集频率为8KHz的通讯状态、采集频率为16KHz的声控状态以及采集频率为44KHz、8KHz或者16KHz的声音情景分析状态；在所述语音分析状态下，对所述第一声音信息和第二声音信息进行语音分析，输出相应的分析结果；根据所述语音分析状态的分析结果，以预定的编码方式编码为第三声音信息并输出至所述环境中；并且输出对应的控制指令。2.根据权利要求1所述的方法，其特征在于，所述第三声音信息包含语音分析状态切换指令；所述第三声音信息与所述第一声音信息在环境中混合，并通过所述麦克风采集。3.根据权利要求1所述的方法，其特征在于，所述方法还包括：确定所述第一声音信号或第二声音信号的位置信息；结合所述位置信息以及所述分析结果，调整控制指令指向的设备。4.根据权利要求1所述的方法，其特征在于，所述方法还包括：使用AUX接口，连接所述麦克风；通过连接AUX的串口，形成所述第一声音信息的输入端口。5.根据权利要求1所述的方法，其特征在于，在所述语音分析状态为声音情景分析状态时，所述方法还包括：调整所述麦克风的响应范围，获取高于或等于20KHz的高频声音信号；输出第三声音信息，所述第三声音信息为高频声音信号；暂停所述麦克风的回声消除功能；通过麦克风获取所述第三声音信息。6.一种语音控制模组，其特征在于，包括：麦克风...

【专利技术属性】
技术研发人员：章放军，李国俊，
申请(专利权)人：中科深波科技杭州有限公司，
类型：发明
国别省市：浙江,33

全部详细技术资料下载我是这个专利的主人