语音控制方法和装置制造方法及图纸

技术编号:15395435 阅读:209 留言:0更新日期:2017-05-19 06:54
本发明专利技术公开了语音控制方法,应用于设有第一音频单元和第二音频单元的系统,语音控制方法包括以下步骤:获取第一音频单元输入的第一语音信息;识别第一语音信息中的语音指令;根据语音指令判断是否需要停止获取第二音频单元输入的第二语音信息;若需要,则停止获取第二音频单元输入的第二语音信息。通过在设有第一音频单元和第二音频单元的系统中,将第一音频单元作为语音识别引擎的音频输入源,第二音频单元作为通话录音等其他应用的输入源,实现在通话或者录音过程中可以并行识别语音指令。解决了业界普遍存在的在音视频通话中无法同时用语音并行处理语音指令的问题。

Voice control method and apparatus

The invention discloses a voice control method, system is applied to a first audio unit and the audio unit second, voice control method comprises the following steps: obtaining a first voice information unit first audio input; recognition of the first voice information in the speech instruction; according to the second voice information whether the voice command judgment need to stop to get input second audio unit; if necessary, stop second voice information acquisition unit second audio input. The system is provided with a first audio audio unit and the second unit, the first audio unit as an audio input source speech recognition engine, second audio unit as the input source calls to other applications, in the process of recording can parallel calls or recognize the voice commands. It solves the problem that voice commands can not be simultaneously processed by voice in audio and video communication.

【技术实现步骤摘要】
语音控制方法和装置
本专利技术涉及语音识别领域,特别涉及语音控制方法和装置。
技术介绍
现阶段,带有语音控制功能的电子装置一般来说硬件上只有一路麦克风或拾音器等作为音频输入单元,语音通话或者录入声音的时候,这一路麦克风会被占用,语音识别引擎程序就无法使用这一路麦克风进行语音指令的识别。现有技术通常是将语音引擎和视频通话或者语音录入写在一个应用里,这样语音先经过语音引擎识别,经过识别不是指令,则把语音透传给视频通话或者语音录入逻辑,但这样做有两个缺点:1.所有普通语音都要经过语音识别处理,再进行录入,语音有较大延时,很容易音视频不同步。2.需要定制视频通话或者语音录入程序,因为需要使用语音引擎提供的API来导入声音,机器人上无法使用普通的调用Android标准AudioRecord的第三方视频通话或者语音录入程序。
技术实现思路
为了克服现有技术的不足,本专利技术的目的在于提供语音控制方法和装置,其能解决现有技术通常是将语音引擎和视频通话或者语音录入写在一个应用里,所有普通语音都要经过语音识别处理,再进行录入,语音有较大延时,很容易音视频不同步,且需要定制视频通话或者语音录入程序的问题。本专利技术的目的采用以下技术方案实现:语音控制方法,应用于设有第一音频单元和第二音频单元的系统,所述语音控制方法包括以下步骤:获取所述第一音频单元输入的第一语音信息;识别所述第一语音信息中的语音指令;根据所述语音指令判断是否需要停止获取所述第二音频单元输入的第二语音信息;若需要,则停止获取所述第二音频单元输入的第二语音信息。优选的,所述获取所述第一音频单元输入的第一语音信息之前,还包括以下步骤:接收唤醒所述第一音频单元的唤醒指令;判断是否允许唤醒所述第一音频单元;若允许唤醒所述第一音频单元,则唤醒所述第一音频单元。优选的,所述若需要,则停止获取所述第二音频单元输入的第二语音信息,具体为:若需要停止获取所述第二音频单元输入的第二语音信息,则挂断音频通话或视频通话。优选的,所述获取所述第一音频单元输入的第一语音信息之前,还包括以下步骤:分配所述第一音频单元为语音识别引擎的输入源。另一方面,本专利技术还公开了语音控制装置,包括:第一获取单元,用于获取所述第一音频单元输入的第一语音信息;第二获取单元,用于获取所述第二音频单元输入的第二语音信息;识别单元,用于识别所述第一语音信息中的语音指令;第一判断单元,用于根据所述语音指令判断是否需要停止获取所述第二音频单元输入的第二语音信息;停止单元,用于若需要,则停止获取所述第二音频单元输入的第二语音信息。优选的,所述语音控制装置还包括:接收单元,用于接收唤醒所述第一音频单元的唤醒指令;第二判断单元,用于判断是否允许唤醒所述第一音频单元,若允许唤醒所述第一音频单元,则唤醒所述第一音频单元。优选的,所述停止单元包括:挂断单元,用于若需要停止获取所述第二音频单元输入的第二语音信息,则挂断音频通话或视频通话。优选的,所述语音控制装置还包括:分配单元,用于分配所述第一音频单元为语音识别引擎的输入源。优选的,所述第一音频单元和第二音频单元均包括麦克风、麦克风矩阵、麦克风接口、麦克风矩阵接口或无线音频输入装置。语音控制装置,包括:处理器以及用于存储处理器可执行的指令的存储器;所述处理器被配置为:获取所述第一音频单元输入的第一语音信息;识别所述第一语音信息中的语音指令;根据所述语音指令判断是否需要停止获取所述第二音频单元输入的第二语音信息;若需要,则停止获取所述第二音频单元输入的第二语音信息。相比现有技术,本专利技术的有益效果在于:通过在设有第一音频单元和第二音频单元的系统中,将第一音频单元作为语音识别引擎的音频输入源,第二音频单元作为通话录音等其他应用的输入源,实现在通话或者录音过程中可以并行识别语音指令。解决了业界普遍存在的在音视频通话中无法同时用语音并行处理语音指令(包括挂断音频通话)的问题。该方法无需定制音视频通话或录音程序,且避免了录音延迟,导致音视频不同步的问题。附图说明图1是本专利技术实施例一提供的语音控制方法的流程示意图。图2是本专利技术实施例二提供的语音控制方法的流程示意图。图3是本专利技术实施例三提供的语音控制装置的结构示意图。图4是本专利技术实施例四提供的语音控制装置的结构示意图。具体实施方式上述说明仅是本专利技术技术方案的概述,为了能够更清楚了解本专利技术的技术手段,而可依照说明书的内容予以实施,并且为了让本专利技术的上述和其他目的、特征和优点能够更明显易懂,以下特举较佳实施例,并配合附图,详细说明如下。实施例一:如图1所示的语音控制方法,应用于设有第一音频单元和第二音频单元的系统。针对语音通话和录音功能占有音频输入单元,导致语音识别引擎无法使用麦克风等音频输入单元进行语音指令识别的缺点,在硬件上多引入了一路音频输入单元,将语音识别引擎的声源指定为多加的这一路音频输入单元,在通话或者录音过程中可以并行识别语音指令。具体的,在硬件上多引入一路麦克风源,可以通过I2S(Inter—ICSound)总线接入,该总线专责于音频设备之间的数据传输,广泛应用于各种多媒体系统。它采用了沿独立的导线传输时钟与数据信号的设计,通过将数据和时钟信号分离,避免了因时差诱发的失真,为用户节省了购买抵抗音频抖动的专业设备的费用。音频输入单元可以包括麦克风、麦克风矩阵、麦克风接口、麦克风矩阵接口或无线音频输入装置。所述语音控制方法包括以下步骤:S110,获取所述第一音频单元输入的第一语音信息。预先已经设定第一音频单元为语音识别引擎的音频输入源,第一语音信息作为语音识别引擎进行语音识别的对象。S120,识别所述第一语音信息中的语音指令。语音识别引擎预先存储有语音指令和与语音指令相对应的应用、处理数据、做出动作等反应机制。处理器、控制器中的语音识别引擎或者独立的语音识别芯片对第一语音信息做处理,识别第一语音信息中是否有与预先存储的语音指令对应的信息,若有,则进行步骤S130;若没有,则继续获取所述第一音频单元输入的第一语音信息。S130,根据所述语音指令判断是否需要停止获取所述第二音频单元输入的第二语音信息。语音识别引擎中预先存储的语音指令,有些优先级较高,或者第二音频单元输入第二语音信息会干扰语音指令相应的反应机制,就需要停止获取所述第二音频单元输入的第二语音信息。当然也包括第一语音信息中的语音指令相应的反应机制就是停止获取所述第二音频单元输入的第二语音信息这种情况。S140,若需要,则停止获取所述第二音频单元输入的第二语音信息。具体的,是通过向正在使用第二音频单元的应用如音视频通话、录音等发送关闭或中止命令,停止第二音频单元的输入。所述若需要,则停止获取所述第二音频单元输入的第二语音信息,具体为:若需要停止获取所述第二音频单元输入的第二语音信息,则挂断音频通话或视频通话,音频通话也可是录音过程,视频通话也可以是录像过程。本实施例提供的语音控制方法,通过在设有第一音频单元和第二音频单元的系统中,将第一音频单元作为语音识别引擎的音频输入源,第二音频单元作为通话录音等其他应用的输入源,实现在通话或者录音过程中可以并行识别语音指令。解决了业界普遍存在的在音视频通话中无法同时用语音并行处理语音指令(包括挂断音频通话)的问题。该方法无需定制音视频通话或录音本文档来自技高网...
语音控制方法和装置

【技术保护点】
语音控制方法,其特征在于,应用于设有第一音频单元和第二音频单元的系统,所述语音控制方法包括以下步骤:获取所述第一音频单元输入的第一语音信息;识别所述第一语音信息中的语音指令;根据所述语音指令判断是否需要停止获取所述第二音频单元输入的第二语音信息;若需要,则停止获取所述第二音频单元输入的第二语音信息。

【技术特征摘要】
1.语音控制方法,其特征在于,应用于设有第一音频单元和第二音频单元的系统,所述语音控制方法包括以下步骤:获取所述第一音频单元输入的第一语音信息;识别所述第一语音信息中的语音指令;根据所述语音指令判断是否需要停止获取所述第二音频单元输入的第二语音信息;若需要,则停止获取所述第二音频单元输入的第二语音信息。2.如权利要求1所述的语音控制方法,其特征在于:所述获取所述第一音频单元输入的第一语音信息之前,还包括以下步骤:接收唤醒所述第一音频单元的唤醒指令;判断是否允许唤醒所述第一音频单元;若允许唤醒所述第一音频单元,则唤醒所述第一音频单元。3.如权利要求1所述的语音控制方法,其特征在于:所述若需要,则停止获取所述第二音频单元输入的第二语音信息,具体为:若需要停止获取所述第二音频单元输入的第二语音信息,则挂断音频通话或视频通话。4.如权利要求1-3中任一项所述的语音控制方法,其特征在于:所述获取所述第一音频单元输入的第一语音信息之前,还包括以下步骤:分配所述第一音频单元为语音识别引擎的输入源。5.语音控制装置,其特征在于,包括:第一获取单元,用于获取所述第一音频单元输入的第一语音信息;第二获取单元,用于获取所述第二音频单元输入的第二语音信息;识别单元,用于识别所述第一语音信息中的语音指令;第一判断单...

【专利技术属性】
技术研发人员:王嘉晋熊友军
申请(专利权)人:深圳市优必选科技有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1