一种语音控制方法和控制设备技术

技术编号:14558046 阅读:58 留言:0更新日期:2017-02-05 12:29
本发明专利技术实施例提供一种语音控制方法和控制设备,涉及通信领域,能够在语音控制场景下接收到其他会场的声音信息,并简化了会议控制方式,提升了语音识别的效果。其方法为:通过接收本地会场的语音控制请求信号,启用语音控制模式,对本地会场的语音信号和远端会场的语音信号进行双讲检测,获取双讲检测结果,双讲检测结果为近端单讲,或远端单讲,或双讲,根据双讲检测结果,确定本地会场中扬声器的音量,并在双讲检测结果为近端单讲或所双讲时,对本地会场获取的语音数据进行语音识别,获取语音识别结果,进而从语音识别结果中获取会控操作指令,并根据会控操作指令执行相应的会控操作。本发明专利技术实施例用于会议中进行语音控制。

Voice control method and control device

The embodiment of the invention provides a voice control method and control device, relates to the field of communication, can receive voice information of other venue in the speech control scenario, and simplifies the conference control, improve the quality of speech recognition. The method is as follows: the control request signal through the voice receiving local venue, enable voice control mode of double talk detection on the local venue of the speech signal and the distal site of speech signal, obtain the double talk detection results, double talk detection results for the proximal or distal single, single, or double talk, according to the double talk the detection results, determine the speaker volume in local venue, and double talk detection results for single or double proximal speak speak, speech recognition on speech data acquisition of the local venue, get the speech recognition results, and then obtain control operation instructions from the speech recognition results, and will execute the corresponding control instructions according to the operation control. The embodiment of the invention is used for voice control in the meeting.

【技术实现步骤摘要】

本专利技术涉及通信领域,尤其涉及一种语音控制方法和控制设备
技术介绍
在现有会议电话场景下,可以通过按键、Web等实现会控操作,解决了会议电话在会议中实现语音会控不便的问题,但是操作起来不太方便。语音识别技术可以使得语音控制简化复杂的会议控制方式,例如Cisco(思科)有语音助手类的产品,但主要用于会议互通之前,辅助完成语音呼叫,查看邮件等操作,并没有在会议中进行语音控制的方案。另外,非本地会场的声音会影响语音识别的效果,而在现有的技术方案中,大多在进行语音控制的时候,本地会场可以通过按键或者拨号等触发方式,向MCU(MultipointControlUnit,多点控制单元)请求进入语音识别模式,MCU将本地会场闭音,即停止发送其他会场的声音到本地会场,终止IVR(InteractiveVoiceResponse,交互式语音应答)等语音相关操作,本地会场再接收控制语音数据到MCU的语音识别单元,该语音识别单元进行语音识别后使得MCU执行相应的会控操作,在此过程中,MCU会把非本地会场送入的声音屏蔽,即采用对本地扬声器闭音的方式,以减少其他会场对本地会场语音控制的干扰。上述实现过程存在的问题是,在这种会控模式下,将无法接收到非本地会场的任何声音,本地会场的用户可能就会获取不到关键会议信息。
技术实现思路
本专利技术的实施例提供一种语音控制方法和控制设备,能够在语音控制场景下接收到其他会场的声音信息,并简化了会议控制方式,提升了语音识别的效果。为达到上述目的,本专利技术的实施例采用如下技术方案:第一方面,提供一种语音控制方法,包括:接收本地会场的语音控制请求信号,启用语音控制模式;对所述本地会场的语音信号和远端会场的语音信号进行双讲检测,获取双讲检测结果,所述双讲检测结果为近端单讲,或远端单讲,或双讲;根据所述双讲检测结果,确定所述本地会场中扬声器的音量,并在所述双讲检测结果为所述近端单讲或所述双讲时,对所述本地会场获取的语音数据进行语音识别,获取语音识别结果;从所述语音识别结果中获取会控操作指令,并根据所述会控操作指令执行相应的会控操作。结合第一方面,在第一方面的第一种可能实现的方式中,所述通过对所述本地会场的语音信号和远端会场的语音信号进行双讲检测,获取双讲检测结果包括:判断所述本地会场和所述远端会场的回声能量是否大于所述本地会场和所述远端会场的回声抵消输出能量的两倍与第一阈值的和;若所述回声能量不大于所述回声抵消输出能量的两倍与所述第一阈值的和,根据所述回声能量是否小于所述本地会场的背景噪声能量的两倍与第二阈值的和判断所述本地会场是否讲话;若所述回声能量不小于所述背景噪声能量的两倍与所述第二阈值的和,则所述本地会场讲话,并根据所述远端会场的参考信号是否小于通过所述语音活动侦测获取的远端噪音能量的两倍与第三阈值的和判断所述远端会场是否讲话,所述参考信号为所述远端会场的语音信号经网络传输还未经过所述本地会场的扬声器播放的语音信号;若所述参考信号小于所述远端噪音能量的两倍与第三阈值的和,则所述远端会场没有讲话,所述双讲检测结果为所述近端单讲;若所述参考信号不小于所述远端噪音能量的两倍与第三阈值的和,则所述远端会场讲话,所述双讲检测结果为所述双讲。结合第一方面或第一方面的第一种可能实现的方式,在第一方面的第二种可能实现的方式中,所述通过对所述本地会场的语音信号和远端会场的语音信号进行双讲检测,获取双讲检测结果还包括:若所述回声能量大于所述回声抵消输出能量的两倍与所述第一阈值的和,根据所述回声能量是否小于所述背景噪声能量的两倍与第二阈值的和判断所述本地会场是否讲话;若所述回声能量小于所述背景噪声能量的两倍与第二阈值的和,则所述本地会场没有讲话,所述双讲检测结果为所述远端单讲。结合第一方面或第一方面的第二种可能实现的方式,在第一方面的第三种可能实现的方式中,在判断所述本地会场和所述远端会场的回声能量是否大于所述本地会场和所述远端会场的回声抵消输出能量的两倍与第一阈值的和之前,所述方法还包括:对所述本地会场中麦克风采集的语音信号进行混音分离,以使得所述本地会场的语音信号不传输至所述远端会场;根据所述本地会场的语音信号幅度获取所述本地会场和所述远端会场的回声能量大小,并通过语音活动侦测获取所述本地会场的背景噪声能量;通过自适应滤波器中的前台滤波器对所述本地会场和所述远端会场的回声信号进行自适应滤波,将所述回声信号乘以滤波系数,所述回声信号乘以所述滤波系数后的回声信号对应的能量为滤波后的回声抵消输出能量。结合第一方面或第一方面的第三种可能实现的方式,在第一方面的第四种可能实现的方式中,所述根据所述双讲检测结果,确定所述本地会场中扬声器的音量,并在所述双讲检测结果为所述近端单讲和所述双讲时,对所述本地会场获取的语音数据进行语音识别,获取语音识别结果包括:若所述双讲检测结果为所述远端单讲,则保持所述本地会场中扬声器的音量不变;若所述双讲检测结果为所述近端单讲,则保持所述本地会场中扬声器的音量不变,并将所述本地会场获取的近端单讲时的语音数据发送至语音识别器进行语音识别,获取所述语音识别结果;若所述双讲检测结果为所述双讲,则将所述扬声器的音量降低到第四阈值,并将所述本地会场获取的双讲时的语音数据发送至所述语音识别器进行语音识别,获取所述语音识别结果。结合第一方面或第一方面的第四种可能实现的方式,在第一方面的第五种可能实现的方式中,所述获取所述语音识别结果包括:若所述双讲检测结果为所述近端单讲,则所述语音识别器将所述近端单讲时的语音数据与控制命令集进行比较,若所述近端单讲时的语音数据与所述控制命令集匹配,则获取所述语音识别结果;若所述双讲检测结果为所述双讲,则对所述双讲时远端会场的语音数据进行回声抵消,并通过所述语音识别器将回声抵消后的语音数据与所述控制命令集进行比较,若所述回声抵消后的语音数据与所述控制命令集匹配,则获取所述语音识别结果。结合第一方面或第一方面的第一种可能实现的方式至第五种可能实现的方式,在第一方面的第六种可能实现的方式中,所述方法还包括:若所述前台滤波器对所述回声信号进行衰减时的连续N帧的语音分贝数达到第五阈值,则将所述前台滤波器的滤波系数备份至所述自适应滤波器的后台滤波器中;通过所述后台本文档来自技高网...

【技术保护点】
一种语音控制方法,其特征在于,包括:接收本地会场的语音控制请求信号,启用语音控制模式;对所述本地会场的语音信号和远端会场的语音信号进行双讲检测,获取双讲检测结果,所述双讲检测结果为近端单讲,或远端单讲,或双讲;根据所述双讲检测结果,确定所述本地会场中扬声器的音量,并在所述双讲检测结果为所述双讲时,将所述本地会场的扬声器的音量降低到预设的音量阈值,并对所述本地会场获取的语音数据进行语音识别,获取语音识别结果;从所述语音识别结果中获取会控操作指令,并根据所述会控操作指令执行相应的会控操作。

【技术特征摘要】
1.一种语音控制方法,其特征在于,包括:
接收本地会场的语音控制请求信号,启用语音控制模式;
对所述本地会场的语音信号和远端会场的语音信号进行双讲检
测,获取双讲检测结果,所述双讲检测结果为近端单讲,或远端单讲,
或双讲;
根据所述双讲检测结果,确定所述本地会场中扬声器的音量,并
在所述双讲检测结果为所述双讲时,将所述本地会场的扬声器的音量
降低到预设的音量阈值,并对所述本地会场获取的语音数据进行语音
识别,获取语音识别结果;
从所述语音识别结果中获取会控操作指令,并根据所述会控操作
指令执行相应的会控操作。
2.根据权利要求1所述的方法,其特征在于,所述预设的音量阈
值所属的范围为5dB(分贝)至10dB。
3.根据权利要求1或2所述的方法,其特征在于,所述对所述本
地会场获取的语音数据进行语音识别具体包括:将所述本地会场获取
的语音数据发送至语音识别器进行语音识别。
4.根据权利要求1或2所述的方法,其特征在于,所述对所述本
地会场的语音信号和远端会场的语音信号进行双讲检测,获取双讲检
测结果包括:
判断所述本地会场和所述远端会场的回声能量是否大于所述本地
会场和所述远端会场的回声抵消输出能量的两倍与第一阈值的和;
若所述回声能量不大于所述回声抵消输出能量的两倍与所述第一
阈值的和,根据所述回声能量是否小于所述本地会场的背景噪声能量
的两倍与第二阈值的和判断所述本地会场是否讲话;
若所述回声能量不小于所述背景噪声能量的两倍与所述第二阈值
的和,则所述本地会场讲话,并根据所述远端会场的参考信号是否小
于通过所述语音活动侦测获取的远端噪音能量的两倍与第三阈值的和
判断所述远端会场是否讲话,所述参考信号为所述远端会场的语音信
号经网络传输还未经过所述本地会场的扬声器播放的语音信号;
若所述参考信号小于所述远端噪音能量的两倍与第三阈值的和,
则所述远端会场没有讲话,所述双讲检测结果为所述近端单讲;
若所述参考信号不小于所述远端噪音能量的两倍与第三阈值的
和,则所述远端会场讲话,所述双讲检测结果为所述双讲。
5.根据权利要求4所述的方法,其特征在于,所述通过对所述本
地会场的语音信号和远端会场的语音信号进行双讲检测,获取双讲检
测结果还包括:
若所述回声能量大于所述回声抵消输出能量的两倍与所述第一阈
值的和,根据所述回声能量是否小于所述背景噪声能量的两倍与第二
阈值的和判断所述本地会场是否讲话;
若所述回声能量小于所述背景噪声能量的两倍与第二阈值的和,
则所述本地会场没有讲话,所述双讲检测结果为所述远端单讲。
6.根据权利要求5所述的方法,其特征在于,在判断所述本地会
场和所述远端会场的回声能量是否大于所述本地会场和所述远端会场
的回声抵消输出能量的两倍与第一阈值的和之前,所述方法还包括:
对所述本地会场中麦克风采集的语音信号进行混音分离,以使得
所述本地会场的语音信号不传输至所述远端会场;
根据所述本地会场的语音信号幅度获取所述本地会场和所述远端
会场的回声能量大小,并通过语音活动侦测获取所述本地会场的背景
噪声能量;
通过自适应滤波器中的前台滤波器对所述本地会场和所述远端会
场的回声信号进行自适应滤波,将所述回声信号乘以滤波系数,所述
回声信号乘以所述滤波系数后的回声信号对应的能量为滤波后的回声
抵消输出能量。
7.根据权利要求1所述的方法,其特征在于,所述获取语音识别
结果包括:
对所述双讲时远端会场的语音数据进行回声抵消,并通过所述语
音识别器将回声抵消后的语音数据与所述控制命令集进行比较,若所
述回声抵消后的语音数据与所述控制命令集匹配,则获取所述语音识
别结果。
8.根据权利要求6所述的方法,其特征在于,所述方法还包括:
若所述前台滤波器对所述回声信号进行衰减时的连续N帧的语音
分贝数达到第五阈值,则将所述前台滤波器的滤波系数备份至所述自
适应滤波器的后台滤波器中;
通过所述后台滤波器将所述回声信号进行自适应滤波,将所述回
声信号乘以所述滤波系数获取衰减后的回声抵消输出能量。
9.一种控制设备,其特征在于,包括:
会控启动单元,用于接收本地会场的语音控制请求信号,启用语
音控制模式;
双讲检测单元,用于对所述本地会场的语音信号和远端会场的语
音信号进行双讲检测,获取双讲检测结果,所述双讲检测结...

【专利技术属性】
技术研发人员:刘智辉乔宁博
申请(专利权)人:华为技术有限公司
类型:发明
国别省市:广东;44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1