一种音频信号处理方法、装置、介质和设备制造方法及图纸

技术编号:22649800 阅读:24 留言:0更新日期:2019-11-26 18:12
本发明专利技术涉及语音识别领域,尤其涉及一种音频信号处理方法、装置、介质和设备。针对在智能机顶盒视频播放场景下,对语音指令信号的干扰主要来自于电视机播放出的音频的特点,创造性地提出,在接收到包括语音指令和当前电视播放的电视节目源对应的音频信号的第一音频信号时,将智能机顶盒发送的所述电视节目源对应的第二音频信号作为当前电视播放的电视节目源对应的音频信号,并可以将第二音频信号从第一音频信号中去除,以得到所述语音指令对应的第三音频信号,从而有效去除电视音频对语音指令的干扰,较大程度地提高语音指令的识别率。

An audio signal processing method, device, medium and equipment

The invention relates to the field of speech recognition, in particular to an audio signal processing method, device, medium and device. In view of the characteristics that the interference to the voice instruction signal mainly comes from the audio broadcast by the television in the video broadcast scenario of the intelligent set-top box, it is creatively proposed that when receiving the first audio signal of the audio signal including the voice instruction and the audio signal corresponding to the current TV program source, the second audio signal corresponding to the TV program source sent by the intelligent set-top box is It is the audio signal corresponding to the current TV program source broadcast by TV, and the second audio signal can be removed from the first audio signal to obtain the third audio signal corresponding to the voice instruction, so as to effectively remove the interference of TV audio to the voice instruction and greatly improve the recognition rate of the voice instruction.

【技术实现步骤摘要】
一种音频信号处理方法、装置、介质和设备
本专利技术涉及语音识别领域,尤其涉及一种音频信号处理方法、装置、介质和设备。
技术介绍
近年来随着人工智能技术的发展,越来越多的语音交互产品出现在家庭中,比如智能音箱、智能机顶盒等。用户在使用智能机顶盒时,可以不再使用遥控器进行智能机顶盒控制,转而使用语音进行控制。在最新研发的智能机顶盒产品中,完全放弃了遥控器,全部使用语音进行控制。但是,智能机顶盒放置的位置通常与电视机很近,当播放视频的时候,电视的音频会对用户说出的指令造成很大的干扰,甚至产生负信噪比的情况,导致用户语音指令的识别率降低。现有技术方案主要采取以下两种方法来提高对智能机顶盒语音指令的识别率:方法一、利用传统的降噪算法对智能机顶盒接收到的信号进行降噪,比如维纳滤波器、自适应滤波器、谱减法等。方法二、利用麦克风阵列接收多路语音信号,再利用接收到的多路信号间的相位关系进行干扰信号的消除。上述方法一在音频信号信噪比较高的场景下应用较好,但在视频播放场景下,音频信号的信噪比很低,甚至为负值,此种方法的降噪效果一般,无法有效提高语音指令识别率。在上述方法二中,因为受到电视机喇叭位置的限制,对智能机顶盒摆放位置和摆放方向都有一定的要求。如果智能机顶盒摆放位置或摆放方向不正确,这种处理方式不能有效消除电视音频的干扰。而且,即使摆放位置和摆放方向都正确,由于智能机顶盒接收到的电视音频较大,降噪效果也不理想,语音指令识别率提高有限。
技术实现思路
本专利技术实施例提供一种音频信号处理方法、装置、介质和设备,用于提高智能机顶盒语音指令的识别率。一种音频信号处理方法,所述方法包括:在接收到第一音频信号时,所述第一音频信号中包括语音指令和当前电视播放的电视节目源对应的音频信号,确定智能机顶盒发送的所述电视节目源对应的第二音频信号;从所述第一音频信号中,将所述第二音频信号去除,得到所述语音指令对应的第三音频信号。一种音频信号处理装置,所述装置包括麦克输入模块、节目源信号确定模块、存储模块、控制模块和处理模块,其中:所述麦克输入模块,用于接收到第一音频信号,所述第一音频信号中包括语音指令和当前电视播放的电视节目源对应的音频信号;所述节目源信号确定模块,用于确定所述麦克输入模块接收到第一音频信号时,智能机顶盒发送的所述电视节目源对应的第二音频信号;所述存储模块,用于存储所述第一音频信号和所述第二音频信号;所述控制模块,用于接收所述麦克输入模块发送的系统指令,该系统指令为所述麦克输入模块接收到第一音频信号时发送的,根据所述系统指令通知所述处理模块从所述存储模块中获得所述第一音频信号和所述第二音频信号;所述处理模块,用于从所述第一音频信号中,将所述第二音频信号去除,得到所述语音指令对应的第三音频信号。一种非易失性计算机存储介质,所述计算机存储介质存储有可执行程序,该可执行程序被处理器执行实现如上所述方法的步骤。一种音频信号处理设备,包括收发器、总线接口、存储器、处理器及存储在存储器上的计算机程序,所述处理器执行所述程序时实现:在所述收发器接收到第一音频信号时,所述第一音频信号中包括语音指令和当前电视播放的电视节目源对应的音频信号,确定智能机顶盒发送的所述电视节目源对应的第二音频信号;从所述第一音频信号中,将所述第二音频信号去除,得到所述语音指令对应的第三音频信号。本专利技术实施例针对在智能机顶盒视频播放场景下,对语音指令信号的干扰主要来自于电视机播放出的音频的特点,创造性地提出,在接收到包括语音指令和当前电视播放的电视节目源对应的音频信号的第一音频信号时,将智能机顶盒发送的所述电视节目源对应的第二音频信号作为当前电视播放的电视节目源对应的音频信号,并可以将第二音频信号从第一音频信号中去除,以得到所述语音指令对应的第三音频信号,从而有效去除电视音频对语音指令的干扰,较大程度地提高语音指令的识别率。附图说明图1为本专利技术实施例一提供的音频信号处理方法的步骤流程图;图2为本专利技术实施例一提供的音频信号处理流程示意图;图3为本专利技术实施例二提供的音频信号处理装置的结构示意图;图4为本专利技术实施例四提供的音频信号处理设备的结构示意图。具体实施方式在智能机顶盒视频播放场景下,用户使用语音指令对智能机顶盒进行控制时,由于智能机顶盒通常放置在电视旁边,电视发出的音频信号的能量很高,会对语音指令音频信号造成极大的干扰。如果能得到电视机的音频信号,则可以直接作为参考信号在智能机顶盒接收到的包括用户语音指令的音频信号中去除掉,从而消除掉电视音频对用户语音指令的干扰,提高语音指令的识别率。在实际应用中,由于无法直接得到电视机的音频信号,因此,本专利技术实施例提出,可以确定智能机顶盒发送的电视节目源对应的音频信号,并可以将其作为参考信号进行消除。较优的,考虑到电视播放该电视节目源时,可能会对音频信号进行个性化的调整,还可以进一步通过智能机顶盒发送的电视节目源对应的音频信号,预测出电视播放该电视节目源时对应的音频信号,并将此作为参考信号在智能机顶盒接收到的包括用户语音指令的音频信号中去除掉,以更好地消除掉电视音频对用户语音指令的干扰,进一步提高语音指令的识别率。更优的,还可以进一步通过降噪算法,对消除电视音频干扰之后得到的音频信号进行降噪。而由于在音频信号中去除了视频播放的音频,降噪效果也得到提升,从而可以进一步提高用户语音指令的识别率。下面结合说明书附图对本专利技术实施例作进一步详细描述。实施例一如图1所示,为本专利技术实施例一提供的音频信号处理方法流程图,该方法包括以下步骤:步骤101、接收第一音频信号。在本步骤中,可以接收第一音频信号(可以用y(t)表示)。所述第一音频信号中包括语音指令(可以用s(t)表示)和当前电视播放的电视节目源对应的音频信号(可以用n(t)表示)。具体的,可以通过智能机顶盒麦克风接收第一音频信号。步骤102、确定第二音频信号。由于电视正在播放的电视节目是由智能机顶盒发出的,所以通过智能机顶盒可以确定当前电视正在播放的电视节目源,并可以得到该电视节目源对应的第二音频信号(可以用表示)。步骤103、进行信号去除。在本步骤中,可以从所述第一音频信号中,将所述第二音频信号去除,得到所述语音指令对应的第三音频信号(可以用表示)。具体的,可以通过谱减法,从所述第一音频信号中,将所述第二音频信号去除。较优的,在步骤103之后,可以进一步包括步骤104,以进一步提高语音指令识别率:步骤104、进行降噪处理。在本步骤中,可以通过设定的降噪算法,对所述第三音频信号进行降噪处理,从而得到所述语音指令对应的识别率更高的音频信号。所述设定的降噪算法可以但不限于包括:维纳滤波器、自适应滤波器、谱减法等。较优的,在步骤102之后,步骤103之前,所本文档来自技高网...

【技术保护点】
1.一种音频信号处理方法,其特征在于,所述方法包括:/n在接收到第一音频信号时,所述第一音频信号中包括语音指令和当前电视播放的电视节目源对应的音频信号,确定智能机顶盒发送的所述电视节目源对应的第二音频信号;/n从所述第一音频信号中,将所述第二音频信号去除,得到所述语音指令对应的第三音频信号。/n

【技术特征摘要】
1.一种音频信号处理方法,其特征在于,所述方法包括:
在接收到第一音频信号时,所述第一音频信号中包括语音指令和当前电视播放的电视节目源对应的音频信号,确定智能机顶盒发送的所述电视节目源对应的第二音频信号;
从所述第一音频信号中,将所述第二音频信号去除,得到所述语音指令对应的第三音频信号。


2.如权利要求1所述的方法,其特征在于,从所述第一音频信号中,将所述第二音频信号去除,具体包括:
通过谱减法,从所述第一音频信号中,将所述第二音频信号去除。


3.如权利要求1所述的方法,其特征在于,所述方法还包括:
对所述第二音频信号进行滤波,滤波后得到的音频信号用于预测所述电视节目源在电视上播放时对应的音频信号;
从所述第一音频信号中,将所述第二音频信号去除,具体包括:
从所述第一音频信号中,将所述滤波后得到的音频信号去除。


4.如权利要求3所述的方法,其特征在于,对所述第二音频信号进行滤波,具体包括:
通过自适应滤波器对所述第二音频信号进行滤波。


5.如权利要求4所述的方法,其特征在于,通过自适应滤波器对所述第二音频信号进行滤波,具体包括:
通过自适应滤波器对所述第二音频信号进行滤波,并将滤波后得到的参考音频信号的指定参数与所述第一音频信号的指定参数进行比对;
根据比对结果,在确定所述参考音频信号的准确性大于设定的门限值时,将该参考音频信号作为最终滤波后得到的音频信号,否则,调整所述自适应滤波器的参数,直至确定得到的所述参考音频信号的准确性大于设定的门限值。


6.如权利要求1~5任一所述的方法,其特征在于,得到所述语音指令对应的第三音频信号之后,所述方法还包括:
通过设定的降噪算法,对所述第三音频信号进行降噪处理。


7.一种音频信号处理装置,其特征在于,所述装置包括麦克输入模块、节目源信号确定模块、存储模块、控制模块和处理模块,其中:
所述麦克输入模块,用于接收到第一音频信号,所述第一音频信号中包括语音指令和当前电视播放的电视节目源对应的音频信号;
所述节目源信号确定模块,用于确定所述麦克输入模块接收到第一音频信号时,智能机顶盒发送的所述电视节目源对应的第二音频信号;
所述存储模块,用于存储所述第一音频信号和所述第二音频信号;
所述控制模块,用于接收所述麦克输入模块发送的系统指令,该系统指令为所述麦克输入模块接收到第一音频信号时发送的,根据所述系统指令...

【专利技术属性】
技术研发人员:赵月峰温建伟
申请(专利权)人:中国移动通信有限公司研究院中国移动通信集团有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1