The invention relates to the field of speech recognition, in particular to an audio signal processing method, device, medium and device. In view of the characteristics that the interference to the voice instruction signal mainly comes from the audio broadcast by the television in the video broadcast scenario of the intelligent set-top box, it is creatively proposed that when receiving the first audio signal of the audio signal including the voice instruction and the audio signal corresponding to the current TV program source, the second audio signal corresponding to the TV program source sent by the intelligent set-top box is It is the audio signal corresponding to the current TV program source broadcast by TV, and the second audio signal can be removed from the first audio signal to obtain the third audio signal corresponding to the voice instruction, so as to effectively remove the interference of TV audio to the voice instruction and greatly improve the recognition rate of the voice instruction.
【技术实现步骤摘要】
一种音频信号处理方法、装置、介质和设备
本专利技术涉及语音识别领域,尤其涉及一种音频信号处理方法、装置、介质和设备。
技术介绍
近年来随着人工智能技术的发展,越来越多的语音交互产品出现在家庭中,比如智能音箱、智能机顶盒等。用户在使用智能机顶盒时,可以不再使用遥控器进行智能机顶盒控制,转而使用语音进行控制。在最新研发的智能机顶盒产品中,完全放弃了遥控器,全部使用语音进行控制。但是,智能机顶盒放置的位置通常与电视机很近,当播放视频的时候,电视的音频会对用户说出的指令造成很大的干扰,甚至产生负信噪比的情况,导致用户语音指令的识别率降低。现有技术方案主要采取以下两种方法来提高对智能机顶盒语音指令的识别率:方法一、利用传统的降噪算法对智能机顶盒接收到的信号进行降噪,比如维纳滤波器、自适应滤波器、谱减法等。方法二、利用麦克风阵列接收多路语音信号,再利用接收到的多路信号间的相位关系进行干扰信号的消除。上述方法一在音频信号信噪比较高的场景下应用较好,但在视频播放场景下,音频信号的信噪比很低,甚至为负值,此种方法的降噪效果一般,无法有效提高语音指令识别率。在上述方法二中,因为受到电视机喇叭位置的限制,对智能机顶盒摆放位置和摆放方向都有一定的要求。如果智能机顶盒摆放位置或摆放方向不正确,这种处理方式不能有效消除电视音频的干扰。而且,即使摆放位置和摆放方向都正确,由于智能机顶盒接收到的电视音频较大,降噪效果也不理想,语音指令识别率提高有限。
技术实现思路
本专利技术实施例 ...
【技术保护点】
1.一种音频信号处理方法,其特征在于,所述方法包括:/n在接收到第一音频信号时,所述第一音频信号中包括语音指令和当前电视播放的电视节目源对应的音频信号,确定智能机顶盒发送的所述电视节目源对应的第二音频信号;/n从所述第一音频信号中,将所述第二音频信号去除,得到所述语音指令对应的第三音频信号。/n
【技术特征摘要】
1.一种音频信号处理方法,其特征在于,所述方法包括:
在接收到第一音频信号时,所述第一音频信号中包括语音指令和当前电视播放的电视节目源对应的音频信号,确定智能机顶盒发送的所述电视节目源对应的第二音频信号;
从所述第一音频信号中,将所述第二音频信号去除,得到所述语音指令对应的第三音频信号。
2.如权利要求1所述的方法,其特征在于,从所述第一音频信号中,将所述第二音频信号去除,具体包括:
通过谱减法,从所述第一音频信号中,将所述第二音频信号去除。
3.如权利要求1所述的方法,其特征在于,所述方法还包括:
对所述第二音频信号进行滤波,滤波后得到的音频信号用于预测所述电视节目源在电视上播放时对应的音频信号;
从所述第一音频信号中,将所述第二音频信号去除,具体包括:
从所述第一音频信号中,将所述滤波后得到的音频信号去除。
4.如权利要求3所述的方法,其特征在于,对所述第二音频信号进行滤波,具体包括:
通过自适应滤波器对所述第二音频信号进行滤波。
5.如权利要求4所述的方法,其特征在于,通过自适应滤波器对所述第二音频信号进行滤波,具体包括:
通过自适应滤波器对所述第二音频信号进行滤波,并将滤波后得到的参考音频信号的指定参数与所述第一音频信号的指定参数进行比对;
根据比对结果,在确定所述参考音频信号的准确性大于设定的门限值时,将该参考音频信号作为最终滤波后得到的音频信号,否则,调整所述自适应滤波器的参数,直至确定得到的所述参考音频信号的准确性大于设定的门限值。
6.如权利要求1~5任一所述的方法,其特征在于,得到所述语音指令对应的第三音频信号之后,所述方法还包括:
通过设定的降噪算法,对所述第三音频信号进行降噪处理。
7.一种音频信号处理装置,其特征在于,所述装置包括麦克输入模块、节目源信号确定模块、存储模块、控制模块和处理模块,其中:
所述麦克输入模块,用于接收到第一音频信号,所述第一音频信号中包括语音指令和当前电视播放的电视节目源对应的音频信号;
所述节目源信号确定模块,用于确定所述麦克输入模块接收到第一音频信号时,智能机顶盒发送的所述电视节目源对应的第二音频信号;
所述存储模块,用于存储所述第一音频信号和所述第二音频信号;
所述控制模块,用于接收所述麦克输入模块发送的系统指令,该系统指令为所述麦克输入模块接收到第一音频信号时发送的,根据所述系统指令...
【专利技术属性】
技术研发人员:赵月峰,温建伟,
申请(专利权)人:中国移动通信有限公司研究院,中国移动通信集团有限公司,
类型:发明
国别省市:北京;11
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。