The invention is applicable to the field of intelligent speaker technology, and provides a voice interaction method and device. By controlling the omnidirectional real-time picking up voice of microphone array, and according to the microphone array algorithm, the direction of each sound source in voice is obtained and whether the direction of sound source is the direction of noise is judged. When the direction of sound source is the direction of noise, the noise signal in that direction is filtered out, and then the noise is filtered out. The speech recognition after the signal is carried out and the corresponding operation is carried out based on the recognition results, which solves the problem of speech interference when existing intelligent devices coexist with other voice playing devices, improves the signal-to-noise ratio and wake-up success rate, reduces the power consumption of the system, and then improves the effect of human-computer voice interaction.
【技术实现步骤摘要】
一种语音交互方法及装置
本专利技术属于智能音箱
,尤其涉及一种语音交互方法及装置。
技术介绍
随着音箱的普及,用户对音箱的智能化的要求越来越高。传统音箱只能播放声音,智能音箱在传统音箱的基础上增加了录音模块,从而实现了人机语音交互。用户可以通过语音来控制智能音箱,实现点播歌曲、查询天气、打开空调等功能。智能音箱逐渐走入普通百姓的客厅,与电视机一起成为客厅里的重要部分。在日常生活中,智能音箱在使用过程中总可能有其他语音播放设备的声源同时存在,然而,智能音箱的现有技术只能采集所有的声音,而无法屏蔽其他干扰声源。例如正在播放的电视机,智能音箱在录音过程中,并不能识别声音是正常的人声还是从电视机中播放出来的声音,这样势必会导致电视机的声音干扰到智能音箱的语音交互。因此,现有的智能音箱在多声源同时存在时,难以识别出正常的人声输入,容易受其他干扰声源的影响,因而存在人机语音交互效果差、效率低,用户体验性差的问题。
技术实现思路
本专利技术实施例的目的在于提供一种语音交互方法及装置,旨在解决现有的智能音箱多声源同时存在时难以识别出正常的人声输入,容易受其他干扰声源的影响,因而存在人机语音交互效果差、效率低,用户体验性差的问题。第一方面,本专利技术实施例提供一种语音交互方法,包括:控制麦克风阵列全方向实时拾取语音;根据麦克风阵列算法获取所述语音中各声源的声源方向;判断所述声源方向是否为噪声方向;若所述声源方向为噪声方向,则滤除所述噪声方向的噪声信号;对滤除所述噪声信号后的语音进行识别,并基于识别结果执行对应的操作。第二方面,本专利技术实施例提供一种语音交互装置,包括:拾 ...
【技术保护点】
1.一种语音交互方法,其特征在于,包括:控制麦克风阵列全方向实时拾取语音;根据麦克风阵列算法获取所述语音中各声源的声源方向;判断所述声源方向是否为噪声方向;若所述声源方向为噪声方向,则滤除所述噪声方向的噪声信号;对滤除所述噪声信号后的语音进行识别,并基于识别结果执行对应的操作。
【技术特征摘要】
1.一种语音交互方法,其特征在于,包括:控制麦克风阵列全方向实时拾取语音;根据麦克风阵列算法获取所述语音中各声源的声源方向;判断所述声源方向是否为噪声方向;若所述声源方向为噪声方向,则滤除所述噪声方向的噪声信号;对滤除所述噪声信号后的语音进行识别,并基于识别结果执行对应的操作。2.根据权利要求1所述的语音交互方法,其特征在于,所述判断所述声源方向是否为噪声方向,包括:若所述声源方向声音信号的持续时间大于预设阈值且所述声音信号在所述持续时间内不具备预定波形特征,则判定所述声源方向为噪声方向。3.根据权利要求2所述的语音交互方法,其特征在于,所述若所述声源方向声音信号的持续时间大于预设阈值且所述声音信号在所述持续时间内不具备预定波形特征,则判定所述声源方向为噪声方向之后,包括:若所述噪声方向的声音信号在第一预设时间范围内匹配有预定波形特征,则继续检测所述噪声方向的声音信号在第二预设时间范围内是否具有预定波形特征;若所述噪声方向的声音信号在第二预设时间范围内具有预定波形特征,则判定所述噪声方向为非噪声方向。4.根据权利要求1所述的语音交互方法,其特征在于,所述若所述声源方向为噪声方向,则滤除所述噪声方向的噪声信号,包括:若所述声源方向为噪声方向,则调节所述麦克风阵列的增益至预设增益阈值;控制所述麦克风阵列根据所述预设增益阈值滤除所述噪声方向的噪声信号。5.根据权利要求1-4任一项所述的交互方法,其特征在于,所述判断所述声源方向是否为噪声方向之后,还包括:若所述声源方向为非噪声方向,则控制所述麦克风阵列放大所述非噪声方向的声音信号;对放大声音信号后的语音进行识别,并基于识别结果执行对应的...
【专利技术属性】
技术研发人员:韩中波,吴海全,迟欣,王如军,张恩勤,曹磊,师瑞文,
申请(专利权)人:深圳市冠旭电子股份有限公司,
类型:发明
国别省市:广东,44
还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。