回声消除方法、装置、介质以及语音唤醒方法和设备制造方法及图纸

技术编号:20392576 阅读:22 留言:0更新日期:2019-02-20 03:56
本发明专利技术实施例公开了一种回声消除方法、装置、介质以及语音唤醒方法和设备,该方法包括:获取待唤醒设备的待输出语音信号;根据所述待输出语音信号和预先存储的待唤醒设备的设备频率响应曲线,对麦克风所接收的初始唤醒语音进行回声消除以生成唤醒语音。解决了现有技术的回声消除方法通常不能完全将初始唤醒语音中由播放信号所产生的回声信号消除干净的技术问题,达到了提高回声消除效果,进而提高语音唤醒成功率的技术效果。

【技术实现步骤摘要】
回声消除方法、装置、介质以及语音唤醒方法和设备
本专利技术实施例涉及语音处理
,尤其涉及一种回声消除方法、装置、介质以及语音唤醒方法和设备。
技术介绍
在通过语音唤醒待唤醒设备时,通常通过待唤醒设备的麦克风获取初始唤醒语音,然后对初始唤醒语音进行处理提取唤醒信号。其中,在对初始语音进行处理时,如果待唤醒设备存在外放语音,则需考虑采用回声消除技术去除初始唤醒语音中的由播放信号所产生的回音信号。现有技术是在待唤醒设备的功放输出端采集音频信号,然后经I2S(集成电路内置音频总线)直接传输到AEC(acousticechocancellation,回声消除)模块作为回采的播放信号,或是将采集的音频信号通过ADC转换成数字信号,再经I2S传输到回声消除模块。回声消除模块使用回采的播放信号与麦克风录到的唤醒声音做比较,消除唤醒语音中的播放信号,留下人声。但此种方法通常不能完全将初始唤醒语音中的回声信号消除干净,语音唤醒效果较差。
技术实现思路
本专利技术实施例提供了一种回声消除方法、装置、介质以及语音唤醒方法和设备,解决了现有技术的回声消除方法通常不能完全将初始唤醒语音中的回声信号消除干净,语音唤醒效果较差的问题,以提高回声消除效果。第一方面,本专利技术实施例提供了一种回声消除方法,用于语音唤醒,包括:获取待唤醒设备的待输出语音信号;根据所述待输出语音信号和预先存储的待唤醒设备的设备频率响应曲线,对麦克风所接收的初始唤醒语音进行回声消除以生成唤醒语音。第二方面,本专利技术实施例还提供了一种回声消除装置,配置于语音唤醒设备中,包括:第一获取模块,用于获取待唤醒设备的待输出语音信号;唤醒语音确定模块,用于根据所述待输出语音信号和预先存储的待唤醒设备的设备频率响应曲线,对麦克风所接收的初始唤醒语音进行回声消除以生成唤醒语音。第三方面,本专利技术实施例还提供了一种包含计算机可执行指令的存储介质,所述计算机可执行指令在由计算机处理器执行时用于执行如第一方面所述的回声确定方法。第四方面,本专利技术实施例还提供了一种语音唤醒方法,包括:通过麦克风获取待唤醒设备的初始唤醒语音;根据所述初始唤醒语音和第一方面所述的回声消除方法确定唤醒语音;根据所述唤醒语音确定启动信号,并通过所述启动信号启动待唤醒设备。第五方面,本专利技术实施例还提供了一种语音唤醒设备,包括:第二语音获取模块,用于通过麦克风获取待唤醒设备初始语音唤醒信号;回声消除模块,用于根据权利要求1-5任一所述的回声消除方法和初始语音唤醒信号确定语音唤醒信号;系统模块,用于根据所述唤醒语音确定启动信号,并根据所述启动信号启动待唤醒设备。本专利技术提供的回声消除方法的技术方案,包括:获取待唤醒设备的待输出语音信号;根据待输出语音信号和预先存储的待唤醒设备的设备频率响应曲线,对麦克风所接收的初始唤醒语音进行回声消除以生成唤醒语音。通过设备频率响应曲线与待输出语音信号,可以估计出待唤醒设备的播放机构所输出的播放信号,由于输出频响曲线引入了待唤醒设备的播放机构对待输出语音信号的影响,因此相对于现有技术仅基于待输出语音信号进行回声消除来说,可以大大提高回声消除效果,进而提高语音唤醒效果。附图说明为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例描述中所需要使用的附图做一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术实施例一提供的回声消除方法的流程图;图2是本专利技术实施例一提供的待唤醒设备的频率响应曲线示意图;图3是本专利技术实施例二提供的回声消除装置的结构框图;图4是本专利技术实施例三提供的语音唤醒方法的流程图;图5是本专利技术实施例四提供的语音唤醒设备的结构框图。具体实施方式为使本专利技术的目的、技术方案和优点更加清楚,以下将参照本专利技术实施例中的附图,通过实施方式清楚、完整地描述本专利技术的技术方案,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有做出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。实施例一图1是本专利技术实施例一提供的回声消除方法的流程图。本实施例的技术方案适用于提高语音唤醒成功率的情况。该方法可以采用软件和/或硬件的方式实现,并配置在系统模块中应用。该方法具体包括如下步骤:S101、获取待唤醒设备的待输出语音信号。如果待唤醒设备带有播放功能,在对其进行语音唤醒时,麦克风所接收的初始唤醒语音中通常包含回声,该回声是由待唤醒设备的播放机构的播放信号产生的,由于在实际的使用场景中,不方便获得实际的播放信号,因此本实施例获取待输出语音信号。其中,待输出语音信号为系统模块至播放机构的语音传输路径上的语音输出信号,比如系统模块输出的语音输出信号,或者功放模块输出的语音输出信号。播放机构为扬声器。S102、根据待输出语音信号和预先存储的待唤醒设备的设备频率响应曲线,对麦克风所接收的初始唤醒语音进行回声消除以生成唤醒语音。由于播放机构会对待输出语音信号产生影响,即播放机构播放出来的语音信号与播放前的语音信号的频率不同,为此,本实施例引入设备频率响应曲线(参见图2),即通过设备频率响应曲线模拟待唤醒设备的播放机构对应待输出语音信号的影响,从而根据待输出语音信号与设备频率响应曲线估计出待唤醒设备的播放机构所输出的播放信号,即得到估计播放信号。其中,频率响应是指将一个以恒电压输出的音频信号与系统相连接时,音箱产生的声压随频率的变化而发生增大或衰减、相位随频率而发生变化的现象,这种声压和相位与频率的相关联的变化关系称为频率响应。估计播放信号得到后,基于自适应滤波器,根据估计播放信号和初始唤醒信号确定回音信号;从初始语音唤醒信号中减去回音信号以生成唤醒语音。相较于自适应滤波器根据待输出语音信号和初始唤醒信号所确定的回音信号,本实施例的自适应滤波器根据估计播放信号和初始唤醒信号确定的回音信号更接近实际场景,因此初始唤醒语音中的播放信号去除的更加干净,所得到的唤醒语音更加纯净,可大大提高语音唤醒的成功率。设备频率响应曲线通常需要通过测试手段获取,然后将其存储在待唤醒设备中,回声消除模块在进行回声消除时直接读取。设备频率响应曲线的确定方法为:获取待输出语音信号即将进入的传输/播放机构,以及待输出语音信号在进入播放机构前需要经过的所有传输机构,并将所有传输机构的增益均设置为1;将不同频率、相同幅度的扫频声输入即将进入的传输/播放机构,并使扫频声经过所有传输机构处理后输出至播放机构;录制播放机构播放的不同频率的扫频声,并根据所录制的扫频声确定当前待唤醒设备的测试频响曲线;获取当前待唤醒设备的预设设备频率响应曲线,并基于测试频响曲线调整所述预设设备频率响应曲线,使预设设备频率响应曲线逼近测试频响曲线以生成设备频率响应曲线。可以理解的是,如果待输出语音信号是从语音传输路径末端,播放机构前所提取的语音信号,那么可以无需设置传输路径上各模块的增益,直接将该语音信号输出至播放机构;比如,如果待输出语音信号为系统模块输出的语音信号,那么该语音信号至少经过功放模块到达播放机构,此时,需要将功放模块的增益设置为1,然后将该语音信号输出至功放模块,再由功放模块输本文档来自技高网...

【技术保护点】
1.一种回声消除方法,用于语音唤醒,其特征在于,包括:获取待唤醒设备的待输出语音信号;根据所述待输出语音信号和预先存储的待唤醒设备的设备频率响应曲线,对麦克风所接收的初始唤醒语音进行回声消除以生成唤醒语音。

【技术特征摘要】
1.一种回声消除方法,用于语音唤醒,其特征在于,包括:获取待唤醒设备的待输出语音信号;根据所述待输出语音信号和预先存储的待唤醒设备的设备频率响应曲线,对麦克风所接收的初始唤醒语音进行回声消除以生成唤醒语音。2.根据权利要求1所述的方法,其特征在于,所述获取待唤醒设备的待输出语音信号,包括:获取待唤醒设备的系统模块至播放机构的语音传输路径上的语音信号,并将该语音信号作为待输出语音信号。3.根据权利要求2所述的方法,其特征在于,所述系统模块输出的待输出语音信号经功放模块输出至播放机构,相应的,所述获取待唤醒设备的系统模块至播放机构的语音传输路径上的语音输出信号,包括:获取待唤醒设备的系统模块输出的语音输出信号,或获取待唤醒设备的功放模块输出的语音输出信号。4.根据权利要求1所述的方法,其特征在于,所述根据所述待输出语音信号和预先存储的待唤醒设备的设备频率响应曲线,对麦克风所接收的初始唤醒语音进行回声消除以生成唤醒语音,包括:根据所述设备频率响应曲线对所述待输出语音信号进行处理以得到估计播放信号;基于自适应滤波器,根据所述估计播放信号和初始唤醒信号确定回音信号;从所述初始语音唤醒信号中减去所述回音信号以生成唤醒语音。5.根据权利要求3所述的方法,其特征在于,所述设备频率响应曲线的确定方法包括:获取待输出语音信号即将进入的传输/播放机构,以及所述待输出语音信号在进入播放机构前需要经过的所有传输机构,并将所有传输机构的增益均设置为1;将不同频率、相同幅度的扫频声输入即将进入的传输/播放机构,并...

【专利技术属性】
技术研发人员:刘鹏
申请(专利权)人:深圳创维RGB电子有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1