耳机装置、声音信号处理方法及系统制造方法及图纸

技术编号:20927235 阅读:27 留言:0更新日期:2019-04-20 12:04
本公开提供了一种耳机装置、声音信号处理方法及系统,其中,该声音信号处理方法应用于耳机,该方法包括如下步骤:采集声音信号;对采集的声音信号进行模数转换处理以及第一可选择处理,以得到第一采样率的第一数字声音信号;对第一数字声音信号分两路进行处理,一路被下采样处理及第二可选择处理以得到第二采样率的第二数字声音信号并对第二数字声音信号进行语音活性检测,在另一路进行关键字检测。本公开的声音信号处理方法,一路基于采样率较低的第二数字声音信号进行语音活性检测,检测量较小,降低语音活性检测的功耗,另一路基于采样频率较高、数据量较大的第一数字声音信号进行关键字检测,能够避免漏检关键字,保证语音识别的准确性。

Earphone Device, Sound Signal Processing Method and System

The present disclosure provides a headphone device, a sound signal processing method and a system, in which the sound signal processing method is applied to headphones. The method comprises the following steps: acquisition of sound signals; analog-to-digital conversion of the collected sound signals and first selective processing to obtain the first digital sound signal of the first sampling rate; and division of the first digital sound signal into two channels. The second digital sound signal with the second sampling rate is obtained by downsampling processing and the second optional processing along the way, and the second digital sound signal is detected for voice activity and keyword detection on the other way. The voice signal processing method disclosed in this paper is based on the second digital voice signal with low sampling rate to detect voice activity. The detection amount is small and the power consumption of voice activity detection is reduced. The keyword detection method based on the first digital voice signal with high sampling frequency and large data volume can avoid missing keywords and ensure the accuracy of speech recognition.

【技术实现步骤摘要】
耳机装置、声音信号处理方法及系统
本公开实施例涉及耳机装置
,尤其涉及一种声音信号处理方法、耳机装置及应用该耳机装置的声音信号处理系统。
技术介绍
语音助手类应用不断发展,从手机、PC、智能音响到智能耳机等电子设备,应用越来越广泛,其通过与电子设备智能对话和即时问答实现智能交互,能够方便的操控电子设备,能够提高电子设备的用户体验,越来越受消费者欢迎。但是,带语音助手功能的无线耳机为保证良好的识别效果,通常实时采集环境中的声音信号,并实时的对采集的声音信号进行检测和识别,以避免漏检用户的交互指令,功耗较高。另外,这类无线耳机还存在语音识别的准确性较差的问题。
技术实现思路
有鉴于现有技术中存在的上述问题,本公开实施例提供了一种功耗较低的声音信号处理方法、耳机装置及应用该耳机装置的声音信号处理系统。根据本公开的第一方案,提供了一种声音信号处理方法,其应用于耳机,所述声音信号处理方法包括如下步骤:采集声音信号;对采集的声音信号进行模数转换处理以及第一可选择处理,以得到第一采样率的第一数字声音信号;对所述第一数字声音信号分两路进行处理,一路被下采样处理及第二可选择处理以得到第二采样率的第二数字声音信号并基于所述第二数字声音信号进行语音活性检测,在另一路进行关键字检测。在一些实施例中,所述方法进一步包括,在有音乐播放的情况下:在所述一路的处理中,所述第二数字声音信号先进行音乐回声消除再进行语音活性检测;在所述另一路的处理中,所述第一数字声音信号先进行音乐回声消除再进行关键字检测。在一些实施例中,所述另一路的处理还包括对所述第一数字声音信号进行缓存,以便在所述语音活性检测检测到语音之前的第一预定时间段内的第一数字声音信号能够被获取用于关键字检测。在一些实施例中,所述另一路进行的关键字检测在所述语音活性检测检测到语音的情况下启用。在一些实施例中,所述第一可选择处理和第二可选择处理包括滤波处理;所述第一采样率为6Khz到40Khz,所述第二采样率为3Khz到20Khz。在一些实施例中,所述声音信号处理方法还包括:在所述另一路检测到关键字的情况下,将所述关键字检测所基于的数字声音信号传输到与所述耳机通信连接的云端或智能终端进行语音识别。在一些实施例中,所述声音信号处理方法进一步包括:在所述另一路检测到关键字且在有音乐播放的情况下,暂停第二预定时间段的音乐播放。在一些实施例中,声音信号处理方法还包括:在所述一路的处理中,在进行语音活性检测之前对其所基于的数字声音信号进行降噪处理;和/或。在所述另一路的处理中,在进行关键字检测之前对其所基于的数字声音信号进行降噪处理。根据本公开的第二方案,提供了一种耳机装置,所述耳机装置包括:声音信号采集装置,被配置为采集声音信号;模数转换组件,被配置为对采集的声音信号进行模数转换处理以及第一可选择处理,以得到第一采样率的第一数字声音信号;下采样组件,被配置为接收来自所述模数转换组件的第一数字声音信号并将其下采样处理及第二可选择处理以得到第二采样率的第二数字声音信号;语音活性检测模块,被配置为基于来自所述下采样组件的第二数字声音信号进行语音活性检测;以及关键字检测模块,被配置为基于来自所述模数转换组件的第一数字声音信号进行关键字检测。在一些实施例中,所述声音信号采集装置是置于所述耳机装置内靠近耳道侧的麦克。在一些实施例中,所述模数转换组件包括逐次逼近模数转换器,或者包括sigmadelta模数转换器和下采样器两者,所述模数转换组件和下采样组件中的至少一个包括滤波器,所述第一可选择处理和第二可选择处理包括滤波处理。在一些实施例中,所述耳机装置包括第一音乐回声消除模块和第二音乐回声消除模块,在有音乐播放的情况下:来自所述下采样组件的第二数字声音信号馈送到所述第一音乐回声消除模块,且所述第一音乐回声消除模块输出的数字声音信号馈送到所述语音活性检测模块;且来自所述模数转换组件的第一数字声音信号馈送到所述第二音乐回声消除模块,且所述第二音乐回声消除模块输出的数字声音信号馈送到所述关键字检测模块;在没有音乐播放的情况下:来自所述下采样组件的第二数字声音信号旁路所述第一音乐回声消除模块直接馈送到所述语音活性检测模块;且来自所述模数转换组件的第一数字声音信号旁路所述第二音乐回声消除模块直接馈送到所述关键字检测模块。在一些实施例中,所述耳机装置还包括缓存器,所述缓存器被配置为对所述第一数字声音信号进行缓存,以便所述关键字检测模块能够从所述缓存器获取在所述语音活性检测模块检测到语音之前的第一预定时间段内的第一数字声音信号用于关键字检测。在一些实施例中,所述语音活性检测模块的输出被配置作为所述关键字检测模块的启用信号。在一些实施例中,所述耳机装置还包括通信接口,其配置为:在所述关键字检测模块检测到关键字的情况下,将所述关键字检测模块所基于的数字声音信号传输到与所述耳机装置通信连接的云端或智能终端以进行语音识别。在一些实施例中,所述关键字检测模块被配置为在检测到关键字且有音乐播放的情况下,暂停第二预定时间段的音乐播放。在一些实施例中,所述耳机装置还包括第一降噪处理单元和/或第二降噪处理单元,所述第一降噪处理单元被配置为在进行语音活性检测之前对其所基于的数字声音信号进行降噪处理,所述第二降噪处理单元被配置为在进行关键字检测之前对其所基于的数字声音信号进行降噪处理。根据本公开的第三方案,提供了一种声音信号处理系统,所述声音信号处理系统包括:根据权利要求9-17中任何一项所述的耳机装置;以及云端或智能设备端,其配置为:与所述耳机装置通信;且在所述关键字检测模块检测到关键字的情况下,接收来自所述耳机装置的所述关键字检测模块所基于的数字声音信号以进行语音识别。应当理解,前面的一般描述和以下详细描述都仅是示例性和说明性的,而不是用于限制本公开。本节提供本公开中描述的技术的各种实现或示例的概述,并不是所公开技术的全部范围或所有特征的全面公开。附图说明为了更清楚地说明本公开实施例的技术方案,下面将对实施例的附图作简单地介绍,显而易见地,下面描述中的附图仅仅涉及本公开的一些实施例,而非对本公开的限制。图1为根据本公开实施例的声音信号处理方法的第一种实施例的流程示意图;图2为根据本公开实施例的声音信号处理方法的第二种实施例的流程示意图;图3为根据本公开实施例的声音信号处理方法的第三种实施例的流程示意图;图4为根据本公开实施例的声音信号处理方法的第四种实施例的流程示意图;图5为根据本公开实施例的耳机装置的第一种实施例的结构框图;图6为根据本公开实施例的耳机装置的第二种实施例的结构框图;图7为根据本公开实施例的耳机装置的第三种实施例的结构框图;图8为根据本公开实施例的耳机装置的第四种实施例的结构框图;图9为根据本公开实施例的声音信号处理系统的结构框图。具体实施方式为了使得本公开实施例的目的、技术方案和优点更加清楚,下面将结合本公开实施例的附图,对本公开实施例的技术方案进行清楚、完整地描述。显然,所描述的实施例是本公开的一部分实施例,而不是全部的实施例。基于所描述的本公开的实施例,本领域普通技术人员在无需创造性劳动的前提下所获得的所有其他实施例,都属于本公开保护的范围。除非另外定义,本公开使用的技术术语或者科学术语应当为本本文档来自技高网...

【技术保护点】
1.一种声音信号处理方法,其应用于耳机,且其特征在于,所述声音信号处理方法包括如下步骤:采集声音信号;对采集的声音信号进行模数转换处理以及第一可选择处理,以得到第一采样率的第一数字声音信号;对所述第一数字声音信号分两路进行处理,一路被下采样处理及第二可选择处理以得到第二采样率的第二数字声音信号并基于所述第二数字声音信号进行语音活性检测,在另一路进行关键字检测。

【技术特征摘要】
1.一种声音信号处理方法,其应用于耳机,且其特征在于,所述声音信号处理方法包括如下步骤:采集声音信号;对采集的声音信号进行模数转换处理以及第一可选择处理,以得到第一采样率的第一数字声音信号;对所述第一数字声音信号分两路进行处理,一路被下采样处理及第二可选择处理以得到第二采样率的第二数字声音信号并基于所述第二数字声音信号进行语音活性检测,在另一路进行关键字检测。2.根据权利要求1所述的声音信号处理方法,其特征在于,所述方法进一步包括,在有音乐播放的情况下:在所述一路的处理中,所述第二数字声音信号先进行音乐回声消除再进行语音活性检测;在所述另一路的处理中,所述第一数字声音信号先进行音乐回声消除再进行关键字检测。3.根据权利要求2所述的声音信号处理方法,其特征在于,所述另一路的处理还包括对所述第一数字声音信号进行缓存,以便在所述语音活性检测检测到语音之前的第一预定时间段内的第一数字声音信号能够被获取用于关键字检测。4.根据权利要求1所述的声音信号处理方法,其特征在于,所述另一路进行的关键字检测在所述语音活性检测检测到语音的情况下启用。5.根据权利要求1所述的声音信号处理方法,其特征在于,所述第一可选择处理和第二可选择处理包括滤波处理;所述第一采样率为6Khz到40Khz,所述第二采样率为3Khz到20Khz。6.根据权利要求1-4中任何一项所述的声音信号处理方法,其特征在于,所述声音信号处理方法还包括:在所述另一路检测到关键字的情况下,将所述关键字检测所基于的数字声音信号传输到与所述耳机通信连接的云端或智能终端进行语音识别。7.根据权利要求1-4中任何一项所述的声音信号处理方法,其特征在于,所述声音信号处理方法进一步包括:在所述另一路检测到关键字且在有音乐播放的情况下,暂停第二预定时间段的音乐播放。8.根据权利要求1-4中任何一项所述的声音信号处理方法,其特征在于,声音信号处理方法还包括:在所述一路的处理中,在进行语音活性检测之前对其所基于的数字声音信号进行降噪处理;和/或。在所述另一路的处理中,在进行关键字检测之前对其所基于的数字声音信号进行降噪处理。9.一种耳机装置,其特征在于,所述耳机装置包括:声音信号采集装置,被配置为采集声音信号;模数转换组件,被配置为对采集的声音信号进行模数转换处理以及第一可选择处理,以得到第一采样率的第一数字声音信号;下采样组件,被配置为接收来自所述模数转换组件的第一数字声音信号并将其下采样处理及第二可选择处理以得到第二采样率的第二数字声音信号;语音活性检测模块,被配置为基于来自所述下采样组件的第二数字声音信号进行语音活性检测;以及关键字检测模块,被配置为基于来自所述模数转换组件的第一数字声音信号进行关键字检测。...

【专利技术属性】
技术研发人员:童伟峰张亮黎华李倩许斯
申请(专利权)人:恒玄科技上海有限公司
类型:发明
国别省市:上海,31

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1