噪声消除、语音识别方法及装置制造方法及图纸

技术编号:14780570 阅读:57 留言:0更新日期:2017-03-09 21:33
本发明专利技术实施例提供一种噪声消除、语音识别方法及装置。噪声消除方法通过基于特定声纹参数,对所获取的待处理原始音频数据进行声纹匹配,使得能够根据所述声纹匹配的声纹匹配结果,从所述待处理原始音频数据中获取有效音频数据,无需额外的声音采集装置采集其他声音信号例如噪声信号等,能够避免现有技术中由于语音信号对应的信号源与两个麦克风之间的距离发生变化导致的对语音信号进行与噪声信号同等程度的抑制的问题,从而提高了降噪的可靠性,同时能够有效提高降噪之后的声音质量。

【技术实现步骤摘要】

本专利技术涉及噪声处理技术,尤其涉及一种噪声消除、语音识别方法及装置
技术介绍
随着声音处理技术发展越来越快,终端对需要处理的声音质量的要求也越来越高,降噪技术应运而生。目前的降噪技术主要是采用双麦克风主动降噪,通过一定算法,利用一个麦克风采集到的音频数据(即对应于噪声信号和信号强度较弱的语音信号)对另一个麦克风采集到的音频数据(即对应于噪声信号和信号强度较强的语音信号),进行噪声抑制处理。然而,如果语音信号对应的信号源(例如:人的嘴巴)与两个麦克风之间的距离发生变化,可能导致语音信号被确定为噪声,使得对语音信号也进行了与噪声信号同等程度的抑制,严重影响了降噪之后的声音质量,导致了降噪的可靠性的降低。
技术实现思路
本专利技术的多个方面提供一种噪声消除、语音识别方法及装置,用以提高降噪的可靠性。本专利技术的一方面,提供一种噪声消除方法,包括:基于特定声纹参数,对所获取的待处理原始音频数据进行声纹匹配;根据所述声纹匹配的声纹匹配结果,从所述待处理原始音频数据中获取有效音频数据。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述特定声纹参数是目标用户的声纹参数,以及所述根据所述声纹匹配的声纹匹配结果,从所述待处理原始音频数据中获取有效音频数据,包括:从所述待处理原始音频数据中获取声纹匹配成功的音频数据,作为所述有效音频数据。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,在所述基于特定声纹参数,对所获取的待处理原始音频数据进行声纹匹配之前,所述方法还包括:获取所述目标用户的语音信号;基于所获取的所述目标用户的语音信号,获得所述目标用户的声纹参数。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述特定声纹参数是目标环境的噪声信号的声纹参数,以及所述根据所述声纹匹配的声纹匹配结果,从所述待处理原始音频数据中获取有效音频数据,包括:从所述待处理原始音频数据中去除声纹匹配成功的音频数据,作为所述有效音频数据。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,在所述基于特定声纹参数,对所获取的待处理原始音频数据进行声纹匹配之前,所述方法还包括:获取所述目标环境的噪声信号;基于所获取的所述目标环境的噪声信号,获得所述噪声信号的声纹参数。本专利技术的另一方面,提供一种噪声消除装置,包括:声纹匹配单元,用于基于特定声纹参数,对所获取的待处理原始音频数据进行声纹匹配;有效音频数据获取单元,用于根据所述声纹匹配的声纹匹配结果,从所述待处理原始音频数据中获取有效音频数据。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述特定声纹参数是目标用户的声纹参数,以及所述有效音频数据获取单元用于从所述待处理原始音频数据中获取声纹匹配成功的音频数据,作为所述有效音频数据。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述噪声消除装置还包括:语音信号获取单元,用于获取所述目标用户的语音信号;第一声纹参数获得单元,用于基于所获取的所述目标用户的语音信号,获得所述目标用户的声纹参数。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述特定声纹参数是目标环境的噪声信号的声纹参数,以及所述有效音频数据获取单元用于从所述待处理原始音频数据中去除声纹匹配成功的音频数据,作为所述有效音频数据。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述噪声消除装置还包括:噪声信号获取单元,用于获取所述目标环境的噪声信号;第二声纹参数获得单元,用于基于所获取的所述目标环境的噪声信号,获得所述噪声信号的声纹参数。本专利技术的另一方面,提供一种语音识别方法,包括:获取待处理原始音频数据;基于特定声纹参数,对所获取的所述待处理原始音频数据进行声纹匹配;根据所述声纹匹配的声纹匹配结果,从所述待处理原始音频数据中获取有效音频数据;对所述有效音频数据进行语音识别处理。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述特定声纹参数是目标用户的声纹参数,以及所述根据所述声纹匹配的声纹匹配结果,从所述待处理原始音频数据中获取有效音频数据,包括:从所述待处理原始音频数据中获取声纹匹配成功的音频数据,作为所述有效音频数据。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,在所述基于特定声纹参数,对所获取的所述待处理原始音频数据进行声纹匹配之前,所述方法还包括:获取所述目标用户的语音信号;基于所获取的所述目标用户的语音信号,获得所述目标用户的声纹参数。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,所述特定声纹参数是目标环境的噪声信号的声纹参数,以及所述根据所述声纹匹配的声纹匹配结果,从所述待处理原始音频数据中获取有效音频数据,包括:从所述待处理原始音频数据中去除声纹匹配成功的音频数据,作为所述有效音频数据。如上所述的方面和任一可能的实现方式,进一步提供一种实现方式,在所述基于特定声纹参数,对所获取的所述待处理原始音频数据进行声纹匹配之前,所述方法还包括:获取所述目标环境的噪声信号;基于所获取的所述目标环境的噪声信号,获得所述噪声信号的声纹参数。本专利技术的另一方面,提供一种语音识别装置,包括:原始音频数据获取单元,用于获取待处理原始音频数据;如上所述的噪声消除装置;语音识别单元,用于对所述有效音频数据进行语音识别处理。由上述技术方案可知,一方面,本专利技术实施例通过基于特定声纹参数,对所获取的待处理原始音频数据进行声纹匹配,使得能够根据所述声纹匹配的声纹匹配结果,从所述待处理原始音频数据中获取有效音频数据,无需额外的声音采集装置采集其他声音信号例如噪声信号等,能够避免现有技术中由于语音信号对应的信号源与两个麦克风之间的距离发生变化导致的对语音信号进行与噪声信号同等程度的抑制的问题,从而提高了降噪的可靠性,同时能够有效提高降噪之后的声音质量。由上述技术方案可知,另一方面,本专利技术实施例通过获取待处理原始音频数据,进而基于特定声纹参数,对所获取的所述待处理原始音频数据进行声纹匹配,使得能够根据所述声纹匹配的声纹匹配结果,从所述待处理原始音频数据中获取有效音频数据,并对所述有效音频数据进行语音识别处理,由于有效音频数据是根据特定声纹参数,在待处理原始音频数据中提取出来的音频数据,这部分音频数据可以认为是使用终端的用户的语音信号,因此,该有效音频数据中不再包含噪声信号,从而有效提高了声音质量。另外,采用本专利技术提供的技术方案,只需要一个声音采集装置,能够有效降低成本。【附图说明】为了更清楚地说明本专利技术实施例中的技术方案,下面将对实施例或现有技术描述中所需要使用的附图作一简单地介绍,显而易见地,下面描述中的附图是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1为本专利技术一实施例提供的噪声消除方法的流程示意图;图2为图1对应的实施例中特定声纹参数是目标用户的声纹参数的情况下的噪声消除方法的流程示意图;图3为图1对应的实施例中特定声纹参数是目标环境的噪声信号的声纹参数的情况下的噪声消除方法的流程示意图;图4为本专利技术另一实施例提供的语音识别方法本文档来自技高网...
噪声消除、语音识别方法及装置

【技术保护点】
一种噪声消除方法,其特征在于,包括:基于特定声纹参数,对所获取的待处理原始音频数据进行声纹匹配;根据所述声纹匹配的声纹匹配结果,从所述待处理原始音频数据中获取有效音频数据。

【技术特征摘要】
1.一种噪声消除方法,其特征在于,包括:基于特定声纹参数,对所获取的待处理原始音频数据进行声纹匹配;根据所述声纹匹配的声纹匹配结果,从所述待处理原始音频数据中获取有效音频数据。2.根据权利要求1所述的噪声消除方法,其特征在于,所述特定声纹参数是目标用户的声纹参数,以及所述根据所述声纹匹配的声纹匹配结果,从所述待处理原始音频数据中获取有效音频数据,包括:从所述待处理原始音频数据中获取声纹匹配成功的音频数据,作为所述有效音频数据。3.根据权利要求2所述的噪声消除方法,其特征在于,在所述基于特定声纹参数,对所获取的待处理原始音频数据进行声纹匹配之前,所述方法还包括:获取所述目标用户的语音信号;基于所获取的所述目标用户的语音信号,获得所述目标用户的声纹参数。4.根据权利要求1所述的噪声消除方法,其特征在于,所述特定声纹参数是目标环境的噪声信号的声纹参数,以及所述根据所述声纹匹配的声纹匹配结果,从所述待处理原始音频数据中获取有效音频数据,包括:从所述待处理原始音频数据中去除声纹匹配成功的音频数据,作为所述有效音频数据。5.根据权利要求4所述的噪声消除方法,其特征在于,在所述基于特定声纹参数,对所获取的待处理原始音频数据进行声纹匹配之前,所述方法还包括:获取所述目标环境的噪声信号;基于所获取的所述目标环境的噪声信号,获得所述噪声信号的声纹参数。6.一种噪声消除装置,其特征在于,包括:声纹匹配单元,用于基于特定声纹参数,对所获取的待处理原始音频数据进行声纹匹配;有效音频数据获取单元,用于根据所述声纹匹配的声纹匹配结果,从所述待处理原始音频数据中获取有效音频数据。7.根据权利要求6所述的噪声消除装置,其特征在于,所述特定声纹参数是目标用户的声纹参数,以及所述有效音频数据获取单元用于从所述待处理原始音频数据中获取声纹匹配成功的音频数据,作为所述有效音频数据。8.根据权利要求7所述的噪声消除装置,其特征在于,所述噪声消除装置还包括:语音信号获取单元,用于获取所述目标用户的语音信号;第一声纹参数获得单元,用于基于所获取的所述目标用户的语音信号,获得所述目标用户的声纹参数。9.根据权利要求6所述的噪声消除装置,其...

【专利技术属性】
技术研发人员:李士岩
申请(专利权)人:百度在线网络技术北京有限公司
类型:发明
国别省市:北京;11

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1