一种噪音消除方法、装置、系统、设备及存储介质制造方法及图纸

技术编号:21226443 阅读:30 留言:0更新日期:2019-05-29 07:14
本发明专利技术提供一种噪音消除方法、装置、系统、设备及存储介质,所述方法包括:获取用户的语音数据;基于所述用户的语音数据进行频谱特征提取得到第一频谱特征;根据所述第一频谱特征,在已经建立好的语音语料库中查询是否存在与所述第一频谱特征相匹配的第二频谱特征;若存在与所述第一频谱特征相匹配的第二频谱特征,则将所述第二频谱特征与所述用户的语音数据进行语音合成并输出。根据本发明专利技术的方法,通过声纹和语音识别,然后语音合成从而消除环境噪音的影响,获取高品质的语音信息。

A Noise Elimination Method, Device, System, Equipment and Storage Media

The invention provides a noise elimination method, device, system, device and storage medium, which includes: acquiring the voice data of the user; acquiring the first spectrum feature based on the voice data of the user; querying whether there exists a matching with the first spectrum feature in the established voice corpus according to the first spectrum feature. The second spectrum feature; if there is a second spectrum feature matching the first spectrum feature, the second spectrum feature and the user's voice data are synthesized and output. According to the method according to the present invention, high quality speech information can be obtained by voiceprint and speech recognition, and then speech synthesis to eliminate the influence of environmental noise.

【技术实现步骤摘要】
一种噪音消除方法、装置、系统、设备及存储介质
本申请涉及声音
,特别涉及一种噪音消除方法、装置、系统、设备及存储介质。
技术介绍
随着无线技术应用的普及,人们通过无线通信进行各种语音操作已经非常普遍。当用户操作语音或进行通话时,期望是一个清晰的语音信息,但根据所处的环境总有一些环境噪音夹杂其中。而传统的噪音消除方法基本都是消除人声不覆盖的频段以及利用Beamforming(波束成形)消除周边噪声,噪音消除效果不好。因此,现有技术中存在对语音数据噪音消除效果不好,造成用户体验差的问题。
技术实现思路
考虑到上述问题而提出了本专利技术,通过声纹和语音识别,然后语音合成从而消除环境噪音的影响,获取高品质的语音信息。根据本专利技术一方面,提供了一种噪音消除方法,所述方法包括:获取用户的语音数据;基于所述用户的语音数据进行频谱特征提取得到第一频谱特征;根据所述第一频谱特征,在已经建立好的语音语料库中查询是否存在与所述第一频谱特征相匹配的第二频谱特征;若存在与所述第一频谱特征相匹配的第二频谱特征,则将所述第二频谱特征与所述用户的语音数据进行语音合成并输出。示例性地,所述语音语料库的建立包括:获取用户的语音资料数据与非用户语音数据;基于所述用户的语音资料数据与非用户语音数据进行频谱特征提取得到所述用户的语音资料数据的第三频谱特征与非用户语音数据的第四频谱特征;根据所述第四频谱特征对神经网络进行训练,得到基线模型;基于所述第三频谱特征对所述基线模型进行训练,得到用户的语音语料库。示例性地,基于所述用户的语音数据进行语音识别,得到所述用户的语音数据信息包括:将所述语音数据的频谱特征输入训练好的声学模型,得到对应的音素信息;基于所述音素信息、字典和训练好的语言模型,得到所述用户的语音数据信息。示例性地,基于所述用户的语音数据进行语音识别,得到所述用户的语音数据信息还包括:对所述用户的语音数据进行预处理。示例性地,所述预处理包括:将所述用户的语音数据的首尾端的静音去除或声音分帧。示例性地,所述方法还包括:若不存在与所述第一频谱特征相匹配的第二频谱特征,则确认所述用户与所述语音语料库不匹配,消除所述用户的语音数据中的预定频段或波束成形方法进行噪音消除处理,得到噪音消除后的语音数据。示例性地,所述预定频段包括人的声音不能覆盖的频率。示例性地,所述方法还包括:输出所述噪音消除后的语音数据。根据本专利技术另一方面,提供了一种噪音消除装置,所述噪音消除装置包括:数据获取模块,获取用户的语音数据;特征提取模块,用于基于所述用户的语音数据进行频谱特征提取得到第一频谱特征;声纹识别模块,用于根据所述第一频谱特征,在已经建立好的语音语料库中查询是否存在与所述第一频谱特征相匹配的第二频谱特征;语音处理模块,用于若存在与所述第一频谱特征相匹配的第二频谱特征,则将所述第二频谱特征与所述用户的语音数据进行语音合成并输出。示例性地,所述噪音消除方法装置还包括:语音语料模块,用于建立和/或存储用户的语音语料库。示例性地,所述语音语料模块包括:数据采集模块,用于获取用户的语音资料数据;数据库模块,用于基于所述用户的语音资料数据与非用户语音数据训练得到所述语音语料库。示例性地,数据库模块进一步用于:基于所述用户的语音资料数据与非用户语音数据进行频谱特征提取得到所述用户的语音资料数据的第三频谱特征与非用户语音数据的第四频谱特征;根据所述第四频谱特征对神经网络进行训练,得到基线模型;基于所述第三频谱特征对所述基线模型进行训练,得到用户的语音语料库。示例性地,所述噪音消除方法装置还包括:通信模块,用于与所述云端通信。示例性地,所述通信模块还用于将所述用户的语音资料数据发送至所述云端。示例性地,所述通信模块还用于接收所述云端发送的所述语音运料数据库。示例性地,数据获取模块进一步用于:接收音频采集装置所采集的所述用户的语音数据。示例性地,所述语音处理模块包括:语音识别模块,用于基于所述用户的语音数据进行语音识别,得到所述用户的语音数据信息;语音合成模块,将所述第二频谱特征与所述语音数据信息进行语音合成,得到语音合成数据。示例性地,所述语音识别模块还可以进一步用于:将所述语音数据的频谱特征输入训练好的声学模型,得到对应的音素信息;基于所述音素信息、字典和训练好的语言模型,得到所述用户的语音数据信息。示例性地,所述噪音消除模块包括:预处理模块,用于对所述用户的语音数据进行预处理。示例性地,预处理模块用于:将所述用户的语音数据的首尾端的静音去除或声音分帧。示例性地,所述噪音消除模块还包括:去噪模块,若不存在与所述第一频谱特征相匹配的第二频谱特征,则确认所述用户与所述语音语料库不匹配,消除所述用户的语音数据中的预定频段或波束成形方法进行噪音消除处理,得到噪音消除后的语音数据。示例性地,所述预定频段包括人的声音不能覆盖的频率。示例性地,所述噪音消除方法装置还包括:语音输出模块,用于输出所述噪音消除后的语音数据或语音合成数据。根据本专利技术另一方面,提供了一种噪音消除系统,包括存储器、处理器及存储在所述存储器上且在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述方法的步骤。根据本专利技术另一方面,提供了一种计算机存储介质,其上存储有计算机程序,所述计算机程序被计算机执行时实现上述方法的步骤。根据本专利技术另一方面,提供了一种噪音消除设备,所述系统包括:音频采集装置,用于采集所述用户的语音数据;语音语料装置,用于基于用户的语音资料数据与非用户语音数据训练得到语音语料库;如上所述的噪音消除装置,用于根据所述语音语料库对所述用户的语音数据进行噪音消除或语音合成。根据本专利技术提供的噪音消除方法、装置、系统及计算机存储介质,通过声纹和语音识别,然后语音合成从而消除环境噪音的影响,获取高品质的语音信息。附图说明通过结合附图对本专利技术实施例进行更详细的描述,本专利技术的上述以及其它目的、特征和优势将变得更加明显。附图用来提供对本专利技术实施例的进一步理解,并且构成说明书的一部分,与本专利技术实施例一起用于解释本专利技术,并不构成对本专利技术的限制。在附图中,相同的参考标号通常代表相同部件或步骤。图1是用于实现根据本专利技术实施例的一种噪声消除方法的流程示意图;图2是用于实现根据本专利技术实施例的建立语音语料库的示意性原理图;图3是用于实现根据本专利技术实施例的一种噪声消除方法的示例的流程示意图;图4是用于实现根据本专利技术实施例的一种噪声消除装置的示意性框图。具体实施方式为了使得本专利技术的目的、技术方案和优点更为明显,下面将参照附图详细描述根据本专利技术的示例实施例。显然,所描述的实施例仅仅是本专利技术的一部分实施例,而不是本专利技术的全部实施例,应理解,本专利技术不受这里描述的示例实施例的限制。基于本专利技术中描述的本专利技术实施例,本领域技术人员在没有付出创造性劳动的情况下所得到的所有其它实施例都应落入本专利技术的保护范围之内。下面参考图1来描述用于实现本专利技术实施例的一种噪音消除方法的流程示意图。所述噪音消除方法100包括:首先,在步骤S110,获取用户的语音数据;在步骤S120,基于所述用户的语音数据进行频谱特征提取得到第一频谱特征;在步骤S130,根据所述第一频谱特征,在已经建立好的语音语料库中查询是否存在与所述第一频谱特征相匹配的第二频谱本文档来自技高网...

【技术保护点】
1.一种噪音消除方法,其特征在于,所述方法包括:获取用户的语音数据;基于所述用户的语音数据进行频谱特征提取得到第一频谱特征;根据所述第一频谱特征,在已经建立好的语音语料库中查询是否存在与所述第一频谱特征相匹配的第二频谱特征;若存在与所述第一频谱特征相匹配的第二频谱特征,则将所述第二频谱特征与所述用户的语音数据进行语音合成并输出。

【技术特征摘要】
1.一种噪音消除方法,其特征在于,所述方法包括:获取用户的语音数据;基于所述用户的语音数据进行频谱特征提取得到第一频谱特征;根据所述第一频谱特征,在已经建立好的语音语料库中查询是否存在与所述第一频谱特征相匹配的第二频谱特征;若存在与所述第一频谱特征相匹配的第二频谱特征,则将所述第二频谱特征与所述用户的语音数据进行语音合成并输出。2.如权利要求1所述的方法,其特征在于,所述语音语料库的建立包括:获取用户的语音资料数据与非用户语音数据;基于所述用户的语音资料数据与非用户语音数据进行频谱特征提取得到所述用户的语音资料数据的第三频谱特征与非用户语音数据的第四频谱特征;根据所述第四频谱特征对神经网络进行训练,得到基线模型;基于所述第三频谱特征对所述基线模型进行训练,得到用户的语音语料库。3.如权利要求1所述的方法,其特征在于,将所述第二频谱特征与所述用户的语音数据进行语音合成并输出包括:基于所述用户的语音数据进行语音识别,得到所述用户的语音数据信息;将所述第二频谱特征与所述语音数据信息进行语音合成,得到语音合成数据并输出。4.如权利要求3所述的方法,其特征在于,基于所述用户的语音数据进行语音识别,得到所述用户的语音数据信息包括:将所述语音数据的频谱特征输入训练好的声学模型,得到对应的音素信息;基于所述音素信息、字典和训练好的语言模型,得到所述用户的语音数据信息。5.如权...

【专利技术属性】
技术研发人员:高岩彭定桃
申请(专利权)人:安克创新科技股份有限公司
类型:发明
国别省市:湖南,43

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1