语音增强方法、装置、计算机设备及存储介质制造方法及图纸

技术编号:19217374 阅读:20 留言:0更新日期:2018-10-20 07:18
本发明专利技术公开一种语音增强方法、装置、计算机设备及存储介质,该语音增强方法报括:对原始语音信息进行转换,获取数字语音信号;采用EEMD算法对所述数字语音信号进行分解,获取第一信号分量;采用相关性计算公式对所述数字语音信号和所述第一信号分量进行相关性计算,获取第一相关性系数;选取所述第一相关性系数大于预设阈值的第一信号分量,作为所述第二信号分量;对所述第二信号分量进行集成处理,获取目标语音信息。该语音增强方法进行语音增强时,能够有效对语音信号进行降噪,获取纯净的语音信号,使得采用纯净的语音信号进行声纹识别的识别准确率更高。

【技术实现步骤摘要】
语音增强方法、装置、计算机设备及存储介质
本专利技术涉及语音信号处理
,尤其涉及一种语音增强方法、装置、计算机设备及存储介质。
技术介绍
随着语音识别技术的广泛使用,语音信号处理技术的需求也随之扩大。目前,在语音识别或声纹识别过程中,由前端设备采集到的语音信号一般都带有噪声,包括背景环境中的噪声以及前端设备录音过程中产生的噪声。这些携带噪声的语音信号在进行语音识别时,会影响语音识别的准确性,因此,需要对语音信号进行语音增强处理(即对语音信号进行降噪处理),以从该语音信号中尽可能提取到更纯净的语音信号,以使语音识别更加准确。当前对语音信号进行语音增强处理后提取的语音信号精度不高,不利于后续进行语音识别。
技术实现思路
基于此,有必要针对上述技术问题,本专利技术实施例提供一种语音增强方法、装置、计算机设备及存储介质。一种语音增强方法,包括:对原始语音信息进行转换,获取数字语音信号;采用EEMD算法对所述数字语音信号进行分解,获取第一信号分量;采用相关性计算公式对所述数字语音信号和所述第一信号分量进行相关性计算,获取第一相关性系数;选取所述第一相关性系数大于预设阈值的第一信号分量,作为所述第二信号分量;对所述第二信号分量进行集成处理,获取目标语音信息。一种语音增强装置,包括:数字语音信号获取模块,用于对原始语音信息进行转换,获取数字语音信号;第一信号分量获取模块,用于采用EEMD算法对所述数字语音信号进行分解,获取第一信号分量;第一相关性系数获取模块,用于采用相关性计算公式对所述数字语音信号和所述第一信号分量进行相关性计算,获取第一相关性系数;第二信号分量获取模块,用于选取所述第一相关性系数大于预设阈值的第一信号分量,作为所述第二信号分量;目标语音信息获取模块,用于对所述第二信号分量进行集成处理,获取目标语音信息。一种计算机设备,包括存储器、处理器以及存储在所述存储器中并可在所述处理器上运行的计算机程序,所述处理器执行所述计算机程序时实现上述语音增强方法的步骤。一种非易失性存储介质,所述非易失性存储介质存储有计算机程序,所述计算机程序被处理器执行时实现上述语音增强方法的步骤。上述语音增强方法、装置、计算机设备及存储介质,先对原始语音信息进行转换,获取数字语音信号,以便采用EEMD算法对数字语音信号进行分解,获取第一信号分量。然后,采用相关性计算公式对数字语音信号和第一信号分量进行相关性计算,获取第一相关性系数,以便通过对相关系数进行判断,获取与数字语音信号相关性较大的第一信号分量。可以理解地,通过选取第一相关性系数大于预设阈值的第一信号分量,作为第二信号分量以减少噪声干扰,达到语音增强的目的。最后,对第二信号分量进行集成处理,获取目标语音信息。该语音增强方法的实现过程简单,并能够有效对语音信号进行降噪,获取纯净的语音信号,使得采用纯净的语音信号进行声纹识别的识别准确率更高。附图说明为了更清楚地说明本专利技术实施例的技术方案,下面将对本专利技术实施例的描述中所需要使用的附图作简单地介绍,显而易见地,下面描述中的附图仅仅是本专利技术的一些实施例,对于本领域普通技术人员来讲,在不付出创造性劳动性的前提下,还可以根据这些附图获得其他的附图。图1是本专利技术一实施例中语音增强方法的一应用环境图图2是本专利技术一实施例中语音增强方法的一流程图;图3是图2中步骤S20的一具体流程图;图4是图3中步骤S22的一具体流程图;图5是本专利技术一实施例中语音增强方法的另一流程图;图6是本专利技术一实施例中语音增强装置的一示意图;图7是本专利技术一实施例中计算机设备的一示意图。具体实施方式下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。本申请提供的语音增强方法,可应用在如图1的应用环境中,其中,计算机设备通过网络与服务器进行通信。计算机设备可以但不限于各种个人计算机、笔记本电脑、智能手机、平板电脑和便携式可穿戴设备。服务器可以用独立的服务器来实现。该语音增强方法可应用在银行、证券、保险等金融机构或者其他机构配置的计算机设备上,用于进行声纹识别之前对语音数据进行语音增强,以提高识别准确率。在一个实施例中,如图2所示,以该语音增强方法应用于图1中的服务器为例进行说明,包括如下步骤:S10:对原始语音信息进行转换,获取数字语音信号。其中,原始语音信息是前端设备的录音模块(如麦克风)采集到的说话人的语音信息。该原始语音信息可以是wav、mp3或其他格式的语音信息。数字语音信号是指将原始语音信息进行转换所获取的离散数字信号。由于计算机设备是不能直接处理原始语音信息的,它只能处理二进制数据,因此需要将原始语音信息转换为数字语音信号。具体地,服务器接收前端设备发送的原始语音信息,并采用Python模块中的读取音频文件的命令函数对该原始语音信息读取,获取数字语音信号。例如,该读取音频文件的命令函数可以为wave.open(file(原始语音信息),rb(读取文件操作)),通过该读取音频文件的命令函数对原始语音信息进行读取,获取到的音频文件的一维数组即为数字语音信号。Python模块是一种由面向对象的解释型计算机程序设计语言编写的包含大量的封装函数的模块。本实施例中,采用Python模块中的读取音频文件的命令函数直接读取原始语音信息,即可获取数字语音信号,实现简单。S20:采用EEMD算法对数字语音信号进行分解,获取第一信号分量。其中,第一信号分量是指采用EEMD算法对数字语音信号进行分解,获取的IMF(IntrinsicModeFunction,本征模态函数)分量。EEMD(EnsembleEmpiricalModeDecomposition,集合经验模态分解)算法是一种噪声辅助数据分析算法,可有效解决模态混叠现象,使得分解结果(第一信号分量)能清晰反映出数字语音信号在不同时间尺度或不同频率的振荡变化。模态混叠是指不能依据时间尺度有效的分离出不同的模态分量,使原本不同的模态出现在一个模态之中的现象。由于数字语音信号是非平稳的,为了使数字语音信号更加平稳,需采用EEMD算法对数字语音信号进行分解,以使通过数字语音信号分解出的第一信号分量更加平稳,可有助于抑制噪声干扰,使得语音信号的精度较高。具体地,服务器采用EEMD算法对数字语音信号进行分解会获取N(N为正整数)个第一信号分量,每个第一信号分量表征数字语音信号在不同时间尺度或不同频率的振荡变化。S30:采用相关性计算公式对数字语音信号和第一信号分量进行相关性计算,获取第一相关性系数。其中,第一相关性系数是对数字语音信号和第一信号分量进行相关性计算所获取的计算结果。第一相关性系数可以反映数字语音信号和第一信号分量的相关程度,并且也可以反映第一信号分量包含数字语音信号中的有效信息量(语音信息)的程度。具体地,相关性计算公式为其中,x为数字语音信号,y为第一信号分量,Cov(x,y)为x与y的协方差,Var[x]为x的方差,Var[y]为y的方差,r为第一相关性系数。其中,Cov(x,y)的计算公式为:Var[x]的计算公本文档来自技高网...

【技术保护点】
1.一种语音增强方法,其特征在于,包括:对原始语音信息进行转换,获取数字语音信号;采用EEMD算法对所述数字语音信号进行分解,获取第一信号分量;采用相关性计算公式对所述数字语音信号和所述第一信号分量进行相关性计算,获取第一相关性系数;选取所述第一相关性系数大于预设阈值的第一信号分量,作为所述第二信号分量;对所述第二信号分量进行集成处理,获取目标语音信息。

【技术特征摘要】
1.一种语音增强方法,其特征在于,包括:对原始语音信息进行转换,获取数字语音信号;采用EEMD算法对所述数字语音信号进行分解,获取第一信号分量;采用相关性计算公式对所述数字语音信号和所述第一信号分量进行相关性计算,获取第一相关性系数;选取所述第一相关性系数大于预设阈值的第一信号分量,作为所述第二信号分量;对所述第二信号分量进行集成处理,获取目标语音信息。2.如权利要求1所述的语音增强方法,其特征在于,所述采用EEMD算法对所述数字语音信号进行分解,获取第一信号分量,包括:向所述数字语音信号中加入不同的正态分布的白噪声序列,获取待处理语音信号;对所述待处理语音信号进行EMD分解,获取所述待处理语音信号对应的中间信号分量;对所述中间信号分量进行取均值运算,获取所述第一信号分量。3.如权利要求2所述的语音增强方法,其特征在于,所述对所述待处理语音信号进行EMD分解,获取所述待处理语音信号对应的中间信号分量,包括:获取所述待处理语音信号的局部极值点,每个局部极值点包括极大值点和极小值点;基于所有局部极值点中的极大值点构建上包络线,并基于所有局部极值点中的极小值点构建下包络线;基于所述上包络线和所述下包络线,获取上包络线和下包络线对应的均值;基于待处理语音信号和所述均值,获取初始信号分量,若所述初始信号分量符合预设条件,则所述初始信号分量为中间信号分量。4.如权利要求1所述的语音增强方法,其特征在于,所述相关性计算公式为其中,x为所述数字语音信号,y为所述第一信号分量,Cov(x,y)为x与y的协方差,Var[x]为x的方差,Var[y]为y的方差,r为所述第一相关性系数。5.如权利要求1所述的语音增强方法,其特征在于,在所述选取所述第一相关性系数大于预设阈值的第一信号分量,作为所述第二信号分量的步骤之后,所述语音增强方法还包括:采用EEMD算法对所述第二信号分量进行分解,获取二分解信...

【专利技术属性】
技术研发人员:涂宏
申请(专利权)人:平安科技深圳有限公司
类型:发明
国别省市:广东,44

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1