提高音频生成质量的方法、装置、设备及可读存储介质制造方法及图纸

技术编号:37386179 阅读:29 留言:0更新日期:2023-04-27 07:26
本发明专利技术提供了一种提高音频生成质量的方法、装置、设备及可读存储介质,涉及涉及语音转换识别技术领域,包括获取低采样率音频、目标音频采样率和音频处理模型;根据低采样率音频、目标音频采样率和音频预处理数学模型,计算得到初始高采样率音频;根据初始高采样率音频和音频信号重建数学模型,计算得到目标音频时域信号和目标音频小波系数;根据目标音频时域信号、目标音频小波系数和预设的融合音频信号数学模型,求解数学模型得到目标高采样率音频。本发明专利技术使用离散小波变换捕获音频信号的多尺度细节,通过联合音频信号的时域信息和频域信息重建高采样率音频,进一步提高了音频的总体生成质量。体生成质量。体生成质量。

【技术实现步骤摘要】
提高音频生成质量的方法、装置、设备及可读存储介质


[0001]本专利技术涉及语音转换识别

,具体而言,涉及提高音频生成质量的方法、装置、设备及可读存储介质。

技术介绍

[0002]随着人工智能技术的发展,声纹识别技术得到了广泛的应用。在银行业中,基于声纹识别技术,不仅可以对用户身份进行核验,还可以为识别欺诈申请提供支撑。在声纹识别应用中,不同信道采集的音频具有不同的采样率,例如,电话信道采集的音频的采样率是8kHz,网络信道采集的音频的采样率是16kHz。为了让声纹识别模型取得较好的效果,可以使用超分辨率重建方法将低采样率信号重建成高采样率信号,当前的提高音频生成质量的方法通常采用了短时傅里叶变换来处理音频,短时傅里叶变换的窗口长度是固定的,只能捕捉音频在某一尺度的细节,并且只使用了时域信息或频域信息中的一种,对音频信息的利用不充分。

技术实现思路

[0003]本专利技术的目的在于提供一种提高音频生成质量的方法、装置、设备及可读存储介质,以改善上述问题。为了实现上述目的,本专利技术采取的技术方案如下:
[0004]第一方面,本申请提供了提高音频生成质量的方法,包括:获取低采样率音频、目标音频采样率和音频处理模型,所述音频处理方法包括音频预处理数学模型和音频信号重建数学模型;根据所述低采样率音频、所述目标音频采样率和所述音频预处理数学模型,计算得到初始高采样率音频;根据所述初始高采样率音频和所述音频信号重建数学模型,计算得到目标音频时域信号和目标音频小波系数;根据所述目标音频时域信号、所述目标音频小波系数和预设的融合音频信号数学模型,求解所述数学模型得到目标高采样率音频
[0005]第二方面,本申请还提供了一种提高音频生成质量的装置,包括:数据采集模块,用于获取低采样率音频、目标音频采样率和音频处理模型,所述音频处理方法包括音频预处理数学模型和音频信号重建数学模型;音频处理模块,用于根据所述低采样率音频、所述目标音频采样率和所述音频预处理数学模型,计算得到初始高采样率音频;音频分析模块,用于根据所述初始高采样率音频和所述音频信号重建数学模型,计算得到目标音频时域信号和目标音频小波系数;音频重建模块,用于根据所述目标音频时域信号、所述目标音频小波系数和预设的融合音频信号数学模型,求解所述数学模型得到目标高采样率音频。
[0006]第三方面,本申请还提供了一种提高音频生成质量的设备,包括:
[0007]存储器,用于存储计算机程序;
[0008]处理器,用于执行所述计算机程序时实现所述提高音频生成质量的方法的步骤。
[0009]第四方面,本申请还提供了一种可读存储介质,所述可读存储介质上存储有计算机程序,所述计算机程序被处理器执行时实现上述基于提高音频生成质量的方法的步骤。
[0010]本专利技术的有益效果为:
[0011]本专利技术使用离散小波变换代替短时傅里叶变换,捕获音频信号的多尺度细节;本专利技术通过联合音频信号的时域信息和频域信息重建高采样率音频,以得到更好的高采样率音频信号,进一步提高了音频的总体生成质量。
[0012]本专利技术的其他特征和优点将在随后的说明书阐述,并且,部分地从说明书中变得显而易见,或者通过实施本专利技术实施例了解。本专利技术的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
[0013]为了更清楚地说明本专利技术实施例的技术方案,下面将对实施例中所需要使用的附图作简单地介绍,应当理解,以下附图仅示出了本专利技术的某些实施例,因此不应被看作是对范围的限定,对于本领域普通技术人员来讲,在不付出创造性劳动的前提下,还可以根据这些附图获得其他相关的附图。
[0014]图1为本专利技术实施例中所述的提高音频生成质量的方法流程示意图;
[0015]图2为本专利技术实施例中所述的提高音频生成质量的装置结构示意图;
[0016]图3为本专利技术实施例中所述的提高音频生成质量的设备结构示意图。
[0017]图中标记:1、数据采集模块;2、音频处理模块;21、第一计算单元;211、第一划分单元;212、第二分类单元;213、第三计算单元;22、第二计算单元;221、第一提取单元;222、第四计算单元;223、第五计算单元;3、音频分析模块;31、第六计算单元;32、第七计算单元;33、第八计算单元;4、音频重建模块;41、第九计算单元;42、第十计算单元;43、第十一计算单元;800、监测数据无损压缩设备;801、处理器;802、存储器;803、多媒体组件;804、I/O接口;805、通信组件。
具体实施方式
[0018]为使本专利技术实施例的目的、技术方案和优点更加清楚,下面将结合本专利技术实施例中的附图,对本专利技术实施例中的技术方案进行清楚、完整地描述,显然,所描述的实施例是本专利技术一部分实施例,而不是全部的实施例。通常在此处附图中描述和示出的本专利技术实施例的组件可以以各种不同的配置来布置和设计。因此,以下对在附图中提供的本专利技术的实施例的详细描述并非旨在限制要求保护的本专利技术的范围,而是仅仅表示本专利技术的选定实施例。基于本专利技术中的实施例,本领域普通技术人员在没有作出创造性劳动前提下所获得的所有其他实施例,都属于本专利技术保护的范围。
[0019]应注意到:相似的标号和字母在下面的附图中表示类似项,因此,一旦某一项在一个附图中被定义,则在随后的附图中不需要对其进行进一步定义和解释。同时,在本专利技术的描述中,术语“第一”、“第二”等仅用于区分描述,而不能理解为指示或暗示相对重要性。
[0020]实施例1:
[0021]本实施例提供了一种提高音频生成质量的方法。
[0022]参见图1,图中示出了本方法包括步骤S100、步骤S200、步骤S300、步骤S400。
[0023]S100、获取低采样率音频、目标音频采样率和音频处理模型,音频处理方法包括音频预处理数学模型和音频信号重建数学模型。
[0024]需要说明的是,在本申请中,低采样率为音频采样率等于8000赫兹,目标音频采样
率和高采样率为音频采样率等于16000赫兹。
[0025]S200、根据低采样率音频、目标音频采样率和音频预处理数学模型,计算得到初始高采样率音频。
[0026]需要说明的是,在步骤S200中,将低采样率音频通过静音切除和插值处理得到初始高采样率音频,初始高采样率音频时长和低采样率音频相同,初始高采样率音频的采样率与目标音频采样率相同(例如每1s都包含16000个采样点),这个时候得到的初始高采样率音频存在过度平滑的问题,并不能直接作为最终结果,为后续音频处理提供基础。
[0027]S300、根据初始高采样率音频和音频信号重建数学模型,计算得到目标音频时域信号和目标音频小波系数。
[0028]需要说明的是,在步骤S300中,将初始高采样率音频的时域型号提取出来,并通过计算补充音频时域信号的细节信息得到目标音频的时域信号,同时目标音频的时域信号计算得到目本文档来自技高网
...

【技术保护点】

【技术特征摘要】
1.一种提高音频生成质量的方法,其特征在于,包括:获取低采样率音频、目标音频采样率和音频处理数学模型,所述音频处理数学模型包括音频预处理数学模型和音频信号重建数学模型;根据所述低采样率音频、所述目标音频采样率和所述音频预处理数学模型,计算得到初始高采样率音频;根据所述初始高采样率音频和所述音频信号重建数学模型,计算得到目标音频时域信号和目标音频小波系数;根据所述目标音频时域信号、所述目标音频小波系数和预设的融合音频信号数学模型,求解所述数学模型得到目标高采样率音频。2.根据权利要求1所述的提高音频生成质量的方法,其特征在于,所述根据所述低采样率音频、所述目标音频采样率和所述音频预处理数学模型,计算得到初始高采样率音频,包括:根据所述低采样率音频和预设的音频静音信号切除计算公式,得到低采样率语音音频,所述低采样率语音音频为所述采样率音频删除静音片段的音频数据;根据所述低采样率音频、所述目标音频采样率、所述低采样率语音音频和预设音频插值计算公式,计算得到初始高采样率音频,所述初始高采样率音频的长度与所述低采样率音频的长度相等,所述初始高采样率音频的采样率等于所述目标音频采样率。3.根据权利要求2所述的提高音频生成质量的方法,其特征在于,所述根据所述低采样率音频和预设音频静音信号切除计算公式,计算得到低采样率语音音频,包括:根据所述低采样率音频和预设音频划分规则,将所述低采样率音频划分为至少一个低采样率音频片段;根据所述低采样率音频片段和预设音频判断模型,将所述低采样率音频片段划分为语音片段和静音片段;根据所述语音片段和预设音频组合方法,计算得到低采样率语音音频。4.根据权利要求2所述的提高音频生成质量的方法,其特征在于,所述根据所述低采样率音频、所述目标音频采样率、所述低采样率语音音频和预设音频插值计算公式,计算得到初始高采样率音频,包括:根据所述低采样率音频,提取得到低采样率音频时长;根据所述低采样率语音音频和预设音频插值计算公式,计算得到高采样率语音音频;根据所述高采样率语音音频、所述低采样率音频时长和预设的音频扩展模型,计算得到初始高采样率音频。5.根据权利要求1所述的提高音频生成质量的方法,其特征在于,所述根据所述初始高采样率音频和音频信号重建数学模型,计算得到目标音频时域信号和目标音频小波系数,包括:根据所述初始高采样率音频和预设音频时域重建数学模型,计算得到目标音频时域信号;将所述目标音频时域信号做离散小波变换得到初始小波系数;根据所述初始小波系数和预设音频小波系数重建数学模型,计算得到目标音频小波系数。
6.根据权利要求1所述的提高音频生成质量的方法,其特征在于,所述根据所述目标音频时域信号、所述目标音频小波系数和预设融合音频信号数学模型,求解所述数学模型得到目标高采样率音频,包括:将所述目标音频时域信号做离散小波变换得到初始小波系数;根据初始小波系数、目标音频小波系数和预设权重,计算得到目标音频最终小波系数;将所述目标音频最终小波系数做离散小波逆变换,计算得到目标高采样率音频。7.一种提高音频生成质量的装置,其特征在于,包括:数据采集模块,用于获取低采样率音频、目标音频采样率和音频处理模型,所述音...

【专利技术属性】
技术研发人员:冉佳陈晓铭陈文左为
申请(专利权)人:中信银行股份有限公司
类型:发明
国别省市:

网友询问留言 已有0条评论
  • 还没有人留言评论。发表了对其他浏览者有用的留言会获得科技券。

1