提高音频生成质量的方法、装置、设备及可读存储介质制造方法及图纸

技术编号：37386179 阅读：29 留言：0更新日期：2023-04-27 07:26

本发明专利技术提供了一种提高音频生成质量的方法、装置、设备及可读存储介质，涉及涉及语音转换识别技术领域，包括获取低采样率音频、目标音频采样率和音频处理模型；根据低采样率音频、目标音频采样率和音频预处理数学模型，计算得到初始高采样率音频；根据初始高采样率音频和音频信号重建数学模型，计算得到目标音频时域信号和目标音频小波系数；根据目标音频时域信号、目标音频小波系数和预设的融合音频信号数学模型，求解数学模型得到目标高采样率音频。本发明专利技术使用离散小波变换捕获音频信号的多尺度细节，通过联合音频信号的时域信息和频域信息重建高采样率音频，进一步提高了音频的总体生成质量。体生成质量。体生成质量。

全部详细技术资料下载

【技术实现步骤摘要】
提高音频生成质量的方法、装置、设备及可读存储介质

[0001]本专利技术涉及语音转换识别

，具体而言，涉及提高音频生成质量的方法、装置、设备及可读存储介质。

技术介绍

[0002]随着人工智能技术的发展，声纹识别技术得到了广泛的应用。在银行业中，基于声纹识别技术，不仅可以对用户身份进行核验，还可以为识别欺诈申请提供支撑。在声纹识别应用中，不同信道采集的音频具有不同的采样率，例如，电话信道采集的音频的采样率是8kHz，网络信道采集的音频的采样率是16kHz。为了让声纹识别模型取得较好的效果，可以使用超分辨率重建方法将低采样率信号重建成高采样率信号，当前的提高音频生成质量的方法通常采用了短时傅里叶变换来处理音频，短时傅里叶变换的窗口长度是固定的，只能捕捉音频在某一尺度的细节，并且只使用了时域信息或频域信息中的一种，对音频信息的利用不充分。

技术实现思路

[0003]本专利技术的目的在于提供一种提高音频生成质量的方法、装置、设备及可读存储介质，以改善上述问题。为了实现上述目的，本专利技术采取的技术方案如下：
[0004]第一方面，本申请提供了提高音频生成质量的方法，包括：获取低采样率音频、目标音频采样率和音频处理模型，所述音频处理方法包括音频预处理数学模型和音频信号重建数学模型；根据所述低采样率音频、所述目标音频采样率和所述音频预处理数学模型，计算得到初始高采样率音频；根据所述初始高采样率音频和所述音频信号重建数学模型，计算得到目标音频时域信号和目标音频小波系数；根据所述目标音频时域信...

【技术保护点】

【技术特征摘要】
1.一种提高音频生成质量的方法，其特征在于，包括：获取低采样率音频、目标音频采样率和音频处理数学模型，所述音频处理数学模型包括音频预处理数学模型和音频信号重建数学模型；根据所述低采样率音频、所述目标音频采样率和所述音频预处理数学模型，计算得到初始高采样率音频；根据所述初始高采样率音频和所述音频信号重建数学模型，计算得到目标音频时域信号和目标音频小波系数；根据所述目标音频时域信号、所述目标音频小波系数和预设的融合音频信号数学模型，求解所述数学模型得到目标高采样率音频。2.根据权利要求1所述的提高音频生成质量的方法，其特征在于,所述根据所述低采样率音频、所述目标音频采样率和所述音频预处理数学模型，计算得到初始高采样率音频，包括：根据所述低采样率音频和预设的音频静音信号切除计算公式，得到低采样率语音音频，所述低采样率语音音频为所述采样率音频删除静音片段的音频数据；根据所述低采样率音频、所述目标音频采样率、所述低采样率语音音频和预设音频插值计算公式，计算得到初始高采样率音频，所述初始高采样率音频的长度与所述低采样率音频的长度相等，所述初始高采样率音频的采样率等于所述目标音频采样率。3.根据权利要求2所述的提高音频生成质量的方法，其特征在于,所述根据所述低采样率音频和预设音频静音信号切除计算公式，计算得到低采样率语音音频，包括：根据所述低采样率音频和预设音频划分规则，将所述低采样率音频划分为至少一个低采样率音频片段；根据所述低采样率音频片段和预设音频判断模型，将所述低采样率音频片段划分为语音片段和静音片段；根据所述语音片段和预设音频组合方法，计算得到低采样率语音音频。4.根据权利要求2所述的提高音频生成质量的方法，其特征在于,所述根据所述低采样率音频、所述目标音频采样率、所述低采样率语音音频和预设音频插值计算公式，计算得到初始高采样率音频，包括：根据所述低采样率音频，提取得到低采样率音频时长；根据所述低采样率语音音频和预设音频插值计算公式，计算得到高采样率语音音频；根据所述高采样率语音音频、所述低采样率音频时长和预设的音频扩展模型，计算得到初始高采样率音频。5.根据权利要求1所述的提高音频生成质量的方法，其特征在于,所述根据所述初始高采样率音频和音频信号重建数学模型，计算得到目标音频时域信号和目标音频小波系数，包括：根据所述初始高采样率音频和预设音频时域重建数学模型，计算得到目标音频时域信号；将所述目标音频时域信号做离散小波变换得到初始小波系数；根据所述初始小波系数和预设音频小波系数重建数学模型，计算得到目标音频小波系数。
6.根据权利要求1所述的提高音频生成质量的方法，其特征在于,所述根据所述目标音频时域信号、所述目标音频小波系数和预设融合音频信号数学模型，求解所述数学模型得到目标高采样率音频，包括：将所述目标音频时域信号做离散小波变换得到初始小波系数；根据初始小波系数、目标音频小波系数和预设权重，计算得到目标音频最终小波系数；将所述目标音频最终小波系数做离散小波逆变换，计算得到目标高采样率音频。7.一种提高音频生成质量的装置，其特征在于，包括：数据采集模块，用于获取低采样率音频、目标音频采样率和音频处理模型，所述音...

【专利技术属性】
技术研发人员：冉佳，陈晓铭，陈文，左为，
申请(专利权)人：中信银行股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人