语音处理的方法、装置、电子设备及计算机可读存储介质制造方法及图纸

技术编号：37455467 阅读：12 留言：0更新日期：2023-05-06 09:27

本申请属于语音处理技术领域，公开了语音处理的方法、装置、电子设备及计算机可读存储介质，该方法包括，对待处理语音数据进行短时傅里叶变换，获得时频域特征；对时频域特征进行划分处理，获得多个初始时频域子带；对各初始时频域子带进行降噪处理，获得多个降噪时频域子带；基于各降噪时频域子带，生成目标语音数据。这样，通过子带划分，降低了语音降噪处理耗费的计算资源。耗费的计算资源。耗费的计算资源。

全部详细技术资料下载

【技术实现步骤摘要】
语音处理的方法、装置、电子设备及计算机可读存储介质

[0001]本申请涉及语音处理
，具体而言，涉及语音处理的方法、装置、电子设备及计算机可读存储介质。

技术介绍

[0002]在一些语音处理的场景中，通常需要过滤语音数据中的噪声。如，在基于无线蓝牙耳机的语音通话场景下，当无线蓝牙耳机处于嘈杂的环境中时，通话质量往往被严重影响，因此，通常需要对通话的语音数据进行去噪，以提高通话质量。
[0003]现有技术下，通常采用神经网络对语音数据进行降噪处理，获得降噪后的语音数据。但是，采用这种方式，网络结构较大，参数较多，会耗费大量的计算资源。

技术实现思路

[0004]本申请实施例的目的在于提供语音处理的方法、装置、电子设备及计算机可读存储介质，用以在进行语音处理时，降低耗费的计算资源。
[0005]一方面，提供一种语音处理的方法，包括：
[0006]对待处理语音数据进行短时傅里叶变换，获得时频域特征；
[0007]对时频域特征进行划分处理，获得多个初始时频域子带；
[0008]对各初始时频域子带进行降噪处理，获得多个降噪时频域子带；
[0009]基于各降噪时频域子带，生成目标语音数据。
[0010]一种实施方式中，所述对时频域特征进行划分处理，获得多个初始时频域子带，包括：
[0011]将所述时频域特征进行梅尔尺度转换，获得转换后的时频域特征；
[0012]将所述转换后的时频域特征，进行子带划分，获得划分出的多个初始时频域子带。r/>[0013]一种实施方式中，所述对各初始时频域子带进行降噪处理，获得多个降噪时频域子带，包括：
[0014]将所述待处理语音数据的前一帧语音数据的降噪结果，以及将各初始时频域子带，输入降噪模型，获得降噪处理后的各降噪时频域子带；
[0015]其中，所述降噪模型是基于循环网络构建的，所述降噪结果是基于所述降噪模型对所述前一帧语音数据进行降噪处理获得的。
[0016]一种实施方式中，在对各初始时频域子带进行降噪处理，获得多个降噪时频域子带之前，所述方法还包括：
[0017]对各初始时频域子带分别进行二维卷积，获得卷积处理后的各初始时频域子带。
[0018]一种实施方式中，所述基于各降噪时频域子带，生成目标语音数据，包括：
[0019]将各降噪时频域子带进行反卷积处理，获得增强时频域特征；
[0020]将所述增强时频域特征进行逆傅里叶变换，获得所述目标语音数据。
[0021]一方面，提供一种语音处理的装置，包括：
[0022]变换单元，用于对待处理语音数据进行短时傅里叶变换，获得时频域特征；
[0023]划分单元，用于对时频域特征进行划分处理，获得多个初始时频域子带；
[0024]降噪单元，用于对各初始时频域子带进行降噪处理，获得多个降噪时频域子带；
[0025]生成单元，用于基于各降噪时频域子带，生成目标语音数据。
[0026]一种实施方式中，所述划分单元用于：
[0027]将所述时频域特征进行梅尔尺度转换，获得转换后的时频域特征；
[0028]将所述转换后的时频域特征，进行子带划分，获得划分出的多个初始时频域子带。
[0029]一种实施方式中，所述降噪单元用于：
[0030]将所述待处理语音数据的前一帧语音数据的降噪结果，以及将各初始时频域子带，输入降噪模型，获得降噪处理后的各降噪时频域子带；
[0031]其中，所述降噪模型是基于循环网络构建的，所述降噪结果是基于所述降噪模型对所述前一帧语音数据进行降噪处理获得的。
[0032]一种实施方式中，所述降噪单元还用于：
[0033]对各初始时频域子带分别进行二维卷积，获得卷积处理后的各初始时频域子带。
[0034]一种实施方式中，所述生成单元用于：
[0035]将各降噪时频域子带进行反卷积处理，获得增强时频域特征；
[0036]将所述增强时频域特征进行逆傅里叶变换，获得所述目标语音数据。
[0037]一方面，提供了一种电子设备，包括处理器以及存储器，存储器存储有计算机可读取指令，当计算机可读取指令由处理器执行时，运行如上述任一种语音处理的各种可选实现方式中提供的方法的步骤。
[0038]一方面，提供了一种计算机可读存储介质，其上存储有计算机程序，计算机程序被处理器执行时运行如上述任一种语音处理的各种可选实现方式中提供的方法的步骤。
[0039]一方面，提供了一种计算机程序产品，计算机程序产品在计算机上运行时，使得计算机执行如上述任一种语音处理的各种可选实现方式中提供的方法的步骤。
[0040]本申请实施例提供的语音处理的方法、装置、电子设备及计算机可读存储介质中，对待处理语音数据进行短时傅里叶变换，获得时频域特征；对时频域特征进行划分处理，获得多个初始时频域子带；对各初始时频域子带进行降噪处理，获得多个降噪时频域子带；基于各降噪时频域子带，生成目标语音数据。这样，通过子带划分，降低了语音降噪处理耗费的计算资源。
[0041]本申请的其它特征和优点将在随后的说明书中阐述，并且，部分地从说明书中变得显而易见，或者通过实施本申请而了解。本申请的目的和其他优点可通过在所写的说明书、权利要求书、以及附图中所特别指出的结构来实现和获得。
附图说明
[0042]为了更清楚地说明本申请实施例的技术方案，下面将对本申请实施例中所需要使用的附图作简单地介绍，应当理解，以下附图仅示出了本申请的某些实施例，因此不应被看作是对范围的限定，对于本领域普通技术人员来讲，在不付出创造性劳动的前提下，还可以根据这些附图获得其他相关的附图。
[0043]图1为本申请实施例提供的一种语音处理的方法的流程图；
[0044]图2为本申请实施例提供的一种语音处理的方法的详细流程图；
[0045]图3为本申请实施例提供的一种语音处理的装置的结构框图；
[0046]图4为本申请实施例提供的一种电子设备的结构示意图。
具体实施方式
[0047]下面将结合本申请实施例中附图，对本申请实施例中的技术方案进行清楚、完整地描述，显然，所描述的实施例仅仅是本申请一部分实施例，而不是全部的实施例。通常在此处附图中描述和示出的本申请实施例的组件可以以各种不同的配置来布置和设计。因此，以下对在附图中提供的本申请的实施例的详细描述并非旨在限制要求保护的本申请的范围，而是仅仅表示本申请的选定实施例。基于本申请的实施例，本领域技术人员在没有做出创造性劳动的前提下所获得的所有其他实施例，都属于本申请保护的范围。
[0048]首先对本申请实施例中涉及的部分用语进行说明，以便于本领域技术人员理解。
[0049]终端设备：可以是移动终端、固定终端或便携式终端，例如移动手机、站点、单元、设备、多媒体计算机、多媒体平板、互联网节点、通信器、台式计算机、膝上型计算机、笔记本本文档来自技高网...

【技术保护点】

【技术特征摘要】
1.一种语音处理的方法，其特征在于，包括：对待处理语音数据进行短时傅里叶变换，获得时频域特征；对时频域特征进行划分处理，获得多个初始时频域子带；对各初始时频域子带进行降噪处理，获得多个降噪时频域子带；基于各降噪时频域子带，生成目标语音数据。2.如权利要求1所述的方法，其特征在于，所述对时频域特征进行划分处理，获得多个初始时频域子带，包括：将所述时频域特征进行梅尔尺度转换，获得转换后的时频域特征；将所述转换后的时频域特征，进行子带划分，获得划分出的多个初始时频域子带。3.如权利要求1所述的方法，其特征在于，所述对各初始时频域子带进行降噪处理，获得多个降噪时频域子带，包括：将所述待处理语音数据的前一帧语音数据的降噪结果，以及将各初始时频域子带，输入降噪模型，获得降噪处理后的各降噪时频域子带；其中，所述降噪模型是基于循环网络构建的，所述降噪结果是基于所述降噪模型对所述前一帧语音数据进行降噪处理获得的。4.如权利要求1
‑
3任一项所述的方法，其特征在于，在对各初始时频域子带进行降噪处理，获得多个降噪时频域子带之前，所述方法还包括：对各初始时频域子带分别进行二维卷积，获得卷积处理后的各初始时频域子带。5.如权利要求4所述的方法，其特征在于，所述基于各降噪时频域子带，生成目标语音数据，包括：将各降噪时频域子带进行反卷积处理，获得增强时频域特征；将所述增强时频域特征进行逆傅里叶变换，获得所述目标语音数据。6.一种语音处理的装置，其特征在于，包括：变换单元，用于对待处理语音数据进行短时傅里叶变换，获得时频域特征；划分单元，用于对时...

【专利技术属性】
技术研发人员：陈锦明，李倩，
申请(专利权)人：恒玄科技上海股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人