语音数据的获取方法和装置制造方法及图纸

技术编号：26602186 阅读：51 留言：0更新日期：2020-12-04 21:25

本申请公开了语音数据的获取方法和装置，涉及深度学习技术领域和语音识别技术领域。具体实现方案为：响应于语音还原指令，获取与语音还原指令对应的压缩语音数据；获取与压缩语音数据对应的压缩倍数和下采样频率；根据压缩倍数对压缩语音数据解压缩，获取解压语音数据；计算与下采样频率对应的上采样频率，并根据上采样频率对解压语音数据上采样，获取与压缩语音数据对应的目标语音数据。由此，实现了低算力的语音数据还原，便于对语音数据的追溯。

全部详细技术资料下载

【技术实现步骤摘要】
语音数据的获取方法和装置
本申请涉及深度学习
和语音识别
，尤其涉及一种语音数据的获取方法和装置。
技术介绍
随着计算机技术的发展，基于语音的识别技术也越发成熟，相关技术中，获取到语音数据后，基于语音数据提取语音特征，根据语音特征来进行语音控制指令的识别。然而，在实际应用中，例如获取语音数据的蓝牙耳机由于蓝牙芯片传输能力差，语音识别指令不准确等场景下，需要对获取到的语音指令进行追溯，而现有技术中缺少一种可以对语音数据还原的方式。
技术实现思路
本公开提供了一种语音数据的获取方法和装置，以解决现有技术中，语音数据无法追溯的技术问题。根据本公开的一方面，提供了一种语音数据的获取方法，包括：响应于语音还原指令，获取与所述语音还原指令对应的压缩语音数据；获取与所述压缩语音数据对应的压缩倍数和下采样频率；根据所述压缩倍数对所述压缩语音数据解压缩，获取解压语音数据；确定与所述下采样频率对应的上采样频率，并根据所述上采样频率对所述解压语音数据上采样，以获取与所述压缩语音数据对应的目标语音数据...

【技术保护点】
1.一种语音数据的获取方法，包括：/n响应于语音还原指令，获取与所述语音还原指令对应的压缩语音数据；/n获取与所述压缩语音数据对应的压缩倍数和下采样频率；/n根据所述压缩倍数对所述压缩语音数据解压缩，获取解压语音数据；/n确定与所述下采样频率对应的上采样频率，并根据所述上采样频率对所述解压语音数据上采样，以获取与所述压缩语音数据对应的目标语音数据。/n

【技术特征摘要】
1.一种语音数据的获取方法，包括：
响应于语音还原指令，获取与所述语音还原指令对应的压缩语音数据；
获取与所述压缩语音数据对应的压缩倍数和下采样频率；
根据所述压缩倍数对所述压缩语音数据解压缩，获取解压语音数据；
确定与所述下采样频率对应的上采样频率，并根据所述上采样频率对所述解压语音数据上采样，以获取与所述压缩语音数据对应的目标语音数据。

2.如权利要求1所述的方法，其中，所述获取与所述压缩语音数据对应的压缩倍数和下采样频率，包括：
提取所述压缩语音数据中每个采样点的采样时间点和幅度的压缩数据；
获取与所述每个采样点的幅度的原始数据；
计算所述每个采样点的所述幅度的原始数据和所述幅度的压缩数据的比值，获取所述压缩倍数；
计算相邻采样点的采样时间点的时间间隔，获取所述采样频率。

3.如权利要求1所述的方法，在所述获取与所述语音还原指令对应的压缩语音数据之前，还包括：
响应于采集到的语音数据，提取所述语音数据中属于预设频段的所述目标语音数据；
根据所述下采样频率对所述目标语音数据下采样，获取下采样语音数据；
根据预设的压缩策略对所述下采样语音数据压缩，获取所述压缩语音数据。

4.如权利要求3所述的方法，所述提取所述语音数据中属于预设频段的所述目标语音数据，包括：
获取与所述预设频段对应的第一滤波阶数和截止频率；
根据所述第一滤波阶数和所述截止频率设置第一低通滤波器，并根据所述第一低通滤波器对所述语音数据滤波获取所述目标语音数据。

5.如权利要求3所述的方法，其中，所述根据预设的压缩策略对所述下采样语音数据压缩，获取所述压缩语音数据，包括：
根据预设时长间隔将所述下采样语音数据划分为多个语音数据段；
在所述多个语音数据段中，确定与所述多个语音数据段中每个语音数据段对应的n个参考语音数据段，其中，n为大于等于1的自然数；
获取所述每个语音数据段和与所述每个语音数据段对应的n个参考语音数据段中包含的所有采样点的幅度值，根据所述所有采样点的幅度值确定基准幅度值；
根据预设的算法对所述基准幅度值和所述每个语音数据段中每个采样点的幅度值计算，获取与所述每个语音数据段中每个采样点的幅度的压缩数据；
根据所述幅度的压缩数据对所述每个语音数据段中每个采样点压缩，生成所述下采样语音数据压缩。

6.如权利要求5所述的方法，其中，所述根据所述所有采样点的幅度值确定基准幅度值，包括：
获取所述每个语音数据段中所有采样点的第一幅度值；
获取所述n个参考语音数据段中所有采样点的第二幅度值；
将所述第一幅度值和所述第二幅度值中的最大值，确定为所述基准幅度值。

7.如权利要求4所述的方法，其中，所述获取与所述压缩语音数据对应的目标语音数据，包括：
将所述上采样后的语音数据输入第二低通滤波器获取所述目标语音数据，所述第二低通滤波器的截止频率与所述第一低通滤波器的截止频率相同。

8.一种语音数据的获取装置，包括：
第一获取模块，用于响应于语音还原指令，获取与所述语音还原指令对应的压缩语音数据；
第二获取模块，用于获取与所述压缩语音数据对应的压缩倍数和下采样频率；
第三获取模块，用于根据所述压缩...

【专利技术属性】
技术研发人员：田超，
申请(专利权)人：北京百度网讯科技有限公司，
类型：发明
国别省市：北京;11

全部详细技术资料下载我是这个专利的主人