语音数据的处理方法、装置、电子设备及存储介质制造方法及图纸

技术编号：31711099 阅读：12 留言：0更新日期：2022-01-01 11:14

本公开提出了语音数据的处理方法、装置、电子设备及存储介质，涉及计算机技术领域，尤其涉及语音交互、深度学习、车联网和智能座舱等人工智能技术领域。其中，语音数据的处理方法，包括：获取待识别的语音数据；对所述语音数据进行解析，以获取所述语音数据中包含的N个候选语音信号，其中，N为正整数；在N大于1的情况下，获取每个所述候选语音信号对应的能量特征；根据N个所述能量特征，从N个所述候选语音信号中提取目标语音信号；对所述目标语音信号进行语音识别，以确定所述目标语音信号对应的目标文本。由此，实现了对语音数据中背景声音的滤除，从而提高了目标语音信号识别的准确性。性。性。

全部详细技术资料下载

【技术实现步骤摘要】
语音数据的处理方法、装置、电子设备及存储介质

[0001]本公开涉及计算机
，尤其涉及语音交互、深度学习等人工智能
，具体涉及一种语音数据的处理方法、装置、电子设备及存储介质。

技术介绍

[0002]随着人工智能技术的不断发展和完善，很多智能终端已经具备识别语音的能力。然而，在现实场景中，智能终端采集到的语音可能掺杂多种背景声音，进而影响对语音识别的准确性。因此，研究如何在复杂环境下提高语音识别的准确率，成为亟需解决的问题。

技术实现思路

[0003]本公开提供了一种语音数据的处理方法、装置、电子设备及存储介质。
[0004]根据本公开的第一方面，提供了一种语音数据的处理方法，包括：
[0005]获取待识别的语音数据；
[0006]对所述语音数据进行解析，以获取所述语音数据中包含的N个候选语音信号，其中，N为正整数；
[0007]在N大于1的情况下，获取每个所述候选语音信号对应的能量特征；
[0008]根据N个所述能量特征，从N个所述候选语音信号中提取目标语音信号；
[0009]对所述目标语音信号进行语音识别，以确定所述目标语音信号对应的目标文本。
[0010]根据本公开的第二方面，提供了一种语音数据的处理装置，包括：
[0011]第一获取模块，用于获取待识别的语音数据；
[0012]第二获取模块，用于对所述语音数据进行解析，以获取所述语音数据中包含的N个候选语音信号，其中，N为正整数；
[0013]第三获取模...

【技术保护点】

【技术特征摘要】
1.一种语音数据的处理方法，包括：获取待识别的语音数据；对所述语音数据进行解析，以获取所述语音数据中包含的N个候选语音信号，其中，N为正整数；在N大于1的情况下，获取每个所述候选语音信号对应的能量特征；根据N个所述能量特征，从N个所述候选语音信号中提取目标语音信号；对所述目标语音信号进行语音识别，以确定所述目标语音信号对应的目标文本。2.如权利要求1所述的方法，其中，所述对所述语音数据进行解析，以获取所述语音数据中包含的N个候选语音信号，包括：对所述语音数据进行解析，以确定所述语音数据中包含的N个声纹特征；根据所述N个声纹特征，从所述语音数据中提取N个所述候选语音信号。3.如权利要求1所述的方法，其中，所述获取每个所述候选语音信号对应的能量特征，包括：将每个所述候选语音信号划分为多个子语音信号；计算每个所述子语音信号对应的音频能量；根据每个所述候选语音信号中每个所述子语音信号对应的音频能量，确定每个所述候选语音信号的能量特征。4.如权利要求1所述的方法，其中，所述获取每个所述候选语音信号对应的能量特征，包括：将每个所述候选语音信号划分为多个子语音信号；计算每个所述子语音信号对应的音频能量；根据每个所述候选语音信号中每个所述子语音信号对应的音频能量，确定每相邻子语音信号对应的音频能量变化率；根据每个所述候选语音信号中每相邻子语音信号对应的音频能量变化率，确定每个所述候选语音信号的能量特征。5.如权利要求1
‑
4任一所述的方法，其中，在所述对所述目标语音信号进行语音识别，以确定所述目标语音信号对应的目标文本之后，还包括：对所述目标文本进行语义识别，以获取所述目标文本对应的语义；根据所述目标文本对应的语义，确定应答动作和/或应答语句。6.一种语音数据的处理装置，包括：第一获取模块，用于获取待识别的语音数据；第二获取模块，用于对所述语音数据进行解析，以获取所述语音数据中包含的N个候选语音信号，其中，N为正整数；第三获取模块，用于在N大于1的情况下，获取每个所述候选语音信号对应的能量特征；提取模块，用于根据N个所述能量特征，从N个所述候选语音信号中提取目标语音信号；第一确定模...

【专利技术属性】
技术研发人员：周毅，
申请(专利权)人：阿波罗智联北京科技有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人