语音数据的识别方法、装置、芯片及电子设备制造方法及图纸

技术编号：37959935 阅读：8 留言：0更新日期：2023-06-30 09:34

本申请实施例公开了一种语音数据的识别方法，包括：对原始语音数据进行说话人标识提取，得到原始语音数据的目标用户的声音标识，在目标用户的声音标识已注册至本地的情形下，将原始语音数据和目标用户的声音标识输入至预先训练好的说话人语音提取模型中，得到目标用户对应的目标语音数据，对目标语音数据进行语音识别，得到目标语音数据的识别结果。本申请实施例还同时提供了一种语音数据的识别装置、芯片及电子设备。芯片及电子设备。芯片及电子设备。

全部详细技术资料下载

【技术实现步骤摘要】
语音数据的识别方法、装置、芯片及电子设备

[0001]本申请涉及语音数据的识别技术，尤其涉及一种语音数据的识别方法、装置、芯片及电子设备。

技术介绍

[0002]随着科技水平的提高，各种先进的技术让我们的生活更加智能化，特别是在语音唤醒的各种场景下，比如智能音箱、终端的语音助手等设备。
[0003]相关技术中，主要是对给定的语音数据中的关键词进行识别，设备在没有外界语音的情况下，处于一种低功率的监听状态，当接收到语音数据为唤醒语句时，设备被唤醒后，唤醒之后然后才能进行交互工作，然而，这些语音唤醒设备在干净的环境下，能够保持较好的唤醒率，而且要求说话人的语音足够干净。
[0004]目前，基于关键词的语音唤醒技术，对于干净稳定的环境下能够有较好的唤醒率，但对于环境存在较大噪声的情况或者多个说话人的情况下，误唤醒率大大增加，同样地，当终端设备被语音唤醒后，对于嘈杂环境下或者多个说话人的情况下，语音对话持续性不强，识别率降低；由此可以看出，现有的对语音数据的识别方法所得到的识别结果存在准确率低下的技术问题。

技术实现思路

[0005]本申请实施例提供一种语音数据的识别方法、装置、芯片及电子设备，能够提高对语音数据的识别方法所得到的识别结果的准确性。
[0006]本申请的技术方案是这样实现的：
[0007]第一方面，本申请实施例提供了一种语音数据的识别方法，包括：
[0008]对原始语音数据进行说话人标识提取，得到所述原始语音数据的目标用户的声音标识；
[0009...

【技术保护点】

【技术特征摘要】
1.一种语音数据的识别方法，其特征在于，包括：对原始语音数据进行说话人标识提取，得到所述原始语音数据的目标用户的声音标识；在所述目标用户的声音标识已注册至本地的情形下，将所述原始语音数据和所述目标用户的声音标识输入至预先训练好的说话人语音提取模型中，得到所述目标用户对应的目标语音数据；对所述目标语音数据进行语音识别，得到所述目标语音数据的识别结果。2.根据权利要求1所述的方法，其特征在于，所述方法还包括：获取所述目标用户的语音数据；对所述目标用户的语音数据进行说话人标识提取，得到所述目标用户的声音标识；将所述目标用户的声音标识注册至本地。3.根据权利要求2所述的方法，其特征在于，所述获取所述目标用户的语音数据，包括：获取所述目标用户的第一语音数据和所述目标用户的第二语音数据；对所述第一语音数据和所述第二语音数据进行加权求和，得到所述目标用户的语音数据。4.根据权利要求1所述的方法，其特征在于，所述方法还包括：获取所述目标用户的语音数据；对所述目标用户的语音数据进行说话人标识提取，得到所述目标用户的当前声音标识；当所述目标用户的声音标识已注册至本地时，将已注册至本地的所述目标用户的声音标识删除，将所述目标用户的当前声音标识注册至本地。5.根据权利要求1所述的方法，其特征在于，所述方法还包括：从采集到的样本数据集中获取训练数据集；其中，所述样本数据集为：混合语音的相关数据和所述混合语音的相关数据对应的用户的语音数据，所述混合语音的相关数据包括：混合语音数据和所述混合语音数据中用户的声音标识；将所述训练数据集输入至预设的说话人语音提取模型中进行训练，得到训练后的说话人语音提取模型；基于所述训练后的说话人语音提取模型，确定所述训练好的说话人语音提取模型。6.根据权利要求5所述的方法，其特征在于，所述基于所述训练后的说话人语音提取模型，确定所述训练好的说话人语音提取模型，包括：从所述样本数据集中获取验证数据集；将所述验证数据集中的混合语音的相关数据输入至训练好的说话人语音提取模型中，得到所述混合语音的相关数据对应的用户的语音数据集；当得到的所述混合语音的相关数据对应的用户的语音数据与所述验证数据集中混合语音的相关数据对应的用户的语音数据相同时，将所述训练后的说话人语音提取模型，确定为所述训练好的说话人语音提取模型；当得到的所...

【专利技术属性】
技术研发人员：杨毅，
申请(专利权)人：哲库科技上海有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人