语音数据处理方法、装置及电子设备制造方法及图纸

技术编号：36683403 阅读：29 留言：0更新日期：2023-02-27 19:43

本申请实施例提供了一种语音数据处理方法、装置、电子设备及计算机可读存储介质，涉及语音识别技术领域。该方法包括：通过接收第一语音，基于语音识别模型，对所述第一语音进行语音识别，确定所述第一语音对应的识别信息；根据所述识别信息，执行所述第一语音对应的处理操作。由于语音识别模型为基于目标样本语音进行训练得到的，所述目标样本语音为对初始样本语音进行语音检测得到的，这样，得到的目标样本语音的语音质量较高，从而使得基于该目标样本语音训练的语音识别模型的语音识别精度较高，提升了语音识别的准确度。提升了语音识别的准确度。提升了语音识别的准确度。

全部详细技术资料下载

【技术实现步骤摘要】
语音数据处理方法、装置及电子设备

[0001]本申请涉及语音识别
，具体而言，本申请涉及一种语音数据处理方法、装置、电子设备及计算机可读存储介质。

技术介绍

[0002]目前，人工智能技术已被广泛应用于语音处理的多种应用场景，例如，人工智能技术可以应用于语音唤醒、语音识别、语音合成等应用场景。其中，在上述应用场景的处理中，通常需要语音识别模型来进行语音信息的识别，然而，目前，语音识别模型识别精度仍然较低，容易出现识别错误或识别失败等情况，给用户带来不便。

技术实现思路

[0003]本申请的目的旨在至少能解决上述的技术缺陷之一，特别是语音识别模型的语音识别精度较低，导致语音识别的准确度较低的技术缺陷。
[0004]根据本申请的一个方面，提供了一种语音数据处理方法，该方法包括：接收第一语音；
[0005]基于语音识别模型，对所述第一语音进行语音识别，确定所述第一语音对应的识别信息；其中，所述语音识别模型为基于样本语音数据库中的目标样本语音进行训练得到的，所述目标样本语音为对初始样本语音进行语...

【技术保护点】

【技术特征摘要】
1.一种语音数据处理方法，其特征在于，包括：接收第一语音；基于语音识别模型，对所述第一语音进行语音识别，确定所述第一语音对应的识别信息；其中，所述语音识别模型为基于样本语音数据库中的目标样本语音进行训练得到的，所述目标样本语音为对初始样本语音进行语音检测得到的；其中，所述语音检测包括：语速检测、关键词频次检测以及留白检测中的至少一种；根据所述识别信息，执行所述第一语音对应的处理操作。2.根据权利要求1所述的语音数据处理方法，其特征在于，所述对所述第一语音进行语音识别之前，所述方法还包括：接收所述初始样本语音；对所述初始样本语音进行所述语音检测，根据所述语音检测的检测结果，筛选满足预设样本要求的所述初始样本语音作为目标样本语音。3.根据权利要求2所述的语音数据处理方法，其特征在于，所述对所述初始样本语音进行所述语音检测，包括：将所述初始样本语音分割成多个语音帧，确定所述语音帧中的有效语音帧；筛选连续的有效语音帧的帧数量大于预设数量的语段作为有效语段；对包括所述有效语段的所述初始样本语音进行所述语音检测。4.根据权利要求3所述的语音数据处理方法，其特征在于，所述确定所述语音帧中的有效语音帧，包括：提取所述语音帧的声学特征；确定所述语音帧的声学特征符合预设特征条件的情况下，确定所述语音帧为所述有效语音帧。5.根据权利要求3所述的语音数据处理方法，其特征在于，在所述语音检测包括留白检测的情况下，所述对所述初始样本语音进行所述语音检测，包括：确定相邻的所述有效语段之间的间隔时长；确定所述间隔时长是否在第一标准时长范围之内。6.根据权利要求3所述的语音数据处理方法，其特征在于，在所述语音检测包括语速检测的情况下，所述对所述初始样本语音进行所述语音检测，包括：将所述有效语段的语段时长与第二标准时长范围进行比较，确定所述语段时长是否在所述第二标准时长范围之内。7.根据权利要求3所述的语音数据处理方法，其特征在于，在所述语音检测包括关键词频次检测的情况下，所述对所述初始样本语音进行所述语音检测，包括：对所述有效语段进行语音识别，确定所述有效语段中是否包含目标关键词，以及包含所述目标关键词的有效语段的...

【专利技术属性】
技术研发人员：王炳乾，刘童，
申请(专利权)人：京东方科技集团股份有限公司，
类型：发明
国别省市：

全部详细技术资料下载我是这个专利的主人