音频数据的存储方法、装置、终端及存储介质制造方法及图纸

技术编号：25805996 阅读：30 留言：0更新日期：2020-09-29 18:40

本申请实施例公开了一种音频数据的存储方法、装置、终端及存储介质，属于终端技术领域。该方法包括：获取通过麦克风采集的音频数据；通过k级语音唤醒识别模型对音频数据进行识别，得到各级语音唤醒识别模型对应的识别结果，其中，不同级别的语音唤醒识别模型对应不同识别维度，识别结果用于表征音频数据在对应识别维度上的识别通过情况，k为大于等于2的整数；根据识别结果将音频数据存储至第一存储区域，第一存储区域用于存储通过至少一级语音唤醒识别模型的音频数据。可以准确定位出唤醒失败原因，即在哪一级识别维度失败，从而有利于对唤醒失败原因进行准确分析和优化，进而提高了语音唤醒场景下的唤醒率。

全部详细技术资料下载

【技术实现步骤摘要】
音频数据的存储方法、装置、终端及存储介质
本申请实施例涉及终端
，特别涉及一种音频数据的存储方法、装置、终端及存储介质。
技术介绍
随着智能设备应用越来越广泛，比如，智能手机、智能音箱和智能电视等，为了便于用户对智能设备的使用，通常会在智能设备中引入语音唤醒技术。相关技术中，在智能设备出厂之前，一般会进行语音唤醒功能测试，以保证语音唤醒功能的唤醒率，但是语音唤醒功能会受到智能设备的使用环境、使用用户差异的影响，因此，导致用户在使用具有语音唤醒功能的智能设备时，通常会出现语音唤醒失败的情况，而相关技术中，智能设备厂商无法准确定位出语音唤醒失败的原因，从而降低了语音唤醒功能的唤醒率。
技术实现思路
本申请实施例提供了一种音频数据的存储方法、装置、终端及存储介质。所述技术方案如下：一方面，本申请实施例提供了一种音频数据的存储方法，所述方法包括：获取通过麦克风采集的音频数据；通过k级语音唤醒识别模型对所述音频数据进行识别，得到各级所述语音唤醒识别模型对应的识别结果，其中，不同级别的语音唤醒识别模型对应不同识别维度，所述识别结果用于表征所述音频数据在对应识别维度上的识别通过情况，k为大于等于2的整数；根据所述识别结果将所述音频数据存储至第一存储区域，所述第一存储区域用于存储通过至少一级语音唤醒识别模型的音频数据。另一方面，本申请实施例提供了一种音频数据的存储装置，所述装置包括：获取模块，用于获取通过麦克风采集的音频数据；识别模块，...

【技术保护点】
1.一种音频数据的存储方法，其特征在于，所述方法包括：/n获取通过麦克风采集的音频数据；/n通过k级语音唤醒识别模型对所述音频数据进行识别，得到各级所述语音唤醒识别模型对应的识别结果，其中，不同级别的语音唤醒识别模型对应不同识别维度，所述识别结果用于表征所述音频数据在对应识别维度上的识别通过情况，k为大于等于2的整数；/n根据所述识别结果将所述音频数据存储至第一存储区域，所述第一存储区域用于存储通过至少一级语音唤醒识别模型的音频数据。/n

【技术特征摘要】
1.一种音频数据的存储方法，其特征在于，所述方法包括：
获取通过麦克风采集的音频数据；
通过k级语音唤醒识别模型对所述音频数据进行识别，得到各级所述语音唤醒识别模型对应的识别结果，其中，不同级别的语音唤醒识别模型对应不同识别维度，所述识别结果用于表征所述音频数据在对应识别维度上的识别通过情况，k为大于等于2的整数；
根据所述识别结果将所述音频数据存储至第一存储区域，所述第一存储区域用于存储通过至少一级语音唤醒识别模型的音频数据。

2.根据权利要求1所述的方法，其特征在于，所述根据所述识别结果将所述音频数据存储至第一存储区域，包括：
根据所述识别结果以及唤醒词对所述音频数据进行命名；
将命名后的所述音频数据存储至所述第一存储区域。

3.根据权利要求2所述的方法，其特征在于，所述通过k级语音唤醒识别模型对所述音频数据进行识别，得到各级所述语音唤醒识别模型对应的识别结果，包括：
通过第n级语音唤醒识别模型对所述音频数据进行第n级识别，得到第n识别结果，n为小于k的正整数；
响应于所述第n识别结果表征所述音频数据通过第n级识别，通过第n+1级语音唤醒识别模型对所述音频数据进行第n+1级识别，得到第n+1识别结果；
所述根据所述识别结果以及唤醒词对所述音频数据进行命名，包括：
响应于所述第n识别结果表征所述音频数据通过第n级识别，且所述第n+1识别结果表征所述音频数据未通过第n+1级识别，根据所述第n级语音唤醒识别模型的模型标识以及所述唤醒词对所述音频数据进行命名；
或者，
响应于第k识别结果表征所述音频数据通过第k级识别，根据所述第k级语音唤醒识别模型的模型标识以及所述唤醒词对所述音频数据进行命名。

4.根据权利要求3所述的方法，其特征在于，所述k级语音唤醒识别模型包括第一级语音唤醒识别模型、第二级语音唤醒识别模型和第三级语音唤醒识别模型；
所述通过第n级语音唤醒识别模型对所述音频数据进行第n级识别，得到第n识别结果，包括：
通过所述第一级语音唤醒识别模型对所述音频数据进行第一级识别，得到第一识别结果，所述第一识别结果用于表征所述音频数据中是否包含关键词，所述关键词为所述唤醒词的一部分；
或，
通过所述第二级语音唤醒识别模型对所述音频数据进行第二级识别，得到第二识别结果，所述第二识别结果用于表征所述音频数据中是否包含所述唤醒词；
所述通过第n+1级语音唤醒识别模型对所述音频数据进行第n+1级识别，包括：
通过所述第三级语音唤醒识别模型对所述音频数据进行第三级识别，得到第三识别结果，所述第三识别结果用于表征所述音频数据的声纹特征与目标声纹特征是否匹配。

5.根据权利要求4所述的方法，其特征在于，
所述第一级语音唤醒识别模型在数字信号处理器DSP上运行，所述第二级语音唤醒识别模型和所述第三级语音唤醒识别模型在中央处理器CPU上运行；
所述第一级语音...

【专利技术属性】
技术研发人员：陈喆，
申请(专利权)人：OPPO广东移动通信有限公司，
类型：发明
国别省市：广东;44

全部详细技术资料下载我是这个专利的主人